python 爬虫 自动登录人人网
2015-03-25 21:23
302 查看
简单的python的爬虫,已经看了一周了,里面还是有一些细节搞不懂,最近连做梦都在post数据,想想真是醉了,我的目标是进入学校的教务系统,可能对有些人来说可能轻而易举,但是对我来说也算是一个很大的挑战了,尤其是教务系统登录页面的验证码,看了几天也没搞懂,算了,还是慢慢研究吧,最近想开始试试写简历了,学长一个劲的要求一定要写项目经验,这才意识到不懂做项目其实也挺可悲的,不过我还有一年,真该为就业想想了,加油了,先贴一个进入人人网的代码!代码只写了进入人人网,并获取页面内容,至于获取之后想怎么玩,那就要看你想做什么了,利用正则表达式处理就行了!
#coding:utf-8 import urllib2 import urllib import cookielib import re def renrenBrower(url,user,password): #登陆页面,可以通过抓包工具分析获得,如fiddler,wireshark login_page = "http://www.renren.com/PLogin.do" try: #获得一个cookieJar实例 cj = cookielib.CookieJar() #cookieJar作为参数,获得一个opener的实例 opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) #伪装成一个正常的浏览器,避免有些web服务器拒绝访问。此处伪装的火狐 opener.addheaders = [('User-agent','Mozilla/5.0 (Windows NT 6.3; WOW64; rv:36.0) Gecko/20100101 Firefox/36.0')] #生成Post数据,含有登陆用户名密码。 data = urllib.urlencode({"email":user,"password":password}) #以post的方法访问登陆页面,访问之后cookieJar会自定保存cookie opener.open(login_page,data) #以带cookie的方式访问页面 op=opener.open(url) #读取页面源码 data= op.read() return data #异常处理 except Exception,e: print str(e) #访问某用户的个人主页,其实这已经实现了人人网的签到功能。 html = renrenBrower("http://www.renren.com/home",'************','********') print html倒数第二行的*****处,分别是人人网的账号和密码!
相关文章推荐
- python实现自动登录人人网并采集信息的方法
- Python爬虫实现自动登录、签到
- python爬虫之cookie方式自动登录巴比特网
- python实现自动登录人人网并采集信息的方法
- python爬虫自动登录武汉大学校园网
- python爬虫之自动登录与验证码识别
- python爬虫 利用cookie登录人人网
- 人人网自动登录脚本_python
- Python爬虫之自动登录与验证码识别
- Python爬虫之自动登录与验证码识别
- python应用之自动登录人人网,并访问最近来访者
- [Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
- Python爬虫之自动登录与验证码识别
- python实现人人网的自动登录
- 【转】【Python】Python3爬虫实现自动登录、签到
- Python3.x爬虫教程:爬网页、爬图片、自动登录
- python网络爬虫之使用scrapy自动登录网站
- Python爬虫 Selenium实现自动登录163邮箱和Locating Elements介绍
- [Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
- Python3.x爬虫教程:爬网页、爬图片、自动登录