模拟登陆豆瓣获取cookie入mongo库!
2017-07-28 11:09
302 查看
from lxml import etree # 使用是xpath找到他的验证码 import requests # 使用requests获取的是它的页面信息 import pymongo # 入库mongo
定义变来那个用来获取session
session = requests.Session()
自己定义的header头部信息
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36', 'Referer': 'https://accounts.douban.com/login' }
自己定义的登陆信息 可以在下面的图片中找到登陆后提交的数据
data = { 'source': 'None', 'redir': 'https://www.douban.com/', 'form_email': '你的账号', 'form_password': '密码', 'login': '登录', }
获取的是验证码的图片链接还有它的id
# 获取的是你登陆页面中的验证码 还有识别身份的captcha-id request = requests.get('https://accounts.douban.com/login', headers=headers) # 获取的是图片的验证码 img = etree.HTML(request.text).xpath('//*[@id="captcha_image"]/@src')[0] # 获取的是的captcha-id cap_id= etree.HTML(request.text).xpath('//div[@class="captcha_block"]/input[@name="captcha-id"]/@value')[0]``` # 获取到你的验证码的图片链接 输出到控制台 点开链接 输出验证码 存入你自定义的字典中 yzm = input('please your yzm %s:' % img) if yzm: # 判断有没有验证码 有的话就输入验证码 data['captcha-solution'] = yzm data['captcha-id'] = cap_id
入库mongo
# 发送请求 html = session.post('https://accounts.douban.com/login', data=data, headers=headers) client = pymongo.MongoClient() # 连接mongo database = client['用户']['cookie'] 创建数据库 表 da = requests.utils.dict_from_cookiejar(session.cookies) # 得到用户的cookie database.insert({'cookie': da}) # 存入库中 print(requests.utils.dict_from_cookiejar(session.cookies)) # 输出到控制台中看看
相关文章推荐
- [Scrapy]模拟登陆并获取Cookie值
- curl模拟登陆获取cookie
- Python3网络爬虫(六):Python3使用Cookie-模拟登陆获取妹子联系方式
- C#如何HttpWebRequest模拟登陆,获取服务端返回Cookie以便登录请求后使用
- java无需获取cookie实现模拟登陆正方教务系统获取课表等数据
- Python3网络爬虫(三):Python3使用Cookie-模拟登陆获取妹子联系方式
- 爬虫实战【12】使用cookie登陆豆瓣电影以及获取单个电影的所有短评
- 如何用Selenium+Chrome模拟登陆并获取Cookie值
- 使用httpclient4.3.X模拟post请求登陆网站获取cookie信息的操作
- 利用selenium登陆智联招聘,获取cookie
- PHP获取Cookie模拟登录
- PHP获取Cookie模拟登录CURL
- 模拟登陆教务处获取成绩
- CookieContainer模拟登陆存储Cookie以便二次登录用
- python使用cookie模拟登陆
- 三.获取登陆cookie,并且利用cookie访问登陆后的界面
- 模拟登陆时Cookie的处理方式
- PHP获取Cookie模拟登录
- 豆瓣学习 --模拟http 操作 登陆等
- .net下模拟不同身份登陆以获取不同权限