您的位置:首页 > 编程语言 > Go语言

模拟登陆豆瓣获取cookie入mongo库!

2017-07-28 11:09 302 查看
from lxml import etree  # 使用是xpath找到他的验证码
import requests # 使用requests获取的是它的页面信息
import pymongo  # 入库mongo


定义变来那个用来获取session

session = requests.Session()


自己定义的header头部信息

headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36',
'Referer': 'https://accounts.douban.com/login'

}


自己定义的登陆信息 可以在下面的图片中找到登陆后提交的数据

data = {
'source': 'None',
'redir': 'https://www.douban.com/',
'form_email': '你的账号',
'form_password': '密码',
'login': '登录',
}




获取的是验证码的图片链接还有它的id



# 获取的是你登陆页面中的验证码 还有识别身份的captcha-id
request = requests.get('https://accounts.douban.com/login', headers=headers)
# 获取的是图片的验证码
img = etree.HTML(request.text).xpath('//*[@id="captcha_image"]/@src')[0]
# 获取的是的captcha-id
cap_id= etree.HTML(request.text).xpath('//div[@class="captcha_block"]/input[@name="captcha-id"]/@value')[0]```
# 获取到你的验证码的图片链接 输出到控制台 点开链接 输出验证码 存入你自定义的字典中
yzm = input('please your yzm %s:' % img)
if yzm: # 判断有没有验证码 有的话就输入验证码
data['captcha-solution'] = yzm
data['captcha-id'] = cap_id


入库mongo

# 发送请求
html = session.post('https://accounts.douban.com/login', data=data, headers=headers)
client = pymongo.MongoClient()  # 连接mongo
database = client['用户']['cookie'] 创建数据库 表
da = requests.utils.dict_from_cookiejar(session.cookies)  # 得到用户的cookie
database.insert({'cookie': da})  # 存入库中
print(requests.utils.dict_from_cookiejar(session.cookies)) # 输出到控制台中看看
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: