您的位置：首页 > 编程语言 > Python开发

Scrapy爬取知乎用户信息遇见的问题

2017-07-04 16:05 459 查看

首先在将ROBOTSTXT_OBEY设置成False之后运行爬虫进行测试，发现错误，错误码为500.

经检查发现是缺少User-Agent.

在setting中找到DEFAULT_REQUEST_HEADERS,添加上User-Agent.

再次运行爬虫，爬取成功。

然后进行个人主页爬取，再次发现错误，错误码为401

查询后发现是缺少请求头authorization,回到DEFAULT_REQUEST_HEADERS，加上authorization参数。

[b]

[/b]

此时运行爬虫程序，爬取成功，爬取到json格式的文本。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 爬虫 json 测试 Python

相关文章推荐

利用Scrapy爬取所有知乎用户详细信息并存至MongoDB
Python爬虫从入门到放弃（十九）之 Scrapy爬取所有知乎用户信息(下)
利用Scrapy爬取知乎用户详细信息并存至MongoDB（学习笔记）（1）
利用 Scrapy 爬取知乎用户信息
Scrapy 爬取知乎用户信息
用Scrapy爬取知乎用户信息，并存到MongoDB
Python爬虫从入门到放弃（十九）之 Scrapy爬取所有知乎用户信息(下)
python爬取知乎话题的精华问题下的用户信息
Python爬虫从入门到放弃（十八）之 Scrapy爬取所有知乎用户信息(上)
利用Scrapy爬取知乎用户详细信息并存至MongoDB
python爬虫实战笔记---以轮子哥为起点Scrapy爬取知乎用户信息
使用Scrapy爬取百万知乎用户信息
爬取知乎用户信息、头像、问题关注者、用户的所有关注者的头像
scrapy框架爬取知乎110w用户信息，并存入mysql数据库和mongoDB数据库
Scrapy爬取知乎用户信息以及人际拓扑关系
统计知乎问题点赞用户的信息及可视化
Scrapy_redis+scrapyd搭建分布式架构爬取知乎用户信息
关于淘宝应用毋须授权即可获取用户信息的问题
Documentum常见问题5—如何查看工作流运行过程中用户的note备注信息
基类的构造函数中获取用户的信息，比如Cookie、Session等，但Session在构造时却还不存在问题解决方案

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航