pycharm运行scrapy项目
2017-08-25 10:33
274 查看
pycharm运行scrapy项目
刚学scrapy,之前都是在命令行运行scrapy项目,但是据说用pycharm可以debugger,想试试,但会出问题,下面是我看了网上解决方法之后总结的我觉的较好的解决方法配置过程
首先在项目文件和scrapy.cfg同一级别目录下新建一个main.pymain.py
# -*— coding: UTF-8 -*- from scrapy.cmdline import execute import sys import os # 打断点调试py文件 # sys.path.append('D:PyCharmpy_scrapyjobbole') sys.path.append(os.path.dirname(os.path.abspath(__file__))) print(os.path.dirname(os.path.abspath(__file__))) execute(['scrapy', 'crawl', 'tianmao'])
注意
execute的第三个参数tianmao是你spider文件下执行爬取的py文件里属性name的值下一步将setting.py文件里的机器三定律改成false(最好都改成false,这样就可以爬更多网页了)
# Obey robots.txt rules # 遵守机器人。三种规则 ROBOTSTXT_OBEY = False
接下来最重要的是看你spider文件下的爬取文件spider.py有没有代码错误,像我之前就是start_urls 写成start_url了,导致debugger的时候一直以为是其他错误,一直进不了爬取操作代码
接下来就是执行运行scrapy项目了,打开main.py文件,右键
就可以看到Run和Debug这两个选项,这时候你就能感受到这个IDE的好处了,毕竟用命令来查询还是蛮麻烦的
相关文章推荐
- 使用pycharm运行scrapy项目
- 亲测——pycharm下运行第一个scrapy项目 ©seven_clear
- ubuntu15.04下pycharm运行项目一直找不到libnnz11.so而报错:ImportError
- 爬虫技巧:在pycharm 下 调试 scrapy项目
- python——scrapy安装成功,check项目成功,运行出现一下问题
- 在pycharm中调试运行scrapy
- scrapy项目运行报错: exceptions.ImportError: No module named win32api
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
- Pycharm+Scrapy安装并且初始化项目
- Scrapy定向爬虫教程(一)——创建运行项目和基本介绍
- 同时运行多个scrapy爬虫的几种方法(自定义scrapy项目命令)
- 在PyCharm中运行django 项目
- 使用pycharm运行调试scrapy
- 【python】pycharm 如何快速创建scrapy项目
- pycharm开发scrapy项目中的一些问题
- pycharm +scrapy 运行报错:[twisted] CRITICAL: Unhandled error in Deferred
- 用pycharm创建Scrapy项目第一天