scrapy简单项目使用
2016-07-13 10:01
295 查看
1、首先安装scrpay--不多说基本功
2、新建一个爬虫项目 scrapy startproject scrapy_tutorial
3、新建之后的目录结构不多说,进入到项目 cd scrapy_tutorial 新建一个示例使用 scrapy genspider dmoz_spider dmoz.org
此时目录结构如图所示
4、编写spider,spider为
5、item是
import scrapy
class DmozItem(scrapy.Item):
title = scrapy.Field()
link = scrapy.Field()
desc = scrapy.Field()
6、pipelines
class TutorialPipeline(object):
def process_item(self, item, spider):
return item
7、执行scrapy crawl dmoz_spider
2、新建一个爬虫项目 scrapy startproject scrapy_tutorial
3、新建之后的目录结构不多说,进入到项目 cd scrapy_tutorial 新建一个示例使用 scrapy genspider dmoz_spider dmoz.org
此时目录结构如图所示
4、编写spider,spider为
5、item是
import scrapy
class DmozItem(scrapy.Item):
title = scrapy.Field()
link = scrapy.Field()
desc = scrapy.Field()
6、pipelines
class TutorialPipeline(object):
def process_item(self, item, spider):
return item
7、执行scrapy crawl dmoz_spider
相关文章推荐
- css之等高布局
- POJ 2359 Wormholes
- JNI学习积累之一 ---- 常用函数大全
- 微软和 SUSE Linux 宣布在公有云方面达成新的合作
- 李洪强iOS开发之keychain的使用
- 在leangoo里怎么复制列表,删除列表,插入列表?
- uCOS-II任务机制
- Twig关于时间
- 文章标题
- 关于Python中的for循环控制语句
- poj3683 Priest John's Busiest Day【2-sat n+m算法】
- 应用多机房部署
- css之z-index
- canvas 伞形的绘制
- shell学习-1
- DriverStudio开发PCI设备DMA数据传输
- uC/cos-II系统函数管理
- [Hihocoder]1335 : Email Merge (并查集)
- css之relative
- 【ASO100独家】2015年App Store审核被拒的23个理由