用八爪鱼制作的东方财富网股票信息网页爬虫
2018-03-23 09:33
435 查看
本文演示无需代码可视化的方法快速抓取东方财富网股票信息的方法。
在开始之前,可以先参考一下这些文章,希望有帮助:
小白30分钟学会网页爬虫
网页爬虫真实案例记录
文中用到的可视化爬虫制作工具(官网),只作为演示使用,实际应用中可以替换成自己拿手的工具或代码语言即可。
需要抓取东方财经网里详细内容的,在网页简易模式界面里 东方财经网,进去之后可以看到关于东方财经网的三个规则信息,我们依次直接使用就可以的。
![](http://bzy.dream-world.cn/images_3437-0.jpg)
放大看>>
抓取东方财富网-行情中心-沪深A股内容(下图所示)即打开东方财富网主页 第三个(行情中心-沪深A股)抓取搜索到的内容。
1、 找到东方财富网-行情中心-沪深A股 规则然后 立即使用
![](http://bzy.dream-world.cn/images_3437-1.jpg)
放大看>>
2、下图显示的即为简易模式里面行情中心-沪深A股的规则
① 查看详情:点开可以看到示例网址
② 任务名:自定义任务名,默认为行情中心-沪深A股
③ 任务组:给任务划分一个保存任务的组,如果不设置会有一个默认组
④ 翻页次数:设置要抓取的页数
⑤ 示例数据:这个规则抓取的所有字段信息
![](http://bzy.dream-world.cn/images_3437-2.jpg)
放大看>>
3、 规则制作示例
任务名:自定义任务名,也可以不设置按照默认的就行
任务组:自定义任务组,也可以不设
a77f
置按照默认的就行
翻页次数: 3
设置好之后 保存,保存之后会出现开始抓取的按钮
保存之后会出现开始抓取的按钮
![](http://bzy.dream-world.cn/images_3437-3.jpg)
放大看>>
4、 选择开始抓取之后系统将会弹出运行任务的界面
可以选择启动本地抓取(本地执行抓取流程)或者启动云抓取(由云 器执行抓取流程),这里以启动本地抓取为例,我们选择启动本地抓取按钮
![](http://bzy.dream-world.cn/images_3437-4s.png)
放大看>>
5、选择本地抓取按钮之后,系统将会在本地执行这个抓取流程来抓取数据,下图为本地抓取的效果
![](http://bzy.dream-world.cn/images_3437-5.jpg)
放大看>>
6、抓取完毕之后选择导出数据按钮即可,这里以导出excel2007为例,选择这个选项之后 确定
![](http://bzy.dream-world.cn/images_3437-6.jpg)
放大看>>
7、然后选择文件存放在电脑上的路径,路径选择好之后选择保存
![](http://bzy.dream-world.cn/images_3437-7.jpg)
放大看>>
8、这样数据就被完整的导出到自己的电脑上来了哦,点 开excel表就可以查看了,可以看到它导出的数据自动把重复的删掉了,只剩147个,所以以后要是抓取到有重复的数据时可以在导出数据这里去重一下。
![](http://bzy.dream-world.cn/images_3437-8.jpg)
放大看>>
文中用到的可视化爬虫制作工具(官网),只作为演示使用,实际应用中可以替换成自己拿手的工具或代码语言即可。
在开始之前,可以先参考一下这些文章,希望有帮助:
小白30分钟学会网页爬虫
网页爬虫真实案例记录
文中用到的可视化爬虫制作工具(官网),只作为演示使用,实际应用中可以替换成自己拿手的工具或代码语言即可。
需要抓取东方财经网里详细内容的,在网页简易模式界面里 东方财经网,进去之后可以看到关于东方财经网的三个规则信息,我们依次直接使用就可以的。
![](http://bzy.dream-world.cn/images_3437-0.jpg)
放大看>>
抓取东方财富网-行情中心-沪深A股内容(下图所示)即打开东方财富网主页 第三个(行情中心-沪深A股)抓取搜索到的内容。
1、 找到东方财富网-行情中心-沪深A股 规则然后 立即使用
![](http://bzy.dream-world.cn/images_3437-1.jpg)
放大看>>
2、下图显示的即为简易模式里面行情中心-沪深A股的规则
① 查看详情:点开可以看到示例网址
② 任务名:自定义任务名,默认为行情中心-沪深A股
③ 任务组:给任务划分一个保存任务的组,如果不设置会有一个默认组
④ 翻页次数:设置要抓取的页数
⑤ 示例数据:这个规则抓取的所有字段信息
![](http://bzy.dream-world.cn/images_3437-2.jpg)
放大看>>
3、 规则制作示例
任务名:自定义任务名,也可以不设置按照默认的就行
任务组:自定义任务组,也可以不设
a77f
置按照默认的就行
翻页次数: 3
设置好之后 保存,保存之后会出现开始抓取的按钮
保存之后会出现开始抓取的按钮
![](http://bzy.dream-world.cn/images_3437-3.jpg)
放大看>>
4、 选择开始抓取之后系统将会弹出运行任务的界面
可以选择启动本地抓取(本地执行抓取流程)或者启动云抓取(由云 器执行抓取流程),这里以启动本地抓取为例,我们选择启动本地抓取按钮
![](http://bzy.dream-world.cn/images_3437-4s.png)
放大看>>
5、选择本地抓取按钮之后,系统将会在本地执行这个抓取流程来抓取数据,下图为本地抓取的效果
![](http://bzy.dream-world.cn/images_3437-5.jpg)
放大看>>
6、抓取完毕之后选择导出数据按钮即可,这里以导出excel2007为例,选择这个选项之后 确定
![](http://bzy.dream-world.cn/images_3437-6.jpg)
放大看>>
7、然后选择文件存放在电脑上的路径,路径选择好之后选择保存
![](http://bzy.dream-world.cn/images_3437-7.jpg)
放大看>>
8、这样数据就被完整的导出到自己的电脑上来了哦,点 开excel表就可以查看了,可以看到它导出的数据自动把重复的删掉了,只剩147个,所以以后要是抓取到有重复的数据时可以在导出数据这里去重一下。
![](http://bzy.dream-world.cn/images_3437-8.jpg)
放大看>>
文中用到的可视化爬虫制作工具(官网),只作为演示使用,实际应用中可以替换成自己拿手的工具或代码语言即可。
相关文章推荐
- 用八爪鱼制作的亚马逊商品销售排行榜信息网页爬虫
- 网页爬虫进阶系列之东方财富网信息爬虫制作
- 用八爪鱼制作的阿里巴巴1688网页爬虫
- 网页爬虫进阶系列之美团店铺信息爬虫制作
- 如何制作知乎话题信息爬虫
- python脚本工具-1 制作爬虫下载网页图片
- 图解“百度百科内容”网页爬虫制作的相关问题
- 网页爬虫进阶系列之ebay商品图片爬虫制作
- [置顶] [Java爬虫] 使用 Xpath + HtmlUnit 爬取网页基本信息
- java 网页爬虫(以扒取amazon网页信息为例)
- 东方财富网股票数据爬虫
- 制作简单的网页爬虫
- 利用java/android 模拟网页表单提交。可用于爬虫和wif登录器制作
- Python网络爬虫与信息提取-Day14-(实例)股票数据定向爬虫
- Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息——Jason niu
- 爬虫爬取股票信息
- 新手学习网页爬虫之携程网旅游线路信息过程笔记
- python爬虫学习 之 定向爬取 股票信息
- 爬虫基础 --beautifilsoup4库(解析网页信息)
- Python爬虫入门(爬取某网页财经部分股票数据)