最新图解DEDE4.0采集教程
2007-07-13 23:51
375 查看
最近有点想弄个站,经过多处咨询,大家一致推荐我用DEDE。于是我就下了一个DEDE。
DEDE的功能太强大~~太人性了~~柏拉图太厉害了~~昨晚弄到两点多也没有弄成功采集,几乎将柏拉图列入牛顿系列人物进行痛K!
今天早上,别的同学都去旅游了,我继续留在MMC“痛K”柏拉图!
就在令人绝望,准备离开的时候,DEDE的采集竟然成功了。你说奇怪不奇怪?
说一句很内行的话:用DEDE采集,要注意匹配区域的惟一性。
打开http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149,我要采集的是中华会计网校的“道德观察”栏目,而且要一次性将他的东西实行“拿来主义”。
=700) window.open('/upimg/allimg/070513/1836440.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836440.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
分析一下翻页的链接,
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149→这是第一页的链接地址
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=2&ac=149→这是第二页的链接地址
我们可以找出其中的变量。
=700) window.open('/upimg/allimg/070513/1836441.jpg');" src="http://www.zmking.com/upimg/allimg/070513/1836441.jpg" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
接下来,我们在众多链接中将文章链接筛选出来。
查看源代码,找到“4000万巨额贷款悄然消失的幕后……”(这一会儿功夫,已经更新了~~),在其前面找一个全文惟一的HTML代码!
=700) window.open('/upimg/allimg/070513/1836442.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836442.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
同理,找“栽倒在审计面前的“能人””在其后面,找全文惟一的HTML代码,那么文章地址就可以被筛选出来了!
=700) window.open('/upimg/allimg/070513/1836443.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836443.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
接着是筛选文章标题!
打开一个文章页面,查看源代码!和上面同道理,找到文章的标题,然后将文章前后的几个HTML代码作为标识。
=700) window.open('/upimg/allimg/070513/1836444.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836444.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
文章内容亦如此!!!
=700) window.open('/upimg/allimg/070513/1836445.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836445.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
这样,采集规则就算完成了!还有好多其它东西我都不管,主要我是不知道那些东西有什么用,如何用!设置完基本的东西就差不多了。
测试一下。
=700) window.open('/upimg/allimg/070513/1836446.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836446.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
=700) window.open('/upimg/allimg/070513/1836447.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836447.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
呵呵,成功了。。。
接下来,采集,导入数据库并生成HTML。
=700) window.open('/upimg/allimg/070513/1836448.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836448.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
=700) window.open('/upimg/allimg/070513/1836449.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836449.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
最后,说一句鼓励自己的话!MMC人,你真系叻!
DEDE的功能太强大~~太人性了~~柏拉图太厉害了~~昨晚弄到两点多也没有弄成功采集,几乎将柏拉图列入牛顿系列人物进行痛K!
今天早上,别的同学都去旅游了,我继续留在MMC“痛K”柏拉图!
就在令人绝望,准备离开的时候,DEDE的采集竟然成功了。你说奇怪不奇怪?
说一句很内行的话:用DEDE采集,要注意匹配区域的惟一性。
打开http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149,我要采集的是中华会计网校的“道德观察”栏目,而且要一次性将他的东西实行“拿来主义”。
=700) window.open('/upimg/allimg/070513/1836440.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836440.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
分析一下翻页的链接,
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149→这是第一页的链接地址
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=2&ac=149→这是第二页的链接地址
我们可以找出其中的变量。
=700) window.open('/upimg/allimg/070513/1836441.jpg');" src="http://www.zmking.com/upimg/allimg/070513/1836441.jpg" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
接下来,我们在众多链接中将文章链接筛选出来。
查看源代码,找到“4000万巨额贷款悄然消失的幕后……”(这一会儿功夫,已经更新了~~),在其前面找一个全文惟一的HTML代码!
=700) window.open('/upimg/allimg/070513/1836442.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836442.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
同理,找“栽倒在审计面前的“能人””在其后面,找全文惟一的HTML代码,那么文章地址就可以被筛选出来了!
=700) window.open('/upimg/allimg/070513/1836443.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836443.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
接着是筛选文章标题!
打开一个文章页面,查看源代码!和上面同道理,找到文章的标题,然后将文章前后的几个HTML代码作为标识。
=700) window.open('/upimg/allimg/070513/1836444.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836444.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
文章内容亦如此!!!
=700) window.open('/upimg/allimg/070513/1836445.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836445.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
这样,采集规则就算完成了!还有好多其它东西我都不管,主要我是不知道那些东西有什么用,如何用!设置完基本的东西就差不多了。
测试一下。
=700) window.open('/upimg/allimg/070513/1836446.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836446.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
=700) window.open('/upimg/allimg/070513/1836447.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836447.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
呵呵,成功了。。。
接下来,采集,导入数据库并生成HTML。
=700) window.open('/upimg/allimg/070513/1836448.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836448.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
=700) window.open('/upimg/allimg/070513/1836449.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836449.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
最后,说一句鼓励自己的话!MMC人,你真系叻!
相关文章推荐
- dede3.1分页文字采集过滤规则详说(图文教程)续四
- BIOS设置图解教程 Award Bios最新(转)
- dede3.1分页文字采集过滤规则详说(图文教程)续四
- Apache 服务器最新版下载、安装及配置教程图解(Windows版)
- dede采集教程
- 2010.3.8 dede55最新漏洞利用图解
- 怎么用硬盘安装win10?硬盘安装win10系统最新版教程(图解)
- dede3.1分页文字采集过滤规则详说(图文教程)续二
- Mysql-5.7-win64数据库安装教程 压缩解压版安装在win10 安装配置过程图解图示简单傻瓜式一条龙教程(最新更新2017.7.2)
- linux下mysql 最新版安装图解教程
- dede3.1分页文字采集过滤规则详说(图文教程)续三
- 最新版CentOS 6.3安装(详细图解教程)
- dede3.1分页文字采集过滤规则详说(图文教程)
- linux下mysql 最新版安装图解教程
- Microsoft Dynamics CRM 4.0 安装图解教程
- dede3.1分页文字采集过滤规则详说(图文教程)
- 中国站长站 For Dede4.0 采集规则
- 网页爬虫技术之京东商品采集教程图解
- 中国站长站 For Dede4.0 采集规则
- BIOS设置图解教程 Award Bios最新