您的位置：首页 > 其它

最新图解DEDE4.0采集教程

2007-07-13 23:51 375 查看

最近有点想弄个站，经过多处咨询，大家一致推荐我用DEDE。于是我就下了一个DEDE。

DEDE的功能太强大~~太人性了~~柏拉图太厉害了~~昨晚弄到两点多也没有弄成功采集，几乎将柏拉图列入牛顿系列人物进行痛K！

今天早上，别的同学都去旅游了，我继续留在MMC“痛K”柏拉图！

就在令人绝望，准备离开的时候，DEDE的采集竟然成功了。你说奇怪不奇怪？

说一句很内行的话：用DEDE采集，要注意匹配区域的惟一性。

打开http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149，我要采集的是中华会计网校的“道德观察”栏目，而且要一次性将他的东西实行“拿来主义”。

=700) window.open('/upimg/allimg/070513/1836440.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836440.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

分析一下翻页的链接，
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=1&ac=149→这是第一页的链接地址
http://www.chinaacc.com/web/rs_ddgc/more.asp?page=2&ac=149→这是第二页的链接地址
我们可以找出其中的变量。
=700) window.open('/upimg/allimg/070513/1836441.jpg');" src="http://www.zmking.com/upimg/allimg/070513/1836441.jpg" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

接下来，我们在众多链接中将文章链接筛选出来。

查看源代码，找到“4000万巨额贷款悄然消失的幕后……”（这一会儿功夫，已经更新了~~），在其前面找一个全文惟一的HTML代码！
=700) window.open('/upimg/allimg/070513/1836442.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836442.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
同理，找“栽倒在审计面前的“能人””在其后面，找全文惟一的HTML代码，那么文章地址就可以被筛选出来了！
=700) window.open('/upimg/allimg/070513/1836443.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836443.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

接着是筛选文章标题！

打开一个文章页面，查看源代码！和上面同道理，找到文章的标题，然后将文章前后的几个HTML代码作为标识。
=700) window.open('/upimg/allimg/070513/1836444.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836444.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

文章内容亦如此！！！
=700) window.open('/upimg/allimg/070513/1836445.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836445.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

这样，采集规则就算完成了！还有好多其它东西我都不管，主要我是不知道那些东西有什么用，如何用！设置完基本的东西就差不多了。

测试一下。
=700) window.open('/upimg/allimg/070513/1836446.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836446.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0">
=700) window.open('/upimg/allimg/070513/1836447.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836447.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">
呵呵，成功了。。。

接下来，采集，导入数据库并生成HTML。
=700) window.open('/upimg/allimg/070513/1836448.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836448.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

=700) window.open('/upimg/allimg/070513/1836449.gif');" src="http://www.zmking.com/upimg/allimg/070513/1836449.gif" onload="if(this.width>'700')this.width='700';" alt="" border="0" width="700">

最后，说一句鼓励自己的话！MMC人，你真系叻！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航