您的位置：首页 > 其它

Crawler4j总结（2）

2016-04-02 14:26 225 查看

寻找crawler4j的遍历规则是（深度遍历还是广度遍历）？：

1.crawler4j主要要重写两个类controller和WebCrawler

设计思路是controller–>start–>thread–>Crawler（controller启动thread传递给Crawler4j）；

2.Crawler中包含processPage（WebUrl webUrl）这个方法；

将WebUrl中的outgoingUrl放到toschedule中。代码如图所示：

3.在parser.class中有个抽取url的方法

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： crawler4j

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部