您的位置:首页 > 其它

Crawler4j总结(2)

2016-04-02 14:26 225 查看
寻找crawler4j的遍历规则是(深度遍历还是广度遍历)?:

1.crawler4j主要要重写两个类controller和WebCrawler

设计思路是controller–>start–>thread–>Crawler(controller启动thread传递给Crawler4j);



2.Crawler中包含processPage(WebUrl webUrl)这个方法;

将WebUrl中的outgoingUrl放到toschedule中。代码如图所示:



3.在parser.class中有个抽取url的方法

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  crawler4j