深入学习Heritrix---解析处理器(Processor)
2008-10-23 12:27
302 查看
本节解析与处理器有关的内容.
与处理器有关的主要在以下几个类:Processor(处理器类),ProcessorChain(处理器类),ProcessorChainList(处理器链列表).它们之间的关系如下:
Code
(2)ProcessorChain
该类实际上实现一个队列的功能,它代表一个由许多处理器连接的处理器链.
Code
(3)ProcessorChainList
该类是保存一次抓取任务的所有的处理器链(ProcessorChain).
Code
(5)处理器链的初始化
所有的处理器链都是在CrawlController的initialize中初始化的.
CodeCode
Code
Code
private void setupCrawlModules(){
//设置处理链
// Setup processors
if (processorChains == null) {
processorChains = new ProcessorChainList(order);
}
与处理器有关的主要在以下几个类:Processor(处理器类),ProcessorChain(处理器类),ProcessorChainList(处理器链列表).它们之间的关系如下:
Code
(2)ProcessorChain
该类实际上实现一个队列的功能,它代表一个由许多处理器连接的处理器链.
Code
(3)ProcessorChainList
该类是保存一次抓取任务的所有的处理器链(ProcessorChain).
Code
(5)处理器链的初始化
所有的处理器链都是在CrawlController的initialize中初始化的.
CodeCode
Code
Code
private void setupCrawlModules(){
//设置处理链
// Setup processors
if (processorChains == null) {
processorChains = new ProcessorChainList(order);
}
相关文章推荐
- 深入学习Heritrix---解析处理器(Processor)
- 深入学习Heritrix---解析处理器(Processor)
- 深入学习Heritrix---解析处理器(Processor)(转)
- 深入学习Heritrix---解析CrawlController
- 深入学习Heritrix---解析Frontier(链接工厂)
- 深入学习Heritrix---解析CrawlController
- 深入学习Heritrix---解析CrawlController
- 深入学习Heritrix---解析Frontier(链接工厂)
- 深入学习Heritrix---解析CrawlController(转)
- 深入学习Heritrix---解析CrawlController
- 深入学习Heritrix---解析Frontier(链接工厂)
- 深入学习Heritrix---解析Frontier(链接工厂)
- 【转】 深入学习Heritrix---解析CrawlController
- 【PSI/SI学习系列】2.PSI/SI深入学习2——PSI信息解析(PAT,PMT,CAT)
- ASP.NET MVC学习笔记-ViewEngine 深入解析与应用实例
- [ASP.NET学习笔记之十六]深入解析ASP.NET架构
- Linux学习-- su -和 su的区别深入解析
- 深入学习heritrix---体系结构(Overview of the crawler)
- JVM 深入学习:Java 解析 Class 文件过程解析
- 代理模式深入学习(一)——动态代理的实现及解析