heritrix1.14.4配置-没有add和change按钮的问题
2016-12-06 17:43
302 查看
原博地址:http://blog.csdn.net/waterlxj/article/details/8214017
今天搞了下heritrix1.14.4在eclipse下的配置,根据http://www.360doc.com/content/10/0913/18/2793979_53385587.shtml教程,一步步操作非常顺利,但是就是最后一个问题:
3、在eclipse中可以启动heritrix,但在jobs->modules.jsp页面中没有添加(“Add”)按扭,且出现以下异常。
致使错误:“无法编译样式表” 严重 thread-12 org.archive'crawler.framework.WriterPodProcessor.io.arc.......
解决办法:将heritrix 项目中的modulse的上一级目录文件添加到eclipse的classpath中。
按这个解决办法怎么也搞不定,在网上一顿狂搜找的:http://blog.sina.com.cn/s/blog_7645c6730100t0an.html这篇文章:
把heritrix-1.14.4\src\conf下的modules文件夹移到src文件夹中,问题才得以解决。
这中间还遇到一个问题,大概意思是javac无法找到,检查Java环境变量也没问题,后来发现是eclipse的配置问题:打开Properties-》java
compiler-》Installed jrs,add 一个新的jre项,路径是jdk的安装路径。把之前工程用的换成现在的就可以了。
使用入门我参照的是:http://www.yovae.com/blog/heritrix%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%E7%A4%BA%E4%BE%8B.html
现在把http://www.360doc.com/content/10/0913/18/2793979_53385587.shtml用到的内容拷贝在这里,以防以后找不到这个链接了:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
二、在Eclipse中配置Heritrix
1、新建空的java项目(注意不是WEB项目),命名为heritrix;
2、把heritrix-1.14.4-src\src\java\目录下的org、st和com文件夹拷贝到heritrix/src目录下;
3、把heritrix-1.14.4-src\src下的wbapps文件夹拷贝到heritrix目录下;
4、右击heritrix项目,点击properties ,通过JavaBuildPath,将heritrix-1.14.4-src下的lib目录下的所有包导入进来;
5、解压缩heritrix-1.14.4目录下的heritrix-1.14.4.jar文件,把解压后的所有文件和文件夹(除org、st、com文件夹和heritrix.properties文件外)拷贝到heritrix目录下;
6、将heritrix-1.14.4目录下的conf文件夹拷贝到heritrix目录下;并将heritrix目录下的profiles文件夹移入conf文件夹中;
7、打开eclipse下的heritrix/conf/heritrix.properties文件,找到"heritrix.cmdline.admin=",修改为“heritrix.cmdline.admin = admin:admin”;
8、Conf/jmxremote.password.template拷贝到heritrix目录下。改名为:jmxremote.password,
最后再行改成: monitorRole admin controlRole admin
9、找到org.archive.crawler包,运行Heritrix.java中的main函数。
成功提示信息为: 09:14:07.406 EVENT Starting Jetty/4.2.23
09:14:07.656 EVENT Started WebApplicationContext[/,Heritrix Console]
09:14:07.750 EVENT Started SocketListener on 127.0.0.1:8082
09:14:07.750 EVENT Started
Heritrix version: 1.14.4
可能会出现的异常:
1、在Heritrix.java中出现File URLConnection 红叉;
解决办法:将myeclipse中的compiler 属性中的Errors/warring 中的Forbidden....选为warrning即可。
2、出现的异常:......thread-10 org.archive.util.ArchiveUtils.<linit>( )TLD list....
解决办法:将 \heritrix-1.14.4-src\heritrix-1.14.4\src\resources\org\archive\util 下的文本文档拷贝到heritrix中的org\archive\util下;
3、在eclipse中可以启动heritrix,但在jobs->modules.jsp页面中没有添加(“Add”)按扭,且出现以下异常。
解决办法请参照本文前半部分
今天搞了下heritrix1.14.4在eclipse下的配置,根据http://www.360doc.com/content/10/0913/18/2793979_53385587.shtml教程,一步步操作非常顺利,但是就是最后一个问题:
3、在eclipse中可以启动heritrix,但在jobs->modules.jsp页面中没有添加(“Add”)按扭,且出现以下异常。
致使错误:“无法编译样式表” 严重 thread-12 org.archive'crawler.framework.WriterPodProcessor.io.arc.......
解决办法:将heritrix 项目中的modulse的上一级目录文件添加到eclipse的classpath中。
按这个解决办法怎么也搞不定,在网上一顿狂搜找的:http://blog.sina.com.cn/s/blog_7645c6730100t0an.html这篇文章:
把heritrix-1.14.4\src\conf下的modules文件夹移到src文件夹中,问题才得以解决。
这中间还遇到一个问题,大概意思是javac无法找到,检查Java环境变量也没问题,后来发现是eclipse的配置问题:打开Properties-》java
compiler-》Installed jrs,add 一个新的jre项,路径是jdk的安装路径。把之前工程用的换成现在的就可以了。
使用入门我参照的是:http://www.yovae.com/blog/heritrix%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%E7%A4%BA%E4%BE%8B.html
现在把http://www.360doc.com/content/10/0913/18/2793979_53385587.shtml用到的内容拷贝在这里,以防以后找不到这个链接了:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
二、在Eclipse中配置Heritrix
1、新建空的java项目(注意不是WEB项目),命名为heritrix;
2、把heritrix-1.14.4-src\src\java\目录下的org、st和com文件夹拷贝到heritrix/src目录下;
3、把heritrix-1.14.4-src\src下的wbapps文件夹拷贝到heritrix目录下;
4、右击heritrix项目,点击properties ,通过JavaBuildPath,将heritrix-1.14.4-src下的lib目录下的所有包导入进来;
5、解压缩heritrix-1.14.4目录下的heritrix-1.14.4.jar文件,把解压后的所有文件和文件夹(除org、st、com文件夹和heritrix.properties文件外)拷贝到heritrix目录下;
6、将heritrix-1.14.4目录下的conf文件夹拷贝到heritrix目录下;并将heritrix目录下的profiles文件夹移入conf文件夹中;
7、打开eclipse下的heritrix/conf/heritrix.properties文件,找到"heritrix.cmdline.admin=",修改为“heritrix.cmdline.admin = admin:admin”;
8、Conf/jmxremote.password.template拷贝到heritrix目录下。改名为:jmxremote.password,
最后再行改成: monitorRole admin controlRole admin
9、找到org.archive.crawler包,运行Heritrix.java中的main函数。
成功提示信息为: 09:14:07.406 EVENT Starting Jetty/4.2.23
09:14:07.656 EVENT Started WebApplicationContext[/,Heritrix Console]
09:14:07.750 EVENT Started SocketListener on 127.0.0.1:8082
09:14:07.750 EVENT Started
Heritrix version: 1.14.4
可能会出现的异常:
1、在Heritrix.java中出现File URLConnection 红叉;
解决办法:将myeclipse中的compiler 属性中的Errors/warring 中的Forbidden....选为warrning即可。
2、出现的异常:......thread-10 org.archive.util.ArchiveUtils.<linit>( )TLD list....
解决办法:将 \heritrix-1.14.4-src\heritrix-1.14.4\src\resources\org\archive\util 下的文本文档拷贝到heritrix中的org\archive\util下;
3、在eclipse中可以启动heritrix,但在jobs->modules.jsp页面中没有添加(“Add”)按扭,且出现以下异常。
解决办法请参照本文前半部分
相关文章推荐
- ASP.NET MVC WebAPI请求
- meteor安装太慢问题
- HTML小游戏—打灰机
- Sql 求两列去重后的总数量
- 代理模式
- Android 代码检查工具SonarQube
- 解决dom4j java.lang.NoClassDefFoundError: org/jaxen/JaxenException
- 从入门到研究,人工智能领域最值得一读的20份资料
- 毕业工作半年记录,加油吧,少年,你还很弱
- Ubuntu下安装和配置Apache2
- 一个根据内存使用情况重启tomcat的小脚本
- print、println、printf的区别
- SVNKit学习——Setting Up A Subversion Repository 创建仓库(三)
- Android开发之Intent略解
- Jersey框架二:Jersey对JSON的支持
- c++中的set_new_handler和new_handler
- java企业级应用之术语篇,值得一看!
- 【Hadoop】hiveserver2 不能启动端口 10000 开启服务的相关经验总结
- Android中关于enum的随笔
- log4j配置文件(.properties)详解