您的位置:首页 > 编程语言 > Java开发

MyEclipse下配置heritrix 1.12.1步骤

2008-04-25 20:32 274 查看
最近做一个基于LUCENE+HERITRIX的毕业设计,在MyEclipse下配置heritrix 1.12.1,参考《开发自己的搜索引擎》书中介绍的越看越糊涂,网上查找也是不完全,昨晚再配置了一下,现整理如下,希望对大家有帮助:
1. 下载heritrix 1.12.1-src.zip和heritrix 1.12.1.zip。
2. 新建空的java项目(注意不是WEB项目), 命名为heritrix。
3. 把heritrix-1.12.1-src/src/java/目录下的org、st和com文件夹拷贝到heritrix/src目录下;
4. 把heritrix-1.12.1-src/src下的webapps文件夹拷贝到Heritrix目录下;
5. 右击heritrix项目,点击properties 找到如图所示的界面,然后把heritrix-1.12.1-src下的lib目录下的所有包导入进来;




6. 解压缩heritrix-1.12.1目录下的heritrix-1.12.1.jar文件,把解压后的所有文件和文件夹(除org、st、com文件夹和heritrix.properties文件外)拷贝到heritrix目录下;
7. 将heritrix-1.12.1目录下的conf文件夹拷贝到heritrix目录下;并将heritrix目录下的profiles文件夹移入conf文件夹中;
8. 打开eclipse下的heritrix/conf/heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”
9. Conf/jmxremote.password.template拷贝到heritrix目录下.改名为:jmxremote.password
最后两行改成:
monitorRole @admin@
controlRole @admin@
改完毕之后,保存该文件。并且需要将该文件的属性改为“只读”。
10.配置环境变量"HERITRIX_HOME"为该项目的根目录à如:D:/mysearchweb/heritrix



10. 找到org.archive.crawler包,运行Heritrix.java中的main函数。
成功的提示信息为:
01:57:30.046 EVENT Starting Jetty/4.2.23
01:57:30.562 EVENT Started WebApplicationContext[/,Heritrix Console]
01:57:30.734 EVENT Started SocketListener on 127.0.0.1:8080
01:57:30.734 EVENT Started org.mortbay.jetty.Server@179c285
Heritrix version: 1.12.1
11. 可能出现错误的问题有:



java.lang.UnsupportedClassVersionError: Bad version number in .class file
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:620)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:124)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:260)
at java.net.URLClassLoader.access$100(URLClassLoader.java:56)
at java.net.URLClassLoader$1.run(URLClassLoader.java:195)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:188)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:268)
at java.lang.ClassLoader.loadClass(ClassLoader.java:251)
at java.lang.ClassLoader.loadClassInternal(ClassLoader.java:319)
Exception in thread "main"
解析原因:版本不兼容
解决方法:
先查看你的MyEclipse中的JRE是哪个版本,然后在下图中的5.0处改为和你的MyEclipse相兼容的版本号。



12.注意,heritrix默认使用8080端口,如果你用TOMCAT作为WEB服务器,则要保证系统端口没有冲突。修改TOMCATconf下的server.xml中的端口号为80,启动TOMCAT,然后在浏览器输入http://127.0.0.1:8080,输入用户名,密码(如前面所设置的admin:admin即用户名和密码都为admin)。就可以进入了!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: