MyEclipse下配置heritrix 1.12.1步骤
2008-04-25 20:32
274 查看
最近做一个基于LUCENE+HERITRIX的毕业设计,在MyEclipse下配置heritrix 1.12.1,参考《开发自己的搜索引擎》书中介绍的越看越糊涂,网上查找也是不完全,昨晚再配置了一下,现整理如下,希望对大家有帮助:
1. 下载heritrix 1.12.1-src.zip和heritrix 1.12.1.zip。
2. 新建空的java项目(注意不是WEB项目), 命名为heritrix。
3. 把heritrix-1.12.1-src/src/java/目录下的org、st和com文件夹拷贝到heritrix/src目录下;
4. 把heritrix-1.12.1-src/src下的webapps文件夹拷贝到Heritrix目录下;
5. 右击heritrix项目,点击properties 找到如图所示的界面,然后把heritrix-1.12.1-src下的lib目录下的所有包导入进来;
![](http://p.blog.csdn.net/images/p_blog_csdn_net/foamflower/5.JPG)
6. 解压缩heritrix-1.12.1目录下的heritrix-1.12.1.jar文件,把解压后的所有文件和文件夹(除org、st、com文件夹和heritrix.properties文件外)拷贝到heritrix目录下;
7. 将heritrix-1.12.1目录下的conf文件夹拷贝到heritrix目录下;并将heritrix目录下的profiles文件夹移入conf文件夹中;
8. 打开eclipse下的heritrix/conf/heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”
9. Conf/jmxremote.password.template拷贝到heritrix目录下.改名为:jmxremote.password
最后两行改成:
monitorRole @admin@
controlRole @admin@
改完毕之后,保存该文件。并且需要将该文件的属性改为“只读”。
10.配置环境变量"HERITRIX_HOME"为该项目的根目录à如:D:/mysearchweb/heritrix
![](http://p.blog.csdn.net/images/p_blog_csdn_net/foamflower/2.JPG)
10. 找到org.archive.crawler包,运行Heritrix.java中的main函数。
成功的提示信息为:
01:57:30.046 EVENT Starting Jetty/4.2.23
01:57:30.562 EVENT Started WebApplicationContext[/,Heritrix Console]
01:57:30.734 EVENT Started SocketListener on 127.0.0.1:8080
01:57:30.734 EVENT Started org.mortbay.jetty.Server@179c285
Heritrix version: 1.12.1
11. 可能出现错误的问题有:
![](http://p.blog.csdn.net/images/p_blog_csdn_net/foamflower/3.JPG)
java.lang.UnsupportedClassVersionError: Bad version number in .class file
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:620)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:124)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:260)
at java.net.URLClassLoader.access$100(URLClassLoader.java:56)
at java.net.URLClassLoader$1.run(URLClassLoader.java:195)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:188)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:268)
at java.lang.ClassLoader.loadClass(ClassLoader.java:251)
at java.lang.ClassLoader.loadClassInternal(ClassLoader.java:319)
Exception in thread "main"
解析原因:版本不兼容
解决方法:
先查看你的MyEclipse中的JRE是哪个版本,然后在下图中的5.0处改为和你的MyEclipse相兼容的版本号。
![](http://p.blog.csdn.net/images/p_blog_csdn_net/foamflower/4.JPG)
12.注意,heritrix默认使用8080端口,如果你用TOMCAT作为WEB服务器,则要保证系统端口没有冲突。修改TOMCAT下conf下的server.xml中的端口号为80,启动TOMCAT,然后在浏览器输入http://127.0.0.1:8080,输入用户名,密码(如前面所设置的admin:admin即用户名和密码都为admin)。就可以进入了!
1. 下载heritrix 1.12.1-src.zip和heritrix 1.12.1.zip。
2. 新建空的java项目(注意不是WEB项目), 命名为heritrix。
3. 把heritrix-1.12.1-src/src/java/目录下的org、st和com文件夹拷贝到heritrix/src目录下;
4. 把heritrix-1.12.1-src/src下的webapps文件夹拷贝到Heritrix目录下;
5. 右击heritrix项目,点击properties 找到如图所示的界面,然后把heritrix-1.12.1-src下的lib目录下的所有包导入进来;
6. 解压缩heritrix-1.12.1目录下的heritrix-1.12.1.jar文件,把解压后的所有文件和文件夹(除org、st、com文件夹和heritrix.properties文件外)拷贝到heritrix目录下;
7. 将heritrix-1.12.1目录下的conf文件夹拷贝到heritrix目录下;并将heritrix目录下的profiles文件夹移入conf文件夹中;
8. 打开eclipse下的heritrix/conf/heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”
9. Conf/jmxremote.password.template拷贝到heritrix目录下.改名为:jmxremote.password
最后两行改成:
monitorRole @admin@
controlRole @admin@
改完毕之后,保存该文件。并且需要将该文件的属性改为“只读”。
10.配置环境变量"HERITRIX_HOME"为该项目的根目录à如:D:/mysearchweb/heritrix
10. 找到org.archive.crawler包,运行Heritrix.java中的main函数。
成功的提示信息为:
01:57:30.046 EVENT Starting Jetty/4.2.23
01:57:30.562 EVENT Started WebApplicationContext[/,Heritrix Console]
01:57:30.734 EVENT Started SocketListener on 127.0.0.1:8080
01:57:30.734 EVENT Started org.mortbay.jetty.Server@179c285
Heritrix version: 1.12.1
11. 可能出现错误的问题有:
java.lang.UnsupportedClassVersionError: Bad version number in .class file
at java.lang.ClassLoader.defineClass1(Native Method)
at java.lang.ClassLoader.defineClass(ClassLoader.java:620)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:124)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:260)
at java.net.URLClassLoader.access$100(URLClassLoader.java:56)
at java.net.URLClassLoader$1.run(URLClassLoader.java:195)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:188)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:268)
at java.lang.ClassLoader.loadClass(ClassLoader.java:251)
at java.lang.ClassLoader.loadClassInternal(ClassLoader.java:319)
Exception in thread "main"
解析原因:版本不兼容
解决方法:
先查看你的MyEclipse中的JRE是哪个版本,然后在下图中的5.0处改为和你的MyEclipse相兼容的版本号。
12.注意,heritrix默认使用8080端口,如果你用TOMCAT作为WEB服务器,则要保证系统端口没有冲突。修改TOMCAT下conf下的server.xml中的端口号为80,启动TOMCAT,然后在浏览器输入http://127.0.0.1:8080,输入用户名,密码(如前面所设置的admin:admin即用户名和密码都为admin)。就可以进入了!
相关文章推荐
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- Heritrix-1.12.1在Eclipse中的配置
- 【编程语言】java--开发环境配置:jdk+tomcat+myeclipse 安装步骤
- heritrix 在myeclipse中的配置
- MyEclipse 10 配置jad反编译工具步骤及详解
- jdk+myeclipse配置安装相关步骤
- Heritrix在windows配置步骤
- Heritrix-1.12.1在Eclipse中的配置
- java项目开发中MyEclipse新建工作空间后的配置详细步骤
- myeclipse中配置spket插件步骤
- Mondrian+Jpivot在MyEclipse中源码配置的详细步骤
- 在MyEclipse7.5配置Heritrix1.14.4
- Heritrix在开发环境myEclipse下的配置方法
- Heritrix-1.12.1在Eclipse中的配置
- MyEclipse 配置SQL Server 2008数据库驱动操作步骤
- MyEclipse手动配置S2SH框架步骤
- Heritrix-1.12.1在Eclipse中的配置