[置顶] Linux下将Nutch1.3导入eclipse
2013-11-01 18:46
363 查看
1、准备工作
首先去官网下载好 apache-nutch-1.3-bin.zip解压apache-nutch-1.3-bin.zip
[pig@CentOs ]$ unzip apache-nutch-1.3-bin.zip
解压后生成的文件夹 nutch-1.3
Apache官只有最近版本,没有1.3的了,我已将相关版本分享到 http://yunpan.cn/Q9LQVKuhBnSJ3
2、新建项目,导入jar包以及配置文件和插件
a、在eclipse中新建一个Java项目,取名 nutch-1.43b、将解压后生成的文件夹中的src中的java里面的所有内容复制到项目的src下;
c、将runtime/local下的conf (必选)、 plugins(可选)文件夹复制到项目中,与src同级;
d、将conf文件夹添加为Source Folder ;
e、将runtime/local中的lib下面的jar包添加到classpath,方法是右键项目 -> Bulid Path -> Add External Archives ,找到工作目录下的lib,选中所有的jar即可。
3、修改conf下相关配置文件
3.1 修改 nutch-default.xml :
a、配置http.agent.name,如图:代码 :
<property> <name>http.agent.name</name> <value>pig</value> <description>HTTP 'User-Agent' request header. MUST NOT be empty - please set this to a single word uniquely related to your organization. NOTE: You should also check other related properties: http.robots.agents http.agent.description http.agent.url http.agent.email http.agent.version and set their values appropriately. </description> </property>
b、修改http.agent.version ,如图:
代码:
<property> <name>http.agent.version</name> <value>Nutch-1.3</value> <description>A version string to advertise in the User-Agent header.</description> </property>
c、修改plugin.folders ,如图:
代码:
<property> <name>plugin.folders</name> <value>plugins</value> <description>Directories where nutch plugins are located. Each element may be a relative or absolute path. If absolute, it is used as is. If relative, it is searched for on the classpath.</description> </property>
注意:plugin.folders 的 value需要指向 插件所在的路径,由于第二步已经将runtime/local下的插件 plugins文件夹复制到项目中,所以这里可以直接写相对路径,如果没有复制这个plugins文件夹,就需要指向插件路径。
3.2 修改 nutch-site.xml
如图:这里agent的value需要和 nutch-default.xml 里面的值一样。。
经过以上配置,即可在eclipse里运行nutch1.3了
相关文章推荐
- Linux下将Nutch1.3导入eclipse
- nutch 1.7 导入 eclipse 其他版本亦可参考。
- 从windows中导入Eclipse工程到Linux出现乱码的解决办法
- Nutch1.12源代码导入Eclipse 报错The type java.nio.file.Path cannot be resolved.
- [置顶] 开源项目XXL-JOB源码的导入及在eclipse下的配置
- Linux上 Nutch 1.3 + Solr 3.4.0 + Tomcat6.0 搜索引擎单节点搭建笔记
- Linux下, Hadoop2.6.0源代码导入Eclipse
- Hadoop源码导入eclipse及怎么通过pietty连接linux
- 最近遇到nutch导入eclipse后产生到一些问题
- CentOS 6.5 eclipse导入nutch-1.4
- nutch1.3与solr3.4集成部署在eclipse上之——运行的输出日志
- 路径原因[置顶] Android导入项目后报错红色的感叹号或者重新启动eclipse也报红色的感叹号
- [置顶] Linux下基于eclipse的C++工程调用caffe的c++接口
- nutch-1.0.war 解压后导入eclipse的一个小问题
- 《Nutch笔记》eclipse导入nutch-1.7
- nutch 2.* 导入eclipse
- eclipse导入nutch代码
- nutch 1.7导入Eclipse
- Linux上 Nutch 1.3 + Solr 3.4.0 + Tomcat6.0 搜索引擎单节点搭建笔记
- [置顶] eclipse导入包