Ubuntu环境下Nutch+Tomcat 搭建简单的搜索引擎
2015-01-21 16:50
399 查看
简易的搜索引擎搭建
我的配置:
Nutch:1.2
Tomcat:7.0.57
[b]1 Nutch设置[/b]
修改Nutch配置
1.1 修改conf/nutch-site.xml
View Code
[b]3 开始实验[/b]
重启tomcat
通过浏览器访问:http://localhost:8080/nutch-1.2
我的配置:
Nutch:1.2
Tomcat:7.0.57
[b]1 Nutch设置[/b]
修改Nutch配置
1.1 修改conf/nutch-site.xml
Metadata metaData = bean.getParseData(details).getContentMeta(); ParseData ParseData = bean.getParseData(details); String content = null; // String contentType = (String) metaData.get(Metadata.CONTENT_TYPE); String contentType = ParseData.getMeta(Metadata.CONTENT_TYPE); if (contentType.startsWith("text/html")) { // FIXME : it's better to emit the original 'byte' sequence // with 'charset' set to the value of 'CharEncoding', // but I don't know how to emit 'byte sequence' in JSP. // out.getOutputStream().write(bean.getContent(details)) may work, // but I'm not sure. //String encoding = (String) metaData.get("CharEncodingForConversion"); String encoding = ParseData.getMeta("CharEncodingForConversion"); if (encoding != null) { try { content = new String(bean.getContent(details), encoding); } catch (UnsupportedEncodingException e) { // fallback to windows-1252 content = new String(bean.getContent(details), "windows-1252"); } } else content = new String(bean.getContent(details),"GBK"); //content = new String(bean.getContent(details));
View Code
[b]3 开始实验[/b]
重启tomcat
通过浏览器访问:http://localhost:8080/nutch-1.2
相关文章推荐
- Linux上 Nutch 1.3 + Solr 3.4.0 + Tomcat6.0 搜索引擎单节点搭建笔记
- 信息检索大作业:在Windows XP上搭建 nutch-0.9 搜索引擎环境
- Ubuntu12搭建nutch1.2+tomcat7+jdk1.6
- Ubuntu搭建Tomcat环境
- Ubuntu搭建Tomcat环境
- ubuntu上搭建配置mysql和tomcat测试环境
- Ubuntu下Intellij IDEA 13+Tomcat8开发环境搭建
- Ubuntu搭建Tomcat环境
- Nutch学习之Win7环境下在eclipse中搭建Nutch+solr+tomcat
- Ubuntu搭建Tomcat环境
- Linux上 Nutch 1.3 + Solr 3.4.0 + Tomcat6.0 搜索引擎单节点搭建笔记
- ubuntu下搭建eclipse+tomcat的web开发环境
- 最简单的Go环境搭建(Ubuntu)
- Ubuntu搭建Tomcat环境
- Ubuntu下JDK+Tomcat+MySql环境的搭建
- Solr学习笔记一 ---Solr运行环境搭建(tomcat7 + solr 3.5 +ubuntu 10.04)
- windows XP下nutch-1.0搜索引擎环境搭建
- Ubuntu下 Tomcat + JSF + Ant + eclipse 开发环境搭建
- Ubuntu搭建Tomcat环境
- Ubuntu搭建Tomcat环境