[导入]Paoding中文分词器使用总结(Lucene)
2008-07-05 12:20
190 查看
作者: yagesi
链接:http://yagesi.javaeye.com/blog/165001
发表时间: 2008年02月26日
声明:本文系JavaEye网站发布的原创博客文章,未经作者书面许可,严禁任何网站转载本文,否则必将追究法律责任!
感觉Paoding中文分词器应该是在LINUX下开发的,所以我在使用的时候,遇到了不少让人郁闷的事情:
首先是需要设置Paoding词典到我们的系统环境变量,该词典就在Paoding的dic 文件夹里,把它设置到环境变量中,变量名是PAODING_DIC_HOME,这里要注意:DIC的路径不能包含中文,标点,空格...我当时设置的时候就让我郁闷了一把.
然后,再使用的时候,你需要将Paoding的5个jar包拷贝到你的工程中去,但是要注意你工程的路径,如果你发布的是WEB工程,记得你的服务器路径也不能包含中文空格,之前我的路径是
g:\Tomcat 6.0就不行,被迫改成了g:\Tomcat
如果上面设置没问题,就可以使用Paoding进行搜索开发了,但是在建立索引的时候你可能还会遇到 java.io.File.setWritable(Z)Z异常问题,这个一般是你JDK的问题,升级下你JDK的版本.
我就遇到过很奇怪的问题,我使用JDK1.5一直没问题,但是有一天突然爆了这个错误,让我郁闷,最后升级了个JDK,问题就解决了....
谢谢
本文的讨论也很精彩,浏览讨论>>
JavaEye推荐
快来参加7月17日在成都举行的SOA中国技术论坛
搜狐网站诚聘Java、PHP和C++工程师
JavaEye问答大赛开始了! 从6月23日 至 7月6日,奖品丰厚 !
北京: 千橡集团暨校内网诚聘软件研发工程师
Oracle专区上线,有Oracle最新文章,重要下载及知识库等精彩内容,欢迎访问。
文章来源:http://yagesi.javaeye.com/blog/165001
链接:http://yagesi.javaeye.com/blog/165001
发表时间: 2008年02月26日
声明:本文系JavaEye网站发布的原创博客文章,未经作者书面许可,严禁任何网站转载本文,否则必将追究法律责任!
感觉Paoding中文分词器应该是在LINUX下开发的,所以我在使用的时候,遇到了不少让人郁闷的事情:
首先是需要设置Paoding词典到我们的系统环境变量,该词典就在Paoding的dic 文件夹里,把它设置到环境变量中,变量名是PAODING_DIC_HOME,这里要注意:DIC的路径不能包含中文,标点,空格...我当时设置的时候就让我郁闷了一把.
然后,再使用的时候,你需要将Paoding的5个jar包拷贝到你的工程中去,但是要注意你工程的路径,如果你发布的是WEB工程,记得你的服务器路径也不能包含中文空格,之前我的路径是
g:\Tomcat 6.0就不行,被迫改成了g:\Tomcat
如果上面设置没问题,就可以使用Paoding进行搜索开发了,但是在建立索引的时候你可能还会遇到 java.io.File.setWritable(Z)Z异常问题,这个一般是你JDK的问题,升级下你JDK的版本.
我就遇到过很奇怪的问题,我使用JDK1.5一直没问题,但是有一天突然爆了这个错误,让我郁闷,最后升级了个JDK,问题就解决了....
谢谢
本文的讨论也很精彩,浏览讨论>>
JavaEye推荐
快来参加7月17日在成都举行的SOA中国技术论坛
搜狐网站诚聘Java、PHP和C++工程师
JavaEye问答大赛开始了! 从6月23日 至 7月6日,奖品丰厚 !
北京: 千橡集团暨校内网诚聘软件研发工程师
Oracle专区上线,有Oracle最新文章,重要下载及知识库等精彩内容,欢迎访问。
文章来源:http://yagesi.javaeye.com/blog/165001
相关文章推荐
- JAVA_WEB项目之Lucene使用中文分词器IKAnalyzer3.2.8
- lucene应用心得以及几种中文分词器的使用比对
- lucene集成ikanalyzer中文分词器插件;Analyzer使用时机
- lucene使用IKAnalyzer3.2.5中文分词器进行索引的一个小例子
- Lucene2.0中使用基于词典的中文分词器建立索引
- 11大Java开源中文分词器的使用方法和分词效果对比,当前几个主要的Lucene中文分词器的比较
- Lucene中使用Paoding中文分词
- 11大Java开源中文分词器的使用方法和分词效果对比,当前几个主要的Lucene中文分词器的比较
- Lucene中使用Paoding中文分词
- Lucene中使用Paoding中文分词
- Lucene中使用Paoding中文分词
- lucene 4.x 使用N-Gram模型分词器实例。
- 当前几个主要的Lucene中文分词器的比较
- 详解庖丁解牛中文分词器工具的使用
- [转]使用lucene 3.0.0 索引和检索中文文件
- Oracle10g 数据泵导入命令 impdp 使用总结
- solr 7+tomcat 8 + mysql实现solr 7基本使用(安装、集成中文分词器、定时同步数据库数据以及项目集成)
- solr下配置安装中文分词器和批量导入数据
- [导入]sql server中分布式查询随笔(链接服务器(sp_addlinkedserver)和远程登录映射(sp_addlinkedsrvlogin)使用小总结)