您的位置:首页 > 其它

[导入]Paoding中文分词器使用总结(Lucene)

2008-07-05 12:20 190 查看
作者: yagesi
链接:http://yagesi.javaeye.com/blog/165001
发表时间: 2008年02月26日

声明:本文系JavaEye网站发布的原创博客文章,未经作者书面许可,严禁任何网站转载本文,否则必将追究法律责任!

感觉Paoding中文分词器应该是在LINUX下开发的,所以我在使用的时候,遇到了不少让人郁闷的事情:
首先是需要设置Paoding词典到我们的系统环境变量,该词典就在Paoding的dic 文件夹里,把它设置到环境变量中,变量名是PAODING_DIC_HOME,这里要注意:DIC的路径不能包含中文,标点,空格...我当时设置的时候就让我郁闷了一把.
然后,再使用的时候,你需要将Paoding的5个jar包拷贝到你的工程中去,但是要注意你工程的路径,如果你发布的是WEB工程,记得你的服务器路径也不能包含中文空格,之前我的路径是
g:\Tomcat 6.0就不行,被迫改成了g:\Tomcat
如果上面设置没问题,就可以使用Paoding进行搜索开发了,但是在建立索引的时候你可能还会遇到 java.io.File.setWritable(Z)Z异常问题,这个一般是你JDK的问题,升级下你JDK的版本.
我就遇到过很奇怪的问题,我使用JDK1.5一直没问题,但是有一天突然爆了这个错误,让我郁闷,最后升级了个JDK,问题就解决了....
谢谢

本文的讨论也很精彩,浏览讨论>>

JavaEye推荐

快来参加7月17日在成都举行的SOA中国技术论坛
搜狐网站诚聘Java、PHP和C++工程师
JavaEye问答大赛开始了! 从6月23日 至 7月6日,奖品丰厚 !
北京: 千橡集团暨校内网诚聘软件研发工程师
Oracle专区上线,有Oracle最新文章,重要下载及知识库等精彩内容,欢迎访问。

文章来源:http://yagesi.javaeye.com/blog/165001
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: