关于基于postgresQL的中文全文检索感受
2011-11-19 17:14
211 查看
最近一个多礼拜,通过对基于PostgreSQL的全文检索的安装和使用。发现一个问题:
就是中文分词技术还是很难的,包括分词的技巧和如何进行分词。例如:
“2011新款”这个词,使用bamboo时,该分词建立索引有两种形式分别为2011、新款;2011、新、款。
如果在查询时,这个"2011新款"词,将只能查出其中的一条记录。
待续……
就是中文分词技术还是很难的,包括分词的技巧和如何进行分词。例如:
“2011新款”这个词,使用bamboo时,该分词建立索引有两种形式分别为2011、新款;2011、新、款。
如果在查询时,这个"2011新款"词,将只能查出其中的一条记录。
待续……
相关文章推荐
- 基于postgreSQL9.1的中文全文检索(基于Linux)
- 基于postgreSQL9.1的中文全文检索(基于Linux)
- PostgreSQL的全文检索中文分词(2)-NlpBamboo
- 使用PostgreSQL进行中文全文检索
- 基于Sphinx的中文全文检索引擎Coreseek的安装
- PHP基于Sphinx+Swcs中文分词的全文的检索
- PostgreSQL的全文检索中文分词(1)-NlpBamboo
- 基于Sphinx的中文全文检索引擎Coreseek的安装
- 借助 NlpBamboo 中文分词打造 PostgreSQL 的全文检索
- 基于Sphinx的中文全文检索引擎Coreseek的安装
- 基于MySQL数据库的UTF8中文网站全文检索的实现
- 基于MySQL数据库的UTF8中文网站全文检索的实现
- 全文检索4(关于中文分词ICTCLAS分词系统)
- PostgreSQL的中文全文检索
- 关于基于elasticsearch的全文检索 建立索引 查询
- PostgreSQL chinese full text search 中文全文检索
- 基于MySQL数据库的UTF8中文网站全文检索的实现
- 全文检索引擎Solr系列——整合中文分词组件IKAnalyzer
- Lucene:基于Java的全文检索引擎简介
- Lucene:基于Java的全文检索引擎简介