ThinkPHP3.2添加scws中文分词
2017-04-11 16:15
405 查看
前言
前一段时间,公司网站做站内搜索,只简单针对输入的文字进行搜索,作全匹配检索,搜索出来的内容很少。如何达到模糊搜索,匹配到更多的内容成了需要解决的问题。于是,今天想到可以做分词检索,如何对输入的一段文字进行分词就是关键,本着不做轮子的想法网上找找,还真有一些分词方案scws中文分词。
正文
1.引入PSCWS4文件包和XDB词典文件(utf-8),放进Vendor文件夹:2.通过PSCWS4工具类进行分词操作:
//搜索页面 public function searched($keyword,$type=0,$page=1){ $keyword = rawurldecode($keyword); Vendor('scws.pscws4'); $pscws = new \PSCWS4(); $pscws->set_dict(VENDOR_PATH.'scws/lib/dict.utf8.xdb'); $pscws->set_rule(VENDOR_PATH.'scws/lib/rules.utf8.ini'); //$keywords='第三方中文分词'; $pscws->set_ignore(true); $pscws->send_text($keyword); $words = $pscws->get_tops(5); $tags = array(); foreach ($words as $val) { $tags[] = $val['word']; } $pscws->close(); }
其中,$tag就是所得的分词。
相关文章推荐
- Thinkphp3.2使用scws中文分词 提取关键词
- SCWS中文分词,向xdb词库添加新词
- SCWS中文分词,向xdb词库添加新词
- 为nutch 添加中文分词插件
- scws简易中文分词系统
- php实现 scws中文分词的搜索
- SCWS 中文分词
- 简易中文分词 (SCWS) ver 3.1/2.1 (实例演示)
- 开源免费的简易中文分词系统SCWS – PHP版
- 中文分词技术之SCWS 中文分词
- SCWS中文分词
- Solr4.4部署在Tomcat7中并且添加中文分词
- 为Nutch 1.0添加JE中文分词
- WinXP+cygwin+eclipse配置nutch-1.2,添加IKAnalyzer中文分词
- 改写lucene的Analyzer,添加自己的中文分词系统的方法
- nutch-1.0添加JE中文分词-修改源码…
- je-analysis-1.4.0中文分词添加自己的词库
- Nutch1.2 添加IKAnalyzer中文分词
- Nutch成功添加中文分词
- SCWS中文分词,demo演示