中文分词技术之SCWS 中文分词
2013-01-14 18:33
309 查看
1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。 目前支持 PHP-4.4.x 和 PHP-5.2.x 系列,下载地址分别为: php-4.4.x: http://www.xunsearch.com/scws/down/php-4.4.x/php_scws.dll php-5.2.x: http://www.xunsearch.com/scws/down/php-5.2.x/php_scws.dll php-5.3.x: http://www.xunsearch.com/scws/down/php-5.3.x/php_scws.dll 2. 将下载后的 php_scws.dll 放到 php 安装目录的 extensions/ 目录中去(通常为:X:/php/extensions/或 X:/php/ext/)。 3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 4. 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2 5. 从 scws 主页上下载规则集文件,解压后将 *.ini 放到第 3 步建立的目录 规则集文件压缩包:http://www.xunsearch.com/scws/down/rules.tgz 解压后有三个文件分别为 rules.ini rules.utf8.ini rules_cht.utf8.ini 将三件文件拷到第 3 步所述的目录中 6. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录, 在 php.ini 的末尾加入以下几行: [scws] ; ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空, ; 再把 php_scws.dll 指定为绝对路径。 ; extension = php_scws.dll scws.default.charset = gbk (或utf8) scws.default.fpath = "c:/program files/scws/" 5. 重开 web 服务器即可完成。
相关文章推荐
- 中文分词技术(中文分词原理)
- 中文分词技术介绍
- php中文分词系统SCWS的用法
- SCWS中文分词
- 简易中文分词 (SCWS) ver 3.1/2.1 (实例演示)
- PHP做中文分词技术
- 搜索引擎技术揭密:中文分词技术
- 中文搜索引擎技术揭密:中文分词
- 中文分词技术比较:单字切分 vs 中文分词
- 搜索引擎技术揭密:中文分词技术
- 中文分词技术
- 中文分词技术(一)
- 中文分词技术(中文分词原理)
- php中文分词系统SCWS的用法
- PHP+mysql数据库开发搜索功能:中英文分词+全文检索(MySQL全文检索+中文分词(SCWS))
- 中文分词技术(中文分词原理)
- 中文搜索引擎技术揭密:中文分词
- 中文搜索引擎技术揭密:中文分词
- NLP︱中文分词技术小结、几大分词引擎的介绍与比较
- php中文分词系统SCWS的用法