您的位置:首页 > 编程语言 > PHP开发

php学习心历(2)-中文分词

2015-06-22 00:00 525 查看
需要实现一个查询数据库的功能,要求是实现中文的模糊查询。

首先想到的是直接构建sql语句进行查询就好了,sql语句本身就提供了模糊查询的功能,但是我利用中括号对关键字进行处理之后发现根本没用用,发现数据库根本就没有把中括号当特殊符号进行处理。后来才发现原来是因为数据库的原因,mysql数据库是不支持中括号查询的,进一步了解之后发现mysql也能支持模糊查询,不过使用的是正则的方式,使用关键字regexp进行查询。形如:select * from table_name where name regexp "reg"; reg代表正则表达式。

但是后来有发现了一个问题,即是使用正则进行中文匹配经常出来一些意想不到的结果。后来想想还是用分词的方法比较靠谱,搜索结果也比较人性化,对分词的结果进行like查询就好了。于是在网上找了个分词库还比较好用,就保存下来了。

在分词库的文件夹下有一个.class.php的实现源文件,目录下有一个编译好的字典文件,其中包含了所有的中文词语。还有一个index.php文件提供了一个使用的例子。还有一个rebuild.php文件可以将字典文件重新编译,可以在字典中加入一些特有的词语,然后调用这个文件进行编译。

下载链接:http://download.csdn.net/detail/bai12345633/8827945
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: