php学习心历(2)-中文分词
2015-06-22 00:00
525 查看
需要实现一个查询数据库的功能,要求是实现中文的模糊查询。
首先想到的是直接构建sql语句进行查询就好了,sql语句本身就提供了模糊查询的功能,但是我利用中括号对关键字进行处理之后发现根本没用用,发现数据库根本就没有把中括号当特殊符号进行处理。后来才发现原来是因为数据库的原因,mysql数据库是不支持中括号查询的,进一步了解之后发现mysql也能支持模糊查询,不过使用的是正则的方式,使用关键字regexp进行查询。形如:select * from table_name where name regexp "reg"; reg代表正则表达式。
但是后来有发现了一个问题,即是使用正则进行中文匹配经常出来一些意想不到的结果。后来想想还是用分词的方法比较靠谱,搜索结果也比较人性化,对分词的结果进行like查询就好了。于是在网上找了个分词库还比较好用,就保存下来了。
在分词库的文件夹下有一个.class.php的实现源文件,目录下有一个编译好的字典文件,其中包含了所有的中文词语。还有一个index.php文件提供了一个使用的例子。还有一个rebuild.php文件可以将字典文件重新编译,可以在字典中加入一些特有的词语,然后调用这个文件进行编译。
下载链接:http://download.csdn.net/detail/bai12345633/8827945
首先想到的是直接构建sql语句进行查询就好了,sql语句本身就提供了模糊查询的功能,但是我利用中括号对关键字进行处理之后发现根本没用用,发现数据库根本就没有把中括号当特殊符号进行处理。后来才发现原来是因为数据库的原因,mysql数据库是不支持中括号查询的,进一步了解之后发现mysql也能支持模糊查询,不过使用的是正则的方式,使用关键字regexp进行查询。形如:select * from table_name where name regexp "reg"; reg代表正则表达式。
但是后来有发现了一个问题,即是使用正则进行中文匹配经常出来一些意想不到的结果。后来想想还是用分词的方法比较靠谱,搜索结果也比较人性化,对分词的结果进行like查询就好了。于是在网上找了个分词库还比较好用,就保存下来了。
在分词库的文件夹下有一个.class.php的实现源文件,目录下有一个编译好的字典文件,其中包含了所有的中文词语。还有一个index.php文件提供了一个使用的例子。还有一个rebuild.php文件可以将字典文件重新编译,可以在字典中加入一些特有的词语,然后调用这个文件进行编译。
下载链接:http://download.csdn.net/detail/bai12345633/8827945
相关文章推荐
- cmd下运行php脚本 不支持curl库的问题
- php字符串处理总结
- PHP爬虫(2)DOM处理
- ContentProvider简要
- Win7中IIS配置php5.6环境
- PHP钩子是什么?
- 利用iptables开放被动模式下的FTP服务
- PHP打印指定日期
- php定时自动执行 需启动第一次
- 使用yii2实现读写分离(MySQL主从数据库)
- PHP多个进程同时写入同一个文件
- PHP实现同一个帐号不允许多人同时重复登陆
- php获取当前是星期几
- 第五天 ThinkPHP手把手快速拼接网站(五)
- wamp的php.ini配置
- 解决PHP后端生成的图片无法使用CDN缓存的方法
- 关于ftp中文本模式和二进制模式上传文件的区别
- php 语法和原理
- Thinkphp3.2.3调用数据库报错解决方法
- php面向对象基础概念(多态)