您的位置:首页 > 其它

中文分词思想scws

2017-06-13 01:00 183 查看
中文分词
scws是一个中文分词的工具
原理

步骤
将一张表导入数据数据库,文章表

我们要搜一个文章已经存在的词,通过这个词找到这个文章

我添加到数据库一篇文章的时候,就将文章中的一些词提取出来,并保存到一张索引表中,两个字段,第一个是存储词的字段word,第二个是对应文章的标题的编号id,当用户搜这篇文章的时候,就会去搜索引表,而不是文章表.
搜索语句如下
select * from article_index where word= '工作';

select * from article where id=1;

这两条语句要比直接去文章表中搜一个词要快,

我们创建索引表的时候,会有一个词库的概念,这些词库是一些公司做的,

scws是中文分词工具,他是PHP写的,需要将类引入就行了,   

1.引入类文件

2.实例化对象

3设置字符集

4设置规则

5忽略标点符号

6发送字符串

7获取所有的结果

8关闭对象

9.将数据结果return出去

10使用7中获取到的结果
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: