中文分词思想scws
2017-06-13 01:00
183 查看
中文分词
scws是一个中文分词的工具
原理
步骤
将一张表导入数据数据库,文章表
我们要搜一个文章已经存在的词,通过这个词找到这个文章
我添加到数据库一篇文章的时候,就将文章中的一些词提取出来,并保存到一张索引表中,两个字段,第一个是存储词的字段word,第二个是对应文章的标题的编号id,当用户搜这篇文章的时候,就会去搜索引表,而不是文章表.
搜索语句如下
select * from article_index where word= '工作';
select * from article where id=1;
这两条语句要比直接去文章表中搜一个词要快,
我们创建索引表的时候,会有一个词库的概念,这些词库是一些公司做的,
scws是中文分词工具,他是PHP写的,需要将类引入就行了,
1.引入类文件
2.实例化对象
3设置字符集
4设置规则
5忽略标点符号
6发送字符串
7获取所有的结果
8关闭对象
9.将数据结果return出去
10使用7中获取到的结果
scws是一个中文分词的工具
原理
步骤
将一张表导入数据数据库,文章表
我们要搜一个文章已经存在的词,通过这个词找到这个文章
我添加到数据库一篇文章的时候,就将文章中的一些词提取出来,并保存到一张索引表中,两个字段,第一个是存储词的字段word,第二个是对应文章的标题的编号id,当用户搜这篇文章的时候,就会去搜索引表,而不是文章表.
搜索语句如下
select * from article_index where word= '工作';
select * from article where id=1;
这两条语句要比直接去文章表中搜一个词要快,
我们创建索引表的时候,会有一个词库的概念,这些词库是一些公司做的,
scws是中文分词工具,他是PHP写的,需要将类引入就行了,
1.引入类文件
2.实例化对象
3设置字符集
4设置规则
5忽略标点符号
6发送字符串
7获取所有的结果
8关闭对象
9.将数据结果return出去
10使用7中获取到的结果
相关文章推荐
- 编译PHP的SCWS中文分词扩展
- 开源php中文分词系统SCWS安装和使用实例_php实例
- 简易中文分词 (SCWS) ver 3.1/2.1 (实例演示)
- 中文分词技术之SCWS 中文分词
- scws简易中文分词系统
- php中文分词系统SCWS的用法
- php中文分词系统SCWS的用法
- 中文分词插件SCWS-1.2.3 在Linux环境的安装说明(包括php扩展)
- 开源php中文分词系统SCWS安装和使用实例
- PHP中文分词扩展 SCWS
- 中文分词消除歧义简单思想
- 开源免费的简易中文分词系统SCWS – PHP版
- SCWS中文分词,功能函数实例应用
- php中文分词系统SCWS的用法
- php中文分词系统SCWS的用法
- php+中文分词scws+sphinx+mysql打造千万级数据全文搜索
- scws中文分词组件
- 【Rosseta中文分词】python下利用HMM思想进行中文分词
- SCWS中文分词,安装说明(以:Win32环境、utf8字符集为例)
- php中文分词系统SCWS的用法