InnoDB全文索引停止词(stopwords)设计的缺陷
2014-05-11 14:23
316 查看
全文索引FULLTEXT首次运用在了InnoDB引擎上,最近在研究过程中发现停止词(stopwords)设计的缺陷。
何为停止词?就是指不想用户在搜索的时候能搜到‘李洪志大师’、‘法轮大法’等词汇,需要事先定义好停止词,这样就不会被搜索到。但设计的缺陷是,你必须事先就定义好,假如日后还想再定义停止词‘活摘器官’,必须重建一次全文索引,如果表很大的话,相当耗费时间。
下面我们看例子,截图如下:
结论:官方MySQL5.6.16和MariaDB10.0.10均有此缺陷,希望在后面的版本里,可以做调整。
本文出自 “贺春旸的技术专栏” 博客,请务必保留此出处http://hcymysql.blog.51cto.com/5223301/1409412
何为停止词?就是指不想用户在搜索的时候能搜到‘李洪志大师’、‘法轮大法’等词汇,需要事先定义好停止词,这样就不会被搜索到。但设计的缺陷是,你必须事先就定义好,假如日后还想再定义停止词‘活摘器官’,必须重建一次全文索引,如果表很大的话,相当耗费时间。
下面我们看例子,截图如下:
结论:官方MySQL5.6.16和MariaDB10.0.10均有此缺陷,希望在后面的版本里,可以做调整。
本文出自 “贺春旸的技术专栏” 博客,请务必保留此出处http://hcymysql.blog.51cto.com/5223301/1409412
相关文章推荐
- MySQL5.7官方文档翻译: InnoDB Full-Text Stopwords
- 停止词(stop words)
- Google的停止词(Stop words)
- Overview of Full Text Stop Words(MSSQL全文索引的干扰词概括)MSSQL 全文索引的最小单词长度
- 利用ftp服务程序本身设计的"缺陷"取得最高权限
- 嵌入式软件设计中查找缺陷的几个技巧(上)
- 多个常见代码设计缺陷
- 12306.cn 的产品技术设计缺陷
- 多线程基础四(二)、能停止的线程(异常法、sleep、return、interrupt、stop)
- InnoDB: Error: innodb_table_stats not found索引表没找到,主从停止
- stop words
- Dynamo一个缺陷的架构设计
- 英特尔【inter】芯片被爆设计缺陷漏洞,引发新一轮互联网安全危机
- Js的10个设计缺陷
- 防火墙普遍存在的设计缺陷--关于进程路径的获取
- 研究:Android有设计缺陷 可窃取用户数据
- 系统Stop 0x00000050(停止 0x00000050)错误的解决
- 爱卡汽车网某重要系统设计逻辑缺陷(成功绕过验证码限制)影响内部敏感信息
- [MySQL优化案例]系列 -- InnoDB主键设计
- 停止Service的stopSelf(int)