您的位置:首页 > 其它

【搜索整理】Sphinx支持搜索某些特殊字符

2013-08-05 14:29 260 查看
Sphinx支持搜索某些特殊字符,需要把那些特殊字符添加到Sphinx配置文件的charset_table中。

添加Unicode码,否则类似#在Sphinx看来是注释的字符将无法添加到charset_table当中。

例如:

-----------------------------------------------------------------------------------------------------------------------------------------------用sphinx进行索引并搜索的时候出现了以下情况:

1.搜索“C#”出来的却是包含“C”的记录

2.搜索“C#源码”出来的却是包含“C*源码”的记录,这里的*代表任意字符,而把中间的#给忽略掉了

修改:

我们打开sphinx索引的配置文件,找到“charset_table = ”,在里面增加“U+0023”其中“0023”是“#”的16进制ASCII值。

如需其他字符相应添加即可。



忽略某些字符:

ignore_chars=
-
#忽略掉-,即搜索“abc-def”的时候出现“abcdef”的结果。


-----------------------------------------------------------------------------------------------------------------------------------------------


资料:

Unicode码查询地址http://www.unicode.org/charts/

ASCII码对应的Unicode的链接是:http://www.unicode.org/charts/PDF/U0000.pdf
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: