您的位置:首页 > 其它

[搜索引擎]Sphinx的介绍和原理探索

2016-09-01 21:40 447 查看


总结:

Sphinx的整个工作流程就是Indexer程序到数据库里面提取数据,对数据进行分词,然后根据生成的分词生成单个或多个索引,并将它们传递给searchd程序。然后客户端可以通过API调用进行搜索。

1、sphinx的两个主要进程indexer和searchd。
indexer任务是从数据库(或者其他的数据源)收集原始的数据,然后建立相应的索引。
searchd则是通过读取indexer建立的索引来响应客户端的请求。
2、sphinx工作前提:配置文件修改
a、需要让其获取数据源从何而来(即:配置source信息)
b、建立索引,对数据源的哪部分数据进行索引等详细信息(即:indexer的所有信息)
c、执行indexer生产索引,最用才启用searchd服务
3、应用主要是通过api接口实现,支持php、perl、python及ruby等语言调用。


原文参考 链接:http://www.cnblogs.com/h-hq/p/5408933.html

mmseg分词算法及实现 http://blog.csdn.net/daniel_ustc/article/details/50488040
CoreSeek(Sphinx)安装与mmseg词库扩展 :http://devzc.com/post/441

sphinx增量索引和主索引来实现索引的实时更新 : http://www.cnblogs.com/mingaixin/p/5085708.html sphinx/coreseek 全中文搜索实现 http://blog.sina.com.cn/s/blog_6bb63c9e0100qjxu.html
使用搜狗词库制作mmseg自定义词典 :http://blog.csdn.net/liumeng305/article/details/47069249

linux下搜索引擎spinx下csft的安装方法 :http://blog.csdn.net/lgm252008/article/details/5383481

sphinx中文分词检索 如何让分词的精确度更高 http://zhidao.baidu.com/question/1861408682587496827.html?qbl=relate_question_1&word=sphinx%20%C8%D5%D6%BE
spinx实时索引 http://www.ttlsa.com/sphinx/sphinx-realtime-search-engines/



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: