您的位置：首页 > 其它

搜索引擎整体结构图以及描述

2015-08-02 16:40 232 查看

搜索引擎整体结构图：

爬虫从 Internet 中爬取众多的网页作为原始网页库存储于本地，然后网页分析器抽取网页中的主题内容交给分词器进行分词，得到的结果用索引器建立正排和倒排索引，这样就得到了索引数据库，用户查询时，在通过分词器切割输入的查询词组并通过检索器在索引数据库中进行查询，得到的结果返回给用户。

无论搜索引擎的规模大小，其主要结构都是由这几部分构成的，并没有大的差别，搜索引擎的好坏主要是决定于各部分的内部实现。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

华为是怎样研发的（12）——FMEA分析
LightOJ_1422_HalloweenCostumes
ArcGIS for Service中JavaScript预览在内网环境无法使用
九度OJ 题目1012：畅通工程（并查集,连通子图）
客户管理系统案例总结
高清屏的背景图片适配
C++ 常见面试题目（二）
cassandra counter 类型使用注意事项
HDU 2255 — 奔小康赚大钱 KM入门题
服务层的必要性
TCP建立连接和释放的过程，及TCP状态变迁图
第一篇博文：PHP函数原型中的可选参数写法为什么这么写？
用python加cPAMIE加pyinstaller为我柱哥点赞
【leetcode】Implement Queue using Stacks
leetcode 抢房子House Robber
C语言编程入门——指针（上）
Excel数据导入导出
点分治小结
tomcat发布后,没有class文件,只有项目目录和properties,xml之类的文件解决办法
NIM 博弈

新的分享

一次教科书级别的Redis高可用架构设计实践 - Redis
曾光：北京这次的毒株不像国内流行类型
从PRD文档到产品上线，有哪些问题需要解决？
vue3自定义指令的使用
Oracle SQL性能优化最常用的40条建议 - ORACLE
程序员翻车常见反应，你中枪了吗？ - 职场生涯
新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
嵌入式软件开发之程序架构设计-任务调度
【Java面试】请简单说一下你对受检异常和非受检异常的理解
奇安信更新招股书：第一季亏损过5亿，齐向东持股38%
艾瑞咨询：2020年中国后智能厨房案例研究报告
艾瑞咨询：2020年中国人工智能+物流发展研究报告

章节导航