【搜索引擎基础知识1】搜索引擎基本架构
2015-06-17 10:29
585 查看
(一)搜索引擎的开发一般可分为以下三大部分
1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi
2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene
3、视图层:也用户的交互界面,如一个网站的首页
其基本架构可参考下图:
1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi
2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene
3、视图层:也用户的交互界面,如一个网站的首页
其基本架构可参考下图:
相关文章推荐
- 《大型网站技术架构》1:概述
- 5月钓鱼网站简报:共处理钓鱼网站2483个 环比下降
- PayPal网站付款标准版(for PHP)
- MVC架构设计参考
- 大型网站关键技术
- php使用curl打开https网站的方法
- solr 学习网站
- 网站变灰代码
- 架构师速成3-开发者境界
- 架构师速成3-开发者境界 分类: 架构师速成 2015-06-17 09:14 173人阅读 评论(0) 收藏
- 网站接入支付宝实例教程
- 2015最新百度网站排名技巧_绍兴SEO博客出品
- 【Android系统】Android系统架构简介
- keepalive构建高可用LVS集群
- php网站密码md5加密串比较方式
- 搭建属于你的网站 记录下搭建个人网站探索之旅
- php使用curl打开https网站的方法
- CodeIgniter实现从网站抓取图片并自动下载到文件夹里的方法
- 2015061605 - 网站前后台数据传递方法
- 学习编程好网站