您的位置:首页 > 运维架构 > 网站架构

架构学习笔记—facebook

2011-10-11 08:52 363 查看
Facebook是一个社会化网络站点,它于2004年2月4日上线。每个用户在facebook上有自己的档案和个人页面,用户之间可以通过各种方式发生互动:留言、发站内信,评论日志。虽然目前在国内无法访问facebook,但其强悍的技术架构还是值得我们去研究分析和总结的,或许我们可以从中得到一点启发。另外,本文很多内容也是来自互联网,如有侵权方面的内容请留言,我会及时处理。

facebook的设计原则是模块化原则、整合化原则、清晰化原则,其架构设计的目标是简单、高效。facebook的架构是基于LAMP,差不多是用LAMP实现的最大的动态站点,以下是facebook架构图概览



PHP经验:

为什么 Facebook 选择 PHP 而不是其他语言? 用Flickr
Cal Henderson 这句话就能说明了: "Languages's don't Scale, Architecture Scale"。

MySql经验:

主要用于做Key-Value类型的存储操作,数据随机分布在多台逻辑实例上,访问多数基于全局ID。

逻辑实例分散在多台物理主机上(超过1800台),负载均衡在物理层进行。

不做读复制。尽量不做逻辑数据迁移(成本太高)。

不做JOIN操作(豆瓣在QCon上也阐述了这一点)。数据是随机分布的,关联操作反而带来了极大的复杂度。

对于数据访问,主要的操作集中在最新的数据上,针对这部分做优化,旧的数据进行归档。

在中心DB绝不存储非静态数据。

使用服务或者Memcached进行全局查询。

Memcached经验:

一个比较有价值的是关于个人页面数据的获取的描述。这个就完全是需要做单页面Benchmark的细致活儿了,可能还需要产品经理能够理解工程师的"抵抗"。

获取个人信息数据:通过Cache,隐性通过用户所在的DB获取(基于User-ID获知DB)

获取朋友连接信息:通过Cache,否则的话通过DB(基于User-ID获知DB)

并行抓取每个朋友的10个照片相册ID,从Cache抓取,如果失效,再从DB抓取(基于相册ID)

并行抓取最近相册中的照片数据

运行PHP把整个业务逻辑跑出来

FacebookNewsFeed的架构示意图:



Facebook搜索功能的架构示意图



补充:摘自http://www.itivy.com/ivy/archive/2011/3/8/634352029306549007.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: