您的位置:首页 > 运维架构 > 网站架构

记一次学习冯大辉的网站运维之道

2016-07-28 16:47 295 查看
(1)要保证网站可用性,以前的衡量标准是7X24,现在讲究4个9,4个9的意思是网站在99.99的时间里能够正常运行和访问,这就达到了基本可用性
(2)需要有监控,监控你网站的磁盘,cpu,内存,流量,磁盘I/O等一些性能指标,来及时能够发现问题,但是光有监控还不行,必须有强大的报警机制,如果说你光有监控,没有报警那么监控也就是形同虚设了,出了问题第一时间不能够及时解决,可能就摊上事了。现在常用的监控软件就是Cacti,Nagios,Zabbix,Cacti比较侧重流量监控,Nagios报警功能强大,Zabbix是分布式监控,最好可以设置短信网关,用短信来实时报警。
(3)容量规划,要搭建一个web网站,得考虑将来业务的发展,即使不能考虑的很久远,也应该未来一段时间内可以稳定的运行,不再需要任何大的调整。
(4)流程规范,在网站服务器上的每一个操作都可能导致网站不可用,要是这个网站是一个人在维护,那还好,自己养成一个良好的习惯,可恢复,有备份就可以。但是假如是一个团队的话就得靠流程来约束了,但是不能整一套大而空的东西进来,规范的最终目的是为了运维团队更快而不是变成束缚。所以,千万要避免技术人员对规范的抵触。
(5)文档,这份文档应该i贯穿网站建设的始终,逐渐丰富完善的。有了这份文档,就相当于自己知识的传递和积累。对待知识要有分享精神,而不是光会拿来主义。
(6)自动化,自动化是网站规模化后必须要面对的一个问题。自动化的主要目的是为了节省运维成本,提升运维成熟度能力。自动化针对的范围大致可以分为安装自动化,部署自动化,软件发布自动化,升级自动化,监控自动化等几个方面。自动化要解决的问题是N次循环的过程。如果这个N不具备延续性,那么自动化未必有必要。

本文出自 “庭中有奇树” 博客,请务必保留此出处http://zhangdl.blog.51cto.com/11050780/1831312
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: