技术文章 | 系统稳定性保障核武器——全链路压测
2017-08-10 14:05
901 查看
本文来源于阿里云-云栖社区,原文点击这里。
为什么要做全链路压测?
对阿里巴巴而言,每年最重要的一天莫过于双11。这是因为在双11的零点,系统会遭遇史无前例的巨大洪峰流量冲击,保证双11当天系统的稳定性对高可用团队来说是巨大的挑战。在这个挑战中会有很多不确定因素,大致分为两方面:
技术架构带来的不确定性,阿里在08年开始对系统进行拆分,由原有的单一系统拆分成了分布式架构,包括CDN、网关、负载均衡、分布式页面系统等,整体的技术生态十分丰富。分布式环境任意环节出了问题都可能会对系统造成影响;
业务发展带来的不确定性,系统的可用性随着业务增长,面临更严峻的挑战和不确定性。
不确定性带来的系统可用性问题
这些不确定性背后的因素多种多样,既涉及系统容量、业务性能,又涉及基础设施瓶颈、中间件瓶颈和系统之间的依赖影响,并且众多因素缺乏有效的验证手段。事实上,阿里从10年开始就在尝试去解决双11零点的稳定性问题。
线上单机与单系统压测
最初采用的方式是在线上单机的生产环境的压力测试和容量规划,主要采用了四种方式:第一在开始阶段模拟调用者,其中在生产环境中只能模拟只读请求,对写请求需要特定的处理;第二种方式是采用流量录制和回放的方式做压力测试,通过将录制的流量快速率回放
>>>展开全文
为什么要做全链路压测?
对阿里巴巴而言,每年最重要的一天莫过于双11。这是因为在双11的零点,系统会遭遇史无前例的巨大洪峰流量冲击,保证双11当天系统的稳定性对高可用团队来说是巨大的挑战。在这个挑战中会有很多不确定因素,大致分为两方面:
技术架构带来的不确定性,阿里在08年开始对系统进行拆分,由原有的单一系统拆分成了分布式架构,包括CDN、网关、负载均衡、分布式页面系统等,整体的技术生态十分丰富。分布式环境任意环节出了问题都可能会对系统造成影响;
业务发展带来的不确定性,系统的可用性随着业务增长,面临更严峻的挑战和不确定性。
不确定性带来的系统可用性问题
这些不确定性背后的因素多种多样,既涉及系统容量、业务性能,又涉及基础设施瓶颈、中间件瓶颈和系统之间的依赖影响,并且众多因素缺乏有效的验证手段。事实上,阿里从10年开始就在尝试去解决双11零点的稳定性问题。
线上单机与单系统压测
最初采用的方式是在线上单机的生产环境的压力测试和容量规划,主要采用了四种方式:第一在开始阶段模拟调用者,其中在生产环境中只能模拟只读请求,对写请求需要特定的处理;第二种方式是采用流量录制和回放的方式做压力测试,通过将录制的流量快速率回放
>>>展开全文
相关文章推荐
- 长假期间,技术人员如何保障系统稳定?
- 电商架构设计-通过系统和业务拆分,遵循单一职责原则SRP,保障整个系统的可用性和稳定性
- 林昊:用淘宝T4保障系统稳定性 降低运维成本
- 基于Hadoop的云盘系统客户端技术难点之二 HDFS文件系统安全保障
- 高性能高并发系统的稳定性保障
- 技术文章 | Android系统中的进程管理:进程的创建
- 缺陷管理系统相关技术文章收集
- 高性能高并发系统的稳定性保障
- 第八章 交互技术,8.4 Weex 双11会场大规模应用的秒开实战和稳定性保障(作者:鬼道)
- 推荐系统必读的10篇精选技术文章
- 京东618备战技术分享:保障秒杀系统高并发与高性能的11个方法
- 推荐系统--必读的10篇精选技术文章
- 技术文章 |【AI系统首次实现真正自主编程】利用遗传算法_完爆初级程序员
- 技术文章(自动答疑系统)
- 系统稳定性保障核武器——全链路压测
- 高性能高并发系统的稳定性保障
- 微博与Redis系统技术文章记录
- 分布式文件存储系统技术文章集合
- 基于Google的嵌入式系统android开发语音技术(语音搜索,语音朗读文章,语音控制)
- 荐书 | 京东系统质量保障技术实战