云计算之路-阿里云上:节能降耗,希望从此好天气
2013-05-19 20:45
381 查看
现在每天早上起来,最关心的就是阿里云上的天气。可是,中国气象台的天气预报中没有阿里云。于是,只能默默祈祷:蓝天蓝天蓝天。但是,事与愿违,上周还是出现了三天晴转乌云的天气。看来,仅仅祈祷是解决不了问题的。
天气不好,我们不能仅仅责怪乌云,也许乌云的一部分原因是空气污染。除了吐槽、祈祷之外,我们更要通过自身的行动——节能降耗——减少乌云产生的机率。
要做好节能降耗,首先要对症下药。根据上周故障期间对其他可能原因的排除,以及对故障现象的认真分析,我们确信问题肯定与虚拟机的CPU有关。故障期间,网站响应速度很慢,是因为处理用户请求的线程拿不到应有的CPU资源(表现为CPU占用接近0%)而卡在那里。为什么拿不到应有的CPU资源呢?我们猜测有两个可能的原因:1. CPU资源被同一个集群上的其他虚拟机抢占;2. 阿里云底层虚拟化系统认为我们能耗大(CPU占用高),在短时间内故意不分配CPU给我们(依据是在CPU占用接近0%之前,CPU占用接近100%)。
不管是被抢占,还是被限制,但问题总是发生在并发请求多的访问高峰期(CPU消耗大)。也就是说故障发生率与CPU占用率成正比,只要减少CPU占用率,自然就会减少故障发生率。这也是通过我们自身的力量改善天气唯一可以做的地方。
目前我们已经完成了第一阶段的优化工作——优化正则表达式的处理(正则表达式是耗CPU的大户)。
接下来,我们还要进行一系列节能降耗的优化工作,有些涉及到程序的大改动。
当初决定走上云计算之路,我们没有给自己留退路,迎难而上、解决问题是我们的唯一选择。
当刚发明电的时候,正因为很多有信念的人解决了发电、输电、用电中的各种问题,才开启了电气时代;同样,云计算时代不是等来的,不是抱怨出来的,而是通过解决无数个问题之后开创出来的。
云计算之路,希望得到大家的更多理解与支持!
天气不好,我们不能仅仅责怪乌云,也许乌云的一部分原因是空气污染。除了吐槽、祈祷之外,我们更要通过自身的行动——节能降耗——减少乌云产生的机率。
要做好节能降耗,首先要对症下药。根据上周故障期间对其他可能原因的排除,以及对故障现象的认真分析,我们确信问题肯定与虚拟机的CPU有关。故障期间,网站响应速度很慢,是因为处理用户请求的线程拿不到应有的CPU资源(表现为CPU占用接近0%)而卡在那里。为什么拿不到应有的CPU资源呢?我们猜测有两个可能的原因:1. CPU资源被同一个集群上的其他虚拟机抢占;2. 阿里云底层虚拟化系统认为我们能耗大(CPU占用高),在短时间内故意不分配CPU给我们(依据是在CPU占用接近0%之前,CPU占用接近100%)。
不管是被抢占,还是被限制,但问题总是发生在并发请求多的访问高峰期(CPU消耗大)。也就是说故障发生率与CPU占用率成正比,只要减少CPU占用率,自然就会减少故障发生率。这也是通过我们自身的力量改善天气唯一可以做的地方。
目前我们已经完成了第一阶段的优化工作——优化正则表达式的处理(正则表达式是耗CPU的大户)。
接下来,我们还要进行一系列节能降耗的优化工作,有些涉及到程序的大改动。
当初决定走上云计算之路,我们没有给自己留退路,迎难而上、解决问题是我们的唯一选择。
当刚发明电的时候,正因为很多有信念的人解决了发电、输电、用电中的各种问题,才开启了电气时代;同样,云计算时代不是等来的,不是抱怨出来的,而是通过解决无数个问题之后开创出来的。
云计算之路,希望得到大家的更多理解与支持!
相关文章推荐
- 云计算之路-阿里云上:为什么看不见CPU在坐过山车,磁盘IO在蹦极
- 云计算之路-阿里云上-幸福没那么容易:“黑色1秒”又出现了
- 云计算之路-阿里云上:神奇的“黑色30秒”再次出现,究竟是谁的错?
- 云计算之路-阿里云上:结合IIS日志分析“黑色30秒”问题
- 云计算之路-阿里云上-新车限行:新购服务器无法访问任何远程25端口
- 云计算之路:使用阿里云的最大障碍竟然是百度
- 云计算之路-阿里云上:节点 CPU 波动引发 docker swarm 集群故障
- 云计算之路-阿里云上:读取缓存时的“黑色0.1秒”
- 云计算之路-阿里云上:启用Windows虚拟内存引发的CPU 100%故障
- 云计算之路-阿里云上-新车限行:新购服务器无法访问任何远程25端口
- 阿里云大数据计算平台的自动化、精细化运维之路
- 云计算之路-阿里云上:愚人节被阿里云OCS愚
- 云计算之路-阿里云上:负载均衡的小感冒,我们早就感觉到
- 云计算之路-阿里云上:“黑色10秒钟”的新进展
- 云计算之路-阿里云上:对“黑色n秒”问题的最终猜想——CPU C-states引起的
- 云计算之路-阿里云 vs Azure:创建Windows虚拟机
- 云计算之路-阿里云上:在SLB上部署https遇到的问题及解决方法
- 云计算之路-阿里云上:14:20-14:55博客后台2台服务器都CPU 100%引发的故障
- 云计算之路-阿里云上-阵雨:RDS故障的突袭