您的位置:首页 > 其它

liunx性能分析命令之 sar

2012-12-25 16:06 134 查看
sar -b 监控I/O

#sar -b1 10

Linux 2.6.18-53.el5PAE (localhost.localdomain) 03/29/2009

12:19:40AM tps rtps wtps bread/s bwrtn/s

12:19:42 AM 21.48 9.40 12.08 187.92 429.53

12:19:43 AM 14.00 14.00 0.00 840.00 0.00

12:19:44 AM 10.29 8.82 1.47 235.29 217.65

12:19:45 AM 12.87 10.89 1.98 752.48 142.57

12:19:46 AM 19.82 12.61 7.21 425.23 381.98

12:19:47 AM 19.00 19.00 0.00 512.00 0.00

12:19:49 AM 9.29 9.29 0.00 262.86 0.00

12:19:50 AM 16.00 5.00 11.00 144.00 536.00

12:19:51 AM 17.65 8.82 8.82 211.76 235.29

12:19:52 AM 41.41 29.29 12.12 614.14 363.64

Average: 17.75 12.30 5.45 397.19 231.99

-tps:每秒钟对磁盘发送transfer的总数,一个 transfer就是一个I/O,多个逻辑请求组合成一个对磁盘的I/O请求,一个transfer的大小不确定。

-rtps:每秒钟的物理读的总数

-wtps:每秒钟的物理写的总数

-bread/s:每秒钟从磁盘读取的数据总数

-bwrtn/s:每秒钟写入磁盘的数据的总数

sar -d 1 10

Linux 2.6.18-53.el5PAE (localhost.localdomain) 03/29/2009

12:38:56 AM DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util

12:38:57 AM dev8-0 15.00 232.00 0.00 15.47 0.01 0.87 0.87 1.30

12:38:57 AM dev8-16 6.00 80.00 320.00 66.67 0.05 8.67 8.67 5.20

12:38:57 AM dev8-32 10.00 224.00 0.00 22.40 0.09 9.20 9.20 9.20

tps:每秒钟对磁盘发送transfer的总数,一个transfer就是一个I/O,多个逻辑请求组合成一个对磁盘的I/O请求,一个 transfer的大小不确定

rd_sec/s

每秒钟读取的扇区数,每个扇区512 bytes.

wr_sec/s

每秒钟写入的扇区数,每个扇区512 bytes.

avgrq-sz

对磁盘请求的扇区的平均大小。

avgqu-sz

对磁盘请求的平均队列长度.

await

请求响应的平均时间(毫秒).包括在请求队列中的时间和响应消耗时间

svctm

对IO请求的服务时间.

%util

I/O请求占用的CPU时间百分比。

sar[options] [-A] [-o file] t

在命令行中,n 和t 两个参数组合起来定义采样间隔和次数,t为采样间隔,是必须有

的参数,n为采样次数,是可选的,默认值是1,-o file表示将命令结果以二进制格式

存放在文件中,file 在此处不是关键字,是文件名。options 为命令行选项,sar命令

的选项很多,下面只列出常用选项:

-A:所有报告的总和。

-u:CPU利用率

-v:进程、I节点、文件和锁表状态。

-d:硬盘使用报告。

-r:内存和交换空间的使用统计。

-g:串口I/O的情况。

-b:缓冲区使用情况。

-a:文件读写情况。

-c:系统调用情况。

-q:报告队列长度和系统平均负载

-R:进程的活动情况。

-y:终端设备活动情况。

-w:系统交换活动。

-x { pid | SELF | ALL }:报告指定进程ID的统计信息,SELF关键字是sar进程本身的统计,ALL关键字是所有系统进程的统计。

用sar进行CPU利用率的分析

#sar -u 2 10

Linux 2.6.18-53.el5PAE (localhost.localdomain) 03/28/2009

07:40:17 PM CPU %user %nice %system %iowait %steal %idle

07:40:19 PM all 12.44 0.00 6.97 1.74 0.00 78.86

07:40:21 PM all 26.75 0.00 12.50 16.00 0.00 44.75

07:40:23 PM all 16.96 0.00 7.98 0.00 0.00 75.06

07:40:25 PM all 22.50 0.00 7.00 3.25 0.00 67.25

07:40:27 PM all 7.25 0.00 2.75 2.50 0.00 87.50

07:40:29 PM all 20.05 0.00 8.56 2.93 0.00 68.46

07:40:31 PM all 13.97 0.00 6.23 3.49 0.00 76.31

07:40:33 PM all 8.25 0.00 0.75 3.50 0.00 87.50

07:40:35 PM all 13.25 0.00 5.75 4.00 0.00 77.00

07:40:37 PM all 10.03 0.00 0.50 2.51 0.00 86.97

Average: all 15.15 0.00 5.91 3.99 0.00 74.95

在显示内容包括:

  %user:CPU处在用户模式下的时间百分比。

%nice:CPU处在带NICE值的用户模式下的时间百分比。

  %system:CPU处在系统模式下的时间百分比。

  %iowait:CPU等待输入输出完成时间的百分比。

%steal:管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比。

  %idle:CPU空闲时间百分比。

在所有的显示中,我们应主要注意%iowait和%idle,%iowait的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空 闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对 较低,表明系统中最需要解决的资源是CPU。

用sar进行运行进程队列长度分析:

#sar -q 2 10

Linux 2.6.18-53.el5PAE (localhost.localdomain) 03/28/2009

07:58:14 PM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15

07:58:16 PM 0 493 0.64 0.56 0.49

07:58:18 PM 1 491 0.64 0.56 0.49

07:58:20 PM 1 488 0.59 0.55 0.49

07:58:22 PM 0 487 0.59 0.55 0.49

07:58:24 PM 0 485 0.59 0.55 0.49

07:58:26 PM 1 483 0.78 0.59 0.50

07:58:28 PM 0 481 0.78 0.59 0.50

07:58:30 PM 1 480 0.72 0.58 0.50

07:58:32 PM 0 477 0.72 0.58 0.50

07:58:34 PM 0 474 0.72 0.58 0.50

Average: 0 484 0.68 0.57 0.49

runq-sz 准备运行的进程运行队列。

plist-sz 进程队列里的进程和线程的数量

ldavg-1 前一分钟的系统平均负载(load average)

ldavg-5 前五分钟的系统平均负载(load average)

ldavg-15 前15分钟的系统平均负载(load average)

顺便说一下load avarage的含义

load average可以理解为[size=+0]每秒钟CPU等待运行的进程个数.

在Linux系统中,sar -q、uptime、w、top等命令都会有系统平均负载load average的输出,那么什么是系统平均负载呢?

  系统平均负载被定义为在特定时间间隔内运行队列中的平均任务数。如果一个进程满足以下条件则其就会位于运行队列中:

  - 它没有在等待I/O操作的结果

  - 它没有主动进入等待状态(也就是没有调用'wait')

  - 没有被停止(例如:等待终止)

  例如:

# uptime

  20:55:40 up 24days, 3:06, 1 user, load average: 8.13, 5.90, 4.94

  命令输出的最后内容表示在过去的1、5、15分钟内运行队列中的平均进程数量。

  一般来说只要每个CPU的当前活动进程数不大于3那么系统的性能就是良好的,如果每个CPU的任务数大于5,那么就表示这台机器的性能有严重问题。对 于上面的例子来说,假设系统有两个CPU,那么其每个CPU的当前任务数为:8.13/2=4.065。这表示该系统的性能是可以接受的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: