您的位置:首页 > 数据库 > SQL

Tpcc-MySQL对mysql数据库进行性能测试报告、分析及使用gnuplot生成图表展示

2016-03-31 20:42 1071 查看
TPC-C是专门针对联机交易处理系统(OLTP系统)的规范,一般情况下我们也把这类系统称为业务处理系统。

tpcc-mysql是percona基于TPC-C(下面简写成TPCC)衍生出来的产品,专用于MySQL基准测试。其源码放在launchpad上,用bazaar管理,项目地址:https://code.launchpad.net/~percona-dev/perconatools/tpcc-mysql

服务器大概配置:

两颗6核12线程CPU,相当于12核24线程

64G内存

1T,SAS 15000转/分钟硬盘

raid5阵列



一、 安装tpcc-mysql工具

安装方法一:

安装bzr客户端

# yum -y install bzr
http://imysql.com/wp-content/uploads/2014/09/tpcc-mysql-src.tgz
之后,就可以开始用bzr客户端下载tpcc-mysql源码了

bzr branch lp:~percona-dev/perconatools/tpcc-mysql

安装方法二:

通过下载源码编译安装(推荐)

MySQL中文网便捷下载地址:
http://imysql.com/wp-content/uploads/2014/09/tpcc-mysql-src.tgz
下载到本地后,先执行 gunzip 解压缩文件,再执行 tar xf 解包,直接 tar zxf 可能会报告异常。

# gunzip tpcc-mysql-src.tgz

# tar xf tpcc-mysql-src.tar

# cd tpcc-mysql/src

# make



# ls

add_fkey_idx.sql count.sql create_table.sql drop_cons.sql load.sh README schema2 scripts src tpcc_load tpcc_start



如果 make 没有报错,就会在 /tmp/tpcc-mysql 下生成 tpcc 二进制命令行工具 tpcc_load 、 tpcc_start

tpcc-mysql的业务逻辑及其相关的几个表作用如下:

New-Order:新订单,一次完整的订单事务,几乎涉及到全部表
Payment:支付,主要对应 orders、history 表
Order-Status:订单状态,主要对应 orders、order_line 表
Delivery:发货,主要对应 order_line 表
Stock-Level:库存,主要对应 stock 表
其他相关表:
客户:主要对应 customer 表
地区:主要对应 district 表
商品:主要对应 item 表
仓库:主要对应 warehouse 表


二、TPCC测试前准备

初始化测试库环境

make命令会在tpcc-mysql目录下生成 tpcc 命令行工具 tpcc_load ,tpcc_start

tpcc_load 提供初始化数据的功能

tpcc_start 进行压力测试

# cd /root/tpcc-mysql

# mysqladmin -uroot -pyourpassword create tpcc1000
# 创建测试用的数据库

# mysql -uroot -pyourpassword -f tpcc1000 < create_table.sql# 创建测试用的表

# mysql -uroot -pyourpassword tpcc1000 < add_fkey_idx.sql# 创建FK和索引

初始化完毕后,就可以开始加载测试数据了

tpcc_load使用介绍:

# ./tpcc_load --help

tpcc_load [server] [DB] [user] [pass] [warehouse]

Server: 服务器名

DB: 数据库名

user: 用户名

pass: 密码

Warehouse: 仓库的数量

tpcc_start使用介绍:

#./tpcc_start --help

tpcc_start -h server_host -P port -d database_name -u mysql_user -p mysql_password -w warehouses -c connections -r warmup_time -l running_time -i report_interval -f report_file

介绍一下各个参数的用法

-h server_host: 服务器名
-P port : 端口号,默认为3306
-d database_name: 数据库名
-u mysql_user : 用户名
-p mysql_password : 密码
-w warehouses: 仓库的数量
-c connections : 线程数,默认为1
-r warmup_time : 热身时间,单位:s,默认为10s ,热身是为了将数据加载到内存。
-l running_time: 测试时间,单位:s,默认为20s
-i report_interval: 指定生成报告间隔时长
-f report_file: 测试结果输出文件


选项 warehouse 意为指定测试库下的仓库数量

真实测试场景中,仓库数一般不建议少于100个,视服务器硬件配置而定,如果是配备了SSD或者PCIE SSD这种高IOPS设备的话,建议最少不低于1000个。

执行下面的命令,开始灌入测试数据:

# cd /root/tpcc-mysql

创建150个数据仓库

# ./tpcc_load localhost tpcc1000 root "yourpass" 150

报错

./tpcc_load: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object file: No such file or directory

解决办法:

# echo "/usr/local/mysql/lib" >>/etc/ld.so.conf

# ldconfig

在这里,需要注意的是 tpcc 默认会读取 /var/lib/mysql/mysql.sock 这个socket 文件。

因此,如果你的 socket 文件不在相应路径的话,可以做个软连接,或者通过TCP/IP的方式连接测试服务器,例如:

cd /root/tpcc-mysql

./tpcc_load 1.2.3.4:3306 tpcc1000 tpcc_user "tpcc_password" 10

加载测试数据时长视仓库数量而定,若过程比较久需要稍加耐心等待。

三、进行测试

# ./tpcc_start -hlocalhost -d tpcc1000 -u root -p "yourpassword" -w 150 -c 24 -r 600 -l 7200 - >tpcc-output-log

报错:

neword 0:4

1062, 23000, Duplicate entry '4-3-3020' for key 'PRIMARY'



原来是因为我们改了默认的引擎为MyiSam并且关闭了innodb引擎引起的(生产环境大部分都是myisam的场景,设置了myisam为mysql5.5的默认引擎,而myisam不支持外键所以脚本在创建数据条目的时候不会理会是否主键唯一,这样会造成部分数据主键重复)

default-storage-engine=MyISAM

skip-innodb



即:模拟 150个仓库规模,并发 24个线程进行测试,热身时间为 300秒, 压测时间为 2小时。

真实测试场景中,建议预热时间不小于5分钟,持续压测时长不小于30分钟,否则测试数据可能不具参考意义。

测试结果输出如下(tpcc-output-log文件):

-- 本轮tpcc压测的一些基本信息
***************************************
*** ###easy### TPC-C Load Generator ***
***************************************
option h with value 'localhost'         -- 主机
option d with value 'tpcc1000'          -- 数据库
option u with value 'root'              -- 账号
option p with value 'yourpassword'      -- 密码
option w with value '150'               -- 仓库数
option c with value '12'                -- 并发线程数
option r with value '300'               -- 数据预热时长(秒)
option l with value '3600'              -- 压测时长(秒)
non-option ARGV-elements: -
<Parameters>
[server]: localhost
[port]: 3306
[DBname]: tpcc1000
[user]: root
[pass]: yourpassword
[warehouse]: 150
[connection]: 12
[rampup]: 300 (sec.)
[measure]: 3600 (sec.)

-- 预热结束,开始进行压测
RAMP-UP TIME.(300 sec.)

-- 每10秒钟输出一次压测数据
MEASURING START.

10, 435(0):3.322|6.846, 435(0):0.672|1.661, 44(0):0.386|0.439, 43(0):4.017|4.847, 44(0):11.076|11.907
20, 418(0):3.334|3.482, 416(0):0.669|0.728, 41(0):0.355|0.390, 41(0):3.796|4.356, 41(0):10.580|10.781
30, 410(0):3.332|4.708, 412(0):0.656|1.661, 41(0):0.304|0.308, 42(0):3.844|3.926, 42(0):10.542|10.646
...
3580, 445(0):3.277|3.402, 447(0):0.658|0.765, 44(0):0.326|0.404, 45(0):3.856|3.950, 44(0):10.805|10.899
3590, 388(0):3.352|3.589, 391(0):0.697|0.795, 39(0):0.320|0.330, 39(0):3.826|4.009, 39(0):10.638|10.844
3600, 407(0):3.256|3.390, 405(0):0.676|0.746, 41(0):0.331|0.339, 41(0):3.904|3.910, 41(0):10.625|10.653
-- 以逗号分隔,共6列
-- 第一列,第N次10秒
-- 第二列,新订单成功执行压测的次数(推迟执行压测的次数):90%事务的响应时间|本轮测试最大响应时间,新订单事务数也被认为是总有效事务数的指标
-- 第三列,支付业务成功执行次数(推迟执行次数):90%事务的响应时间|本轮测试最大响应时间
-- 第四列,订单状态业务的结果,后面几个的意义同上
-- 第五列,物流发货业务的结果,后面几个的意义同上
-- 第六列,库存仓储业务的结果,后面几个的意义同上

-- 压测结束
STOPPING THREADS............

-- 第一次结果统计
<Raw Results>
[0] sc:144136  lt:5  rt:0  fl:0   -- New-Order,新订单业务成功(success,简写sc)次数,延迟(late,简写lt)次数,重试(retry,简写rt)次数,失败(failure,简写fl)次数
[1] sc:144148  lt:0  rt:0  fl:0   -- Payment,支付业务统计,其他同上
[2] sc:14416  lt:0  rt:0  fl:0    -- Order-Status,订单状态业务统计,其他同上
[3] sc:14416  lt:0  rt:0  fl:0    -- Delivery,发货业务统计,其他同上
[4] sc:14416  lt:0  rt:0  fl:0    -- Stock-Level,库存业务统计,其他同上
in 3600 sec.

-- 第二次统计结果,其他同上
<Raw Results2(sum ver.)>
[0] sc:144147  lt:5  rt:0  fl:0
[1] sc:144154  lt:0  rt:0  fl:0
[2] sc:14416  lt:0  rt:0  fl:0
[3] sc:14416  lt:0  rt:0  fl:0
[4] sc:14416  lt:0  rt:0  fl:0

<Constraint Check> (all must be [OK])   -- 下面所有业务逻辑结果都必须为 OK 才行
[transaction percentage]
Payment: 43.48% (>=43.0%) [OK]  -- 支付成功次数(上述统计结果中 sc + lt)必须大于43.0%,否则结果为NG,而不是OK
Order-Status: 4.35% (>= 4.0%) [OK]   -- 订单状态,其他同上
Delivery: 4.35% (>= 4.0%) [OK]   -- 发货,其他同上
Stock-Level: 4.35% (>= 4.0%) [OK]   -- 库存,其他同上
[response time (at least 90% passed)]  -- 响应耗时指标必须超过90%通过才行
New-Order: 100.00%  [OK]          -- 下面几个响应耗时指标全部 100% 通过
Payment: 100.00%  [OK]
Order-Status: 100.00%  [OK]
Delivery: 100.00%  [OK]
Stock-Level: 100.00%  [OK]

<TpmC>
2402.350 TpmC - TpmC结果值(每分钟事务数,该值是第一次统计结果中的新订单事务数除以总耗时分钟数,例如本例中是:144136/60 = 2402.350)


四、生成图表

首先写一个脚本获取数据源:

# vim tpcc-output-analyze.sh

#!/bin/sh

TIMESLOT=1

if [ -n "$2" ]

then

TIMESLOT=$2

fi

cat $1 | grep -v HY000 | grep -v payment | grep -v neword | awk -v timeslot=$TIMESLOT 'BEGIN { FS="[,():]"; s=0; cntr=0; aggr=0 } /MEASURING START/ { s=1} /STOPPING THREADS/ {s=0} /0/ { if (s==1) { cntr++; aggr+=$2; } if ( cntr==timeslot ) { printf ("%d %3d\n",$1,(aggr/timeslot))
; cntr=0; aggr=0 } }'

这个脚本就是对 tpcc-output-log 的第一列与第二列进行运算。

# chmod +x tpcc-output-analyze.sh

#./tpcc-output-analyze.sh tpcc-output-log > tpcc-graphic-data.txt

绘图过程:

#vim log.conf

set terminal gif small size 480,360 #指定输出成gif图片,且图片大小为550×25

set output "tcpp.gif" #指定输出gif图片的文件名

set title "MySQL Performance" #图片标题

set style data lines #显示网格

set xlabel "Time/s" #X轴标题

set ylabel "Data" #Y轴标题

set grid #显示网格

plot \

"tpcc-graphic-data.txt" using 1:2 title "Total throughput" with lines #从tpcc-graphic-data.txt文件中读取第一列和第二列作为X轴和Y轴数据,示例名"Total throughput"

安装绘图工具gnuplot

# yum install -y gnuplot

运行生成tcpp.gif:

# cat log.conf | gnuplot

可以看到在/root/tpcc-mysql目录下已经生成了tcpp.gif图片文件

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: