HBase入库性能问题
2011-04-13 11:05
225 查看
这个文档置顶很久了,还是写点东西吧。
HBase这个东西的入库速度说实在的,在多列族的情况下表现很一般,实在是不值得提。
具体的原因是由于多列族在hbase的写入机制决定的,有兴趣的可以在网上找找资料,这里我只说单列族的情况下的我的测试结果:
集群的规模为9(S)+1(M)+3(C)
16G内存
8核CPU
千兆网络
8块7200转的SATA硬盘
不做raid
Client方式写入:
单个Slave的写入速度约为8.3MB/s
整个集群的写入速度约为83MB/s
BulkLoad模式写入:
整个集群(不算Client,就是9+1)的写入速度(包含了创建HFile时间)约为160MB/s
这里需要说明一下:
1、我在写入的时候有很高的硬盘I/O Wait,最高达到了300ms(一般在12ms-15ms之间是正常的),这个和我当前使用的硬件有直接关系(没有更好的,只能这样了)。
2、关于BulkLoad在增量写表的过程中,性能表现及其难看,不建议采用。只是适合空表情况下数据导入。
3、对于Client的写入模式,如果做了Secondary Index,很遗憾,写入的速度也会下降,一般来说如果增加3个索引,整个集群的写入速度会下降到40MB/s。
4、如何提升速度?一般来说除了解决第一条硬盘I/O Wait的问题外,可通过提升单机内存以及增加单机硬盘数量。这里我还未做过测试。当然,增加Slave也是可以的。
5、最后需要注意一下,在设定Region块的边界的时候尽量符合数据的实际情况,做到均匀的散列,这样可以保证数据写入时所有Slave的所有硬盘都在转。
6、还是那句话,希望有过相关测试的朋友能够指出我当前不足,提供更高的提升方式,欢迎邮件联系dajuezhao@gmail.com
HBase这个东西的入库速度说实在的,在多列族的情况下表现很一般,实在是不值得提。
具体的原因是由于多列族在hbase的写入机制决定的,有兴趣的可以在网上找找资料,这里我只说单列族的情况下的我的测试结果:
集群的规模为9(S)+1(M)+3(C)
16G内存
8核CPU
千兆网络
8块7200转的SATA硬盘
不做raid
Client方式写入:
单个Slave的写入速度约为8.3MB/s
整个集群的写入速度约为83MB/s
BulkLoad模式写入:
整个集群(不算Client,就是9+1)的写入速度(包含了创建HFile时间)约为160MB/s
这里需要说明一下:
1、我在写入的时候有很高的硬盘I/O Wait,最高达到了300ms(一般在12ms-15ms之间是正常的),这个和我当前使用的硬件有直接关系(没有更好的,只能这样了)。
2、关于BulkLoad在增量写表的过程中,性能表现及其难看,不建议采用。只是适合空表情况下数据导入。
3、对于Client的写入模式,如果做了Secondary Index,很遗憾,写入的速度也会下降,一般来说如果增加3个索引,整个集群的写入速度会下降到40MB/s。
4、如何提升速度?一般来说除了解决第一条硬盘I/O Wait的问题外,可通过提升单机内存以及增加单机硬盘数量。这里我还未做过测试。当然,增加Slave也是可以的。
5、最后需要注意一下,在设定Region块的边界的时候尽量符合数据的实际情况,做到均匀的散列,这样可以保证数据写入时所有Slave的所有硬盘都在转。
6、还是那句话,希望有过相关测试的朋友能够指出我当前不足,提供更高的提升方式,欢迎邮件联系dajuezhao@gmail.com
相关文章推荐
- hbase多用户入库,regionserver下线问题
- hbase多用户入库,regionserver下线问题
- Hbase性能问题以及解决方案
- hive-hbase性能问题
- hbase写入库出现问题
- maven编译ycsb0.1.4支持针对hbase性能测试,解决not a host:port pair问题,附下载地址
- 如何提高hbase的入库性能
- HBase常见性能问题及解决方案
- 怎样提高hbase的入库性能
- Hbase bulkLoad 批量入库遇到的问题及解决方法
- Storm-Kafka-Hbase 性能问题
- 怎样提高hbase的入库性能
- [原创]SQL Server 2008 安装过程中遇到“性能计数器注册表配置单元一致性”检查失败 问题的解决方法
- MongoDB监控五 诊断MongoDB性能问题
- Hbase中的rowkey以及热点问题
- MYBATIS 查询的性能小问题
- 【集群问题解决】Hbase的"Failed deleting my ephemeral node"错误解决
- 常见的20种“瓶颈”(性能问题)
- java用while循环设计轮询线程的性能问题