您的位置：首页 > 其它

hbase的预分配region

2013-02-25 18:42 483 查看

在create一个表时如果不指定预分配region，则默认会先分配一个region，这样在大数据并行载入时性能比较低，因为所有的数据都往一个region灌入，容易引起单节点负载升高，从而影响入库性能，一个好的方法时在建立表时预先分配数个region。方法有两种，主要针对不同版本可供选择。

1.使用RegionSplitter方法，主要针对hbase-0.90.X版本

a.首先使用RegionSplitter建表，预分配region，例如建立一个poidb表，列簇为info，预分配9个region，

hbase org.apache.hadoop.hbase.util.RegionSplitter -c 9 -f info
poidb

b.修改建表参数（可选）

默认建表是没有开启Bloomfilter和压缩参数的，这里为了提供读性能，建议开启Bloomfilter，同时使用压缩SNAPPY，进入hbase
shell，首先需要disable 'poidb',然后使用使用

alter 'poidb',{NAME => 'info',BLOOMFILTER
=> 'ROWCOL',COMPRESSION =>
'SNAPPY',VERSIONS => '1'}

最后enable 'poidb'

2.使用hbase shell建表参数，真多0.94.x版本

0.94版本可以直接在建表时直接使用预分配regions：

create 'poidb', { NAME => 'info', COMPRESSION
=> 'snappy' }, {NUMREGIONS
=> 9, SPLITALGO =>
'HexStringSplit'}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航