您的位置：首页 > 数据库

数据库分表

2016-09-13 00:00 127 查看

项目开发中，我们的数据库数据越来越大，随之而来的是单个表中数据太多。以至于查询书读变慢，而且由于表的锁机制导致应用操作也搜到严重影响，出现了数据库性能瓶颈。

当出现这种情况时，我们可以考虑分表，即将单个数据库表进行拆分，拆分成多个数据表，然后用户访问的时候，根据一定的算法，让用户访问不同的表，这样数据分散到多个数据表中，减少了单个数据表的访问压力。提升了数据库访问性能。

我们可以进行简单的设想：现在有一个表products存储产品信息，现在有100万用户在线访问，就要进行至少100万次请求，现在我们如果将它分成100个表即products0~~products99,那么利用一定的算法我们就分担了单个表的访问压力，每个表只有1万个请求（当然，这是理想情况下！）

实现mysql分表的关键在于：设计良好的算法来确定"什么时候情况下访问什么（哪个）表"。

下面我们先来实现一个简单的mysql分表演示：这里使用MERGE分表法

1，创建一个完整表存储着所有的成员信息

createtablemember( idbigintauto_incrementprimarykey, namevarchar(20), sextinyintnotnulldefault'0' )engine=myisamdefaultcharset=utf8auto_increment=1;
加入点数据：

insertintomember(id,name,sex)values(1,'jacson','0');

insertintomember(name,sex)selectname,sexfrommember;

第二条语句多执行几次就有了很多数据。

2，下面我们进行分表：这里我们分两个表tb_member1,tb_member2

DROPtableIFEXISTStb_member1;
createtabletb_member1(
idbigintprimarykeyauto_increment,
namevarchar(20),
sextinyintnotnulldefault'0'
)ENGINE=MyISAMDEFAULTCHARSET=utf8AUTO_INCREMENT=1;

DROPtableIFEXISTStb_member2;
createtabletb_member2(
idbigintprimarykeyauto_increment,
namevarchar(20),
sextinyintnotnulldefault'0'
)ENGINE=MyISAMDEFAULTCHARSET=utf8AUTO_INCREMENT=1;
//创建tb_member2也可以用下面的语句createtabletb_member2liketb_member1;
3,创建主表tb_member

DROPtableIFEXISTStb_member;
createtabletb_member(
idbigintprimarykeyauto_increment,
namevarchar(20),
sextinyintnotnulldefault'0'
)ENGINE=MERGEUNION=(tb_member1,tb_member2)INSERT_METHOD=LASTCHARSET=utf8AUTO_INCREMENT=1;

查看一下tb_member表的结构:desctb_member;

4,接下来，我们把数据分到两个分表中去：

insertintotb_member1(id,name,sex)selectid,name,sexfrommemberwhereid%2=0;

insertintotb_member2(id,name,sex)selectid,name,sexfrommemberwhereid%2=1;

查看一下主表的数据：select*fromtb_member;

注意：总表只是一个外壳，存取数据发生在一个一个的分表里面。

ps:创建主表时可能会出现下面的错误：

ERROR1168(HY000):Unabletoopenunderlyingtablewhichisdifferentlydefined
orofnon-MyISAMtypeordoesn'texist

若遇到上面这种错误，一般从两方面来排查：（从这两方面一般可以解决这个问题，本人也遇到了。）

1，查看上面的分表数据库引擎是不是MyISAM.

2，查看分表与指标的字段定义是否一致。

分表的大概过程和步骤就是这样的，下面我们来看看分表的算法实现：

假设现在有一个应用系统可能会有100亿的用户量，另外一个表一般存储量在不超过100万的时候基本能保持良好性能，计算下来，我们需要1万张表，即分表为1万个表。

我们可以设计成：user_0~user_9999

在用户表里面我们有唯一的标示是用户id,我们尅设计一个小算法来实现用户id与访问表名的对应：

functiongetTable($id)

{

return'user_'.sprintf('%d',($id>>20));

}

解释一下：($id>>20)表示将向右移位20位，（向右移动一位标示减少一半），printf('%d',$data)标示将数据按照十进制输出。

即id为1~1048575（2的20次幂-1）时均访问user_0,1048576~2097152时访问user_1,以此类推.....

那么问题来了，如果用户更多怎么办，现在需要一个可扩展的方法：

functiongetTable($id,$bit,$seed){

return'user_'.sprintf('%0{$bit}d',($id>>$seed));

}

其中：$id为用户id,$bit标示表后缀的位数,$seed表示要移位的位数即：单个表能存储的记录条数。

这样就可以任意分表了。

总结：

其实上面我们介绍的是水平分表的实施方法，还存在另一种方法叫做：垂直分表

垂直分表：

举例说明，在一个博客系统中，文章标题，作者，分类，创建时间等，是变化频率慢，查询次数多，而且最好有很好的实时性的数据，我们把它叫做冷数据。
　　　　而博客的浏览量，回复数等，类似的统计信息，或者别的变化频率比较高的数据，我们把它叫做活跃数据。
　　我们进行纵向分表后：
　　　　　　1,存储引擎的使用不同，冷数据使用MyIsam可以有更好的查询数据。活跃数据，可以使用Innodb,可以有更好的更新速度。
　　　　　　2,对冷数据进行更多的从库配置，因为更多的操作是查询，这样来加快查询速度。对热数据，可以相对有更多的主库的横向分表处理。
　　　　　　3,对于一些特殊的活跃数据，也可以考虑使用memcache,redis之类的缓存，等累计到一定量再去更新数据库.

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： mysql

相关文章推荐

新的分享

章节导航