我的理解之数据库建表三范式
2012-09-29 10:02
211 查看
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。
在实际开发中通常满足第三范式即可:下图是我对三范式的简单理解:
![](http://img.my.csdn.net/uploads/201209/29/1348884070_1290.png)
第一范式(1NF):要求关系模式R的所有属性都是不可分的基本数据项,指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。
例如:比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。
用户信息表
编号 | 姓名 | 性别 | 年龄 | 联系电话 | 省份 | 城市 | 详细地址 |
1 | 张红欣 | 男 | 26 | 0378-23459876 | 河南 | 开封 | 朝阳区新华路23号 |
2 | 李四平 | 女 | 32 | 0751-65432584 | 广州 | 广东 | 白云区天明路148号 |
3 | 刘志国 | 男 | 21 | 0371-87659852 | 河南 | 郑州 | 二七区大学路198号 |
4 | 郭小明 | 女 | 27 | 0371-62556789 | 河南 | 郑州 | 新郑市薛店北街218号 |
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)首先要求数据库表中首先必须有主键。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。其次要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。订单信息表
订单编号 | 商品编号 | 商品名称 | 数量 | 单位 | 商品价格 |
001 | 1 | 挖掘机 | 1 | 台 | 1200000¥ |
002 | 2 | 冲击钻 | 8 | 个 | 230¥ |
003 | 3 | 铲车 | 2 | 辆 | 980000¥ |
而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,就非常完美了。如下面这两个所示。
订单信息表
订单编号 | 商品编号 | 数量 |
001 | 1 | 1 |
002 | 2 | 8 |
003 | 3 | 2 |
商品编号 | 商品名称 | 单位 | 商品价格 |
1 | 挖掘机 | 台 | 1200000¥ |
2 | 冲击钻 | 个 | 230¥ |
3 | 铲车 | 辆 | 980000¥ |
第三范式3NF是第二范式(2NF)的一个子集,即满足第三范式必须满足第二范式。第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关,即任何非主属性不得传递依赖于主属性。简而言之,就是要求一个关系中不包含已在其它关系已包含的非主关键字信息。(不满足时常采用投影分解法解决)
比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。订单信息表
订单编号 | 订单项目 | 负责人 | 业务员 | 订单数量 | 客户编号 |
001 | 挖掘机 | 刘明 | 李东明 | 1台 | 1 |
002 | 冲击钻 | 李刚 | 霍新峰 | 8个 | 2 |
003 | 铲车 | 郭新一 | 艾美丽 | 2辆 | 1 |
客户编号 | 客户名称 | 所属公司 | 联系方式 |
1 | 李聪 | 五一建设 | 13253661015 |
2 | 刘新明 | 个体经营 | 13285746958 |