三个例子,让你看懂数据仓库多维数据模型的设计
2015-01-20 09:34
579 查看
一、概述
多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式,本文以实例方式展示三者的模式和区别。
二、星型模式(star schema)
星型模式的核心是一个大的中心表(事实表),一组小的附属表(维表)。星型模式示例如下所示:
![](http://images.cnitblog.com/blog/496966/201501/200916184066377.jpg)
三、雪花模式(snowflake schema)
雪花模式是星型模式的扩展,其中某些维表被规范化,进一步分解到附加表(维表)中。雪花模式示例如下图所示:
![](http://images.cnitblog.com/blog/496966/201501/200918380319666.jpg)
从图中我们可以看到地址表被进一步细分出了城市(city)维。supplier_type表被进一步细分出来supplier维。
四、事实星座模式(Fact Constellation)或星系模式(galaxy schema)
数据仓库由多个主题构成,包含多个事实表,而维表是公共的,可以共享,这种模式可以看做星型模式的汇集,因而称作星系模式或者事实星座模式。本模式示例如下图所示:
![](http://images.cnitblog.com/blog/496966/201501/200924338912918.jpg)
如上图所示,事实星座模式包含两个事实表:sales和shipping,二者共享维表。
五、总结
事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。
最近在做大数据技术体系下的数据仓库模型设计,重温数据传统数据仓库的关键技术和数据模型,有感兴趣的可以一起讨论,共同学习。QQ群: 347018601
多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式,本文以实例方式展示三者的模式和区别。
二、星型模式(star schema)
星型模式的核心是一个大的中心表(事实表),一组小的附属表(维表)。星型模式示例如下所示:
![](http://images.cnitblog.com/blog/496966/201501/200916184066377.jpg)
三、雪花模式(snowflake schema)
雪花模式是星型模式的扩展,其中某些维表被规范化,进一步分解到附加表(维表)中。雪花模式示例如下图所示:
![](http://images.cnitblog.com/blog/496966/201501/200918380319666.jpg)
从图中我们可以看到地址表被进一步细分出了城市(city)维。supplier_type表被进一步细分出来supplier维。
四、事实星座模式(Fact Constellation)或星系模式(galaxy schema)
数据仓库由多个主题构成,包含多个事实表,而维表是公共的,可以共享,这种模式可以看做星型模式的汇集,因而称作星系模式或者事实星座模式。本模式示例如下图所示:
![](http://images.cnitblog.com/blog/496966/201501/200924338912918.jpg)
如上图所示,事实星座模式包含两个事实表:sales和shipping,二者共享维表。
五、总结
事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。
最近在做大数据技术体系下的数据仓库模型设计,重温数据传统数据仓库的关键技术和数据模型,有感兴趣的可以一起讨论,共同学习。QQ群: 347018601
相关文章推荐
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 三个例子,让你看懂数据仓库多维数据模型的设计
- 数据仓库多维数据模型研究及其设计方法
- 数据仓库数据库设计方法---关系模型和多维模型比较分析
- 数据仓库多维数据模型设计
- 数据仓库数据库设计方法---关系模型和多维模型比较分析
- 数据仓库的模型设计 A. 数据建模方法论 数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。 模型设计分为三个阶段: 1,概念模型 对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。 一
- 方法多维数据仓库(八):数据仓库中数据库设计的基本模型
- 数据仓库的多维数据模型
- 数据仓库基础知识(二)- 多维数据模型
- 数据仓库的多维数据模型
- 多维联机数据分析模型和系统设计方法[转]
- 数据仓库的模型设计
- 数据仓库专题20-案例篇:电商领域数据主题域模型设计v0.1(改进意见征集中)
- 数据仓库的多维数据模型
- 数据仓库模型设计
- 数据仓库的模型设计
- 数据仓库的模型设计
- 数据仓库数据挖掘——数据仓库模型设计