数据仓库建设_关系型数据库存储_调度(1)
2015-04-26 21:32
369 查看
序
博客重新开张了,欢迎新老读者光临。因为自己也是一个数据仓库技术群的群主,经常会遇到有人问,有没有数据仓库的视频,有没有数据仓库的相关资料,还有更夸张的,直接说,“想做架构师,有哪些资料”;所以近期会在博客中新开一个“闲扯”板块,分享自己对类似问题的看法。
闲话少说,书接上回
![](http://static.blog.csdn.net/xheditor/xheditor_emot/default/titter.gif)
一、数据仓库的数据从哪里来
1.数据仓库产生数据吗?
数据仓库本身是不产生数据的,当然了,可能有人会说,如果数据仓库不产生数据,那报表是什么?从哪来的?然后,这时候会再跳出一个人来说(我天朝确实人多哈),报表那是数据仓库加工产生的。上面的一段话,我划分为两个问题,首先来说第一个。现在普遍见到的数据仓库的应用,可能就是报表了,各种日报、周报、月报、季度。。。还有银行的年终结转之类的。其实,如果只是做这些报表,还真可惜做数据仓库花那么多人力、物力了。我想说,这个数据确实在各种业务系统中没有的,但我个人也并不认为这就是数据仓库产生数据,包括人们常说的数据挖掘和数据分析的结果。我觉得这些就是目前的数据情况的总结,或者数据规律的深度利用,数据仓库技术+数据科学技术,本身就是发现数据中的数据,或者比较常见的一句话“挖掘数据金矿“。
以上这些工作如果我们用excel存数据+数据分析处理或者用纸+笔+计算器也能做同样的事情,我觉得这时候应该就没人说是纸和笔产生了数据吧,不然,那只能是作者凭空编了。
然后再来说报表是数据仓库加工产生的。在这里单独说这个问题,我只是想说,数据仓库里面做的事很多,我会依照自己的理解一一介绍,但我实在不想用加工这个词。报表我将它定义为,数据仓库数据应用的一种。这是一种相互的情况,在数据仓库中已经存储了按照良好模型组织的数据,新增一个日报时,就是对数据仓库数据的一个应用;反过来,在数据仓库还很薄弱的时候,由业务需求驱动,需要优先考虑某些报表,这时可以作为数据的应用建设方向。
至于加工这个词,确实听很多人和很多项目中提起,我遇到的情况大多都是贴源设计的系统,关于帖源系统后期我会重点来说明。
2.数据从哪来
以上的观点仅个人看法,欢迎善意技术交流,钻牛角尖的大侠就放过我吧,有空我还想养养鱼,遛遛鸟呢。数据从哪来,2015-04-2更新。欢迎大家加我的技术群或者关注我的博客,索取”追剧课程表“相关文章推荐
- 数据仓库与传统关系型数据库的差别
- 数据存储服务器集群的伸缩性设计——关系型数据库
- 以学生表为例理解RDBMS(关系型数据库)到 hbase 数据存储模式的转变
- 数据仓库--postgresql for 循环记录完成存储过程总调度
- 对象和数据库的天然阻抗(越抽象越灵活(容易变化,变化带来的损失小)越具体越固定(不易变化,变化带来的影响范围广损失大)) 【面向对象在方法上与面向过程对立,在数据存储上与关系型数据对立,抽象与具体】
- 关系型数据库到HBase的数据存储方式变迁
- Android本地数据存储之SQLite关系型数据库 ——SQLiteDatabase
- 现在电子商务网站建设中数据库如何设计使数据存储量变大
- Android本地数据存储之SQLite关系型数据库 ——SQLiteDatabase
- 数据存储知识(1)--关系型数据库
- 数据库系统——关系型数据在磁盘上的存储布局
- lotusscript通过ODBC实现与关系型数据库SQL的数据存储
- Android本地数据存储之SQLite关系型数据库 ——SQLiteDatabase
- 数据仓库建设之六脉神剑
- 数据库与数据仓库对比
- 计算数据库中数据总和的存储过程
- 数据仓库之-历史数据存储方案
- 第96讲 通过Spark Streaming的foreachRDD把处理后的数据写入外部存储系统(数据库)中
- 数据仓库与数据库
- 第一行代码 第六章 数据储存方案 - LitePal数据库存储