ETL学习笔记之二:ETL与BI
2007-11-08 18:21
323 查看
http://blog.csdn.net/tiger119/archive/2007/01/14/1482630.aspx
ETL为数据仓库服务,数据仓库用于数据分析,数据分析属于BI系统的要干的事儿。
一般中/小型ERP系统都会有不成熟的BI系统,为啥叫做不成熟?
因为它们或者有报表分析功能,但不具有OLAP(在线分析),或者有OLAP,但却没有数据挖掘和深度分析。或者干脆,来个大集成,直接利用第三方工具来达到相应的目的。
为什么会这样,究其原因,很多情况是因为没有自主的数据仓库,没有数据仓库,其它的做起来也就有些四不象了。而要建立数据仓库,首要的是:ETL。
于是,需求就应运而生了。
对了,BI是什么?OLAP是啥?什么又是数据挖掘?鉴于我只能解释其表面含义,我就不多说了。各位不妨找本数据仓库的书,翻翻前几页,一般就明白了。或者Google一把。
我们捡当下最流行的BI应用:OLAP来说说它与ETL的关系。
了解OLAP的人都知道,它的分析模型由事实表和维表组成。但往往OLTP系统中的数据库是为事务而建,而并不为分析而建,而为了BI去改动OLTP数据 库是不现实,并且,很多情况下也基本上是不可能的(当然,有些公司把不可能的任务变成可能的,但这显然是一种很僵硬的做法)。
这时候,ETL的作用就显出来了,它可以为OLAP服务,按业务主题提取分析模型进行数据抽取。
(OLAP分析需要什么样的数据支持?可以参看一下OLAP的星型模型)。
再说说数据挖掘:
这个课题实在太大,相关的书藉有很多很多,我还得花时间慢慢去学习。简单的说,这涉及ERP业务和统计学的知识。现在我暂时还没开始相关学习,但它与 ETL的关系却很明显。因为数据挖掘所要求的数据大都是高聚合的已处理的数据,所以,不管从获取难度和效率上来说,都不适合直接从OLTP中获取。
同样,需要ETL来帮忙。
因此,按本人粗浅的理解:
ETL实在是: BI系统 设计开发,项目实施 之必备良药!
有句名言讲得好:成为巨人不如站在巨人的肩膀上。
如果想对ETL有详尽的了解,不妨先了解一下现有流行的ETL工具。
ETL为数据仓库服务,数据仓库用于数据分析,数据分析属于BI系统的要干的事儿。
一般中/小型ERP系统都会有不成熟的BI系统,为啥叫做不成熟?
因为它们或者有报表分析功能,但不具有OLAP(在线分析),或者有OLAP,但却没有数据挖掘和深度分析。或者干脆,来个大集成,直接利用第三方工具来达到相应的目的。
为什么会这样,究其原因,很多情况是因为没有自主的数据仓库,没有数据仓库,其它的做起来也就有些四不象了。而要建立数据仓库,首要的是:ETL。
于是,需求就应运而生了。
对了,BI是什么?OLAP是啥?什么又是数据挖掘?鉴于我只能解释其表面含义,我就不多说了。各位不妨找本数据仓库的书,翻翻前几页,一般就明白了。或者Google一把。
我们捡当下最流行的BI应用:OLAP来说说它与ETL的关系。
了解OLAP的人都知道,它的分析模型由事实表和维表组成。但往往OLTP系统中的数据库是为事务而建,而并不为分析而建,而为了BI去改动OLTP数据 库是不现实,并且,很多情况下也基本上是不可能的(当然,有些公司把不可能的任务变成可能的,但这显然是一种很僵硬的做法)。
这时候,ETL的作用就显出来了,它可以为OLAP服务,按业务主题提取分析模型进行数据抽取。
(OLAP分析需要什么样的数据支持?可以参看一下OLAP的星型模型)。
再说说数据挖掘:
这个课题实在太大,相关的书藉有很多很多,我还得花时间慢慢去学习。简单的说,这涉及ERP业务和统计学的知识。现在我暂时还没开始相关学习,但它与 ETL的关系却很明显。因为数据挖掘所要求的数据大都是高聚合的已处理的数据,所以,不管从获取难度和效率上来说,都不适合直接从OLTP中获取。
同样,需要ETL来帮忙。
因此,按本人粗浅的理解:
ETL实在是: BI系统 设计开发,项目实施 之必备良药!
有句名言讲得好:成为巨人不如站在巨人的肩膀上。
如果想对ETL有详尽的了解,不妨先了解一下现有流行的ETL工具。
相关文章推荐
- ETL学习笔记之二:ETL与BI
- ETL学习笔记之二:ETL与BI
- ETL学习笔记之二:ETL与BI
- BI学习笔记之二- BI的体系架构与相关技术
- ETL学习笔记之二 实现篇(转)
- ETL学习笔记之二 实现篇(转)
- 【达内C++学习培训学习笔记系列】C语言之二scanf和选择语句
- DirectX 9 UI设计学习笔记之二:第2章Introducing DirectX+第3章Introducing Direct3D
- 黑客学习笔记教程之二:黑客常用攻击手段
- Java NIO学习笔记之二-图解ByteBuffer
- 一步一步学习sqlserver BI--ETL设计 (2)
- AIX系统日志学习笔记之二
- 2012 年NOSQL学习笔记之二
- robot framework学习笔记之二—变量
- PHP学习笔记之二
- CAFFE源码学习笔记之二-Syncmemory
- CAFFE源码学习笔记之二-Syncmemory
- 设计模式C++学习笔记之二(Proxy代理模式)
- 编码知识学习笔记之二
- 快速软件开发 学习笔记 之二