Hive基本概念
2017-11-22 12:36
183 查看
一 什么是Hive
Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。
二什么是数据仓库
数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。
集成的:数据仓库中的数据时来自分散的操作性数据,将操作性地数据从原来的数据中抽取出来,进行加工处理,满足一定的条件才能进入数据仓库。原来的数据可以来自于oracle数据库或Mysql数据库,也可以来自一个文本文件或者来自其他系统。我们把不同的数据集成起来,就形成了数据仓库。
不可更新的:主要是用来数据查询,不会在数据仓库中进行更新或删除。
三 数据仓库的结构和建立过程
![](http://dl2.iteye.com/upload/attachment/0127/4694/23dc29a5-5122-3722-8aad-8c6a8cd6b5ad.png)
四 OLTP应用
1、定义
OLTP:联机事务处理
2、典型应用
银行转账
![](http://dl2.iteye.com/upload/attachment/0127/4696/7972822e-dd40-3113-b96c-808dbeecb717.png)
五 OLAP应用
1、定义
OLAP:联机分析处理
2、典型应用
商品推荐系统
![](http://dl2.iteye.com/upload/attachment/0127/4700/9baf2a46-5c0a-3c24-ad10-e7729542156e.png)
六 数据仓库中的数据模型
![](http://dl2.iteye.com/upload/attachment/0127/4698/533d3d41-b260-3d4d-8548-8dd67fd533dc.png)
1、星型模型
![](http://dl2.iteye.com/upload/attachment/0127/4702/5873ed84-5a3f-3776-8186-8474d3fd4492.png)
2、雪花模型
![](http://dl2.iteye.com/upload/attachment/0127/4704/23bd4dc7-8eaf-307a-9d7a-90b3fbc0a3eb.png)
![](http://dl2.iteye.com/upload/attachment/0127/4694/23dc29a5-5122-3722-8aad-8c6a8cd6b5ad-thumb.png)
大小: 188.3 KB
![](http://dl2.iteye.com/upload/attachment/0127/4696/7972822e-dd40-3113-b96c-808dbeecb717-thumb.png)
大小: 100.9 KB
![](http://dl2.iteye.com/upload/attachment/0127/4698/533d3d41-b260-3d4d-8548-8dd67fd533dc-thumb.png)
大小: 164.3 KB
![](http://dl2.iteye.com/upload/attachment/0127/4700/9baf2a46-5c0a-3c24-ad10-e7729542156e-thumb.png)
大小: 162.7 KB
![](http://dl2.iteye.com/upload/attachment/0127/4702/5873ed84-5a3f-3776-8186-8474d3fd4492-thumb.png)
大小: 43.9 KB
![](http://dl2.iteye.com/upload/attachment/0127/4704/23bd4dc7-8eaf-307a-9d7a-90b3fbc0a3eb-thumb.png)
大小: 103.4 KB
查看图片附件
Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。
二什么是数据仓库
数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。
集成的:数据仓库中的数据时来自分散的操作性数据,将操作性地数据从原来的数据中抽取出来,进行加工处理,满足一定的条件才能进入数据仓库。原来的数据可以来自于oracle数据库或Mysql数据库,也可以来自一个文本文件或者来自其他系统。我们把不同的数据集成起来,就形成了数据仓库。
不可更新的:主要是用来数据查询,不会在数据仓库中进行更新或删除。
三 数据仓库的结构和建立过程
![](http://dl2.iteye.com/upload/attachment/0127/4694/23dc29a5-5122-3722-8aad-8c6a8cd6b5ad.png)
四 OLTP应用
1、定义
OLTP:联机事务处理
2、典型应用
银行转账
![](http://dl2.iteye.com/upload/attachment/0127/4696/7972822e-dd40-3113-b96c-808dbeecb717.png)
五 OLAP应用
1、定义
OLAP:联机分析处理
2、典型应用
商品推荐系统
![](http://dl2.iteye.com/upload/attachment/0127/4700/9baf2a46-5c0a-3c24-ad10-e7729542156e.png)
六 数据仓库中的数据模型
![](http://dl2.iteye.com/upload/attachment/0127/4698/533d3d41-b260-3d4d-8548-8dd67fd533dc.png)
1、星型模型
![](http://dl2.iteye.com/upload/attachment/0127/4702/5873ed84-5a3f-3776-8186-8474d3fd4492.png)
2、雪花模型
![](http://dl2.iteye.com/upload/attachment/0127/4704/23bd4dc7-8eaf-307a-9d7a-90b3fbc0a3eb.png)
![](http://dl2.iteye.com/upload/attachment/0127/4694/23dc29a5-5122-3722-8aad-8c6a8cd6b5ad-thumb.png)
大小: 188.3 KB
![](http://dl2.iteye.com/upload/attachment/0127/4696/7972822e-dd40-3113-b96c-808dbeecb717-thumb.png)
大小: 100.9 KB
![](http://dl2.iteye.com/upload/attachment/0127/4698/533d3d41-b260-3d4d-8548-8dd67fd533dc-thumb.png)
大小: 164.3 KB
![](http://dl2.iteye.com/upload/attachment/0127/4700/9baf2a46-5c0a-3c24-ad10-e7729542156e-thumb.png)
大小: 162.7 KB
![](http://dl2.iteye.com/upload/attachment/0127/4702/5873ed84-5a3f-3776-8186-8474d3fd4492-thumb.png)
大小: 43.9 KB
![](http://dl2.iteye.com/upload/attachment/0127/4704/23bd4dc7-8eaf-307a-9d7a-90b3fbc0a3eb-thumb.png)
大小: 103.4 KB
查看图片附件
相关文章推荐
- Hive基础概念、安装部署与基本使用
- hive基本概念
- Hive学习之Hive基本概念及实践
- Hive基本概念及操作
- hive学习1(hive基本概念)
- 1001-hive基本概念
- hive (数据仓库工具) 基本概念
- HIVE 基本概念
- hive核心基本概念
- Hive笔记一之基本概念与安装
- Hive的基本概念
- hive的基本概念和安装
- JMS学习(1):MS基本概念
- SEO基本概念:什么叫反向链接?
- Android笔记 - Binder之基本概念
- 线性回归(linear-regression)预测算法基本概念&C++实现
- Eclipse中的基本概念
- 数据泵(一)-基本概念
- 数据结构中的基本概念
- Flex的一些基本概念和原理