深入浅出hive-hive简介
2013-07-30 15:00
260 查看
1. 什么是hive
•Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
•本质是将HQL转换为MapReduce程序
2. 为什么使用hive
•操作接口采用类SQL语法,提供快速开发的能力
•避免了去写MapReduce,减少开发人员的学习成本
•扩展功能很方便
3. hive 特点
•可扩展
Hive可以自由的扩展集群的规模,一般情况下不需要重启服务
•延展性
Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数
•容错
良好的容错性,节点出现问题SQL仍可完成执行
4. hive 与hadoop 关系
发出HQL —> hive 转换成mapreduce —> mapreduce —> 对hdfs进行操作
5. hive 与传统数据对比
6. hive 的未来
•增加更多类似传统数据库的功能,如存储过程
•提高转换成的MapReduce性能
•拥有真正的数据仓库的能力
•UI部分加强
•Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
•本质是将HQL转换为MapReduce程序
2. 为什么使用hive
•操作接口采用类SQL语法,提供快速开发的能力
•避免了去写MapReduce,减少开发人员的学习成本
•扩展功能很方便
3. hive 特点
•可扩展
Hive可以自由的扩展集群的规模,一般情况下不需要重启服务
•延展性
Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数
•容错
良好的容错性,节点出现问题SQL仍可完成执行
4. hive 与hadoop 关系
发出HQL —> hive 转换成mapreduce —> mapreduce —> 对hdfs进行操作
5. hive 与传统数据对比
Hive | RDBMS | |
查询语言 | HQL | SQL |
数据存储 | HDFS | Raw Device or Local FS |
执行 | MapReduce | Excutor |
执行延迟 | 高 | 低 |
处理数据规模 | 大 | 小 |
索引 | 0.8版本后加入位图索引 | 有复杂的索引 |
•增加更多类似传统数据库的功能,如存储过程
•提高转换成的MapReduce性能
•拥有真正的数据仓库的能力
•UI部分加强
相关文章推荐
- 深入浅出学Hive——Hive优化
- 深入浅出数据仓库中SQL性能优化之Hive篇
- 深入浅出数据仓库中SQL性能优化之Hive篇
- Hive QL——深入浅出学Hive
- 深入浅出nodejs学习笔记-前三章 简介、模块机制、异步I/O
- Hive 分区的简介
- 深入浅出Mybatis系列(六)---objectFactory、plugins、mappers简介与配置
- Java私塾:Hive JDBC——深入浅出学Hive
- hive(一) hive背景知识介绍-数据仓库技术简介
- 深入浅出JMS(一)——JMS简介
- Hive体系结构 —— 深入浅出学Hive
- 深入浅出Mybatis系列(二)---配置简介(mybatis源码篇)
- Hive体系结构 —— 深入浅出学Hive
- (10)Hive体系结构 —— 深入浅出学Hive
- Sentry简介—Getting Started with Sentry in Hive
- Hive深入浅出
- 深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布
- Hive安装与配置——深入浅出学Hive
- Hive 学习笔记(一)Hive简介
- 深入浅出学Hive——Hive体系结构