Hive On Spark和SparkSQL
2016-03-27 11:26
316 查看
SparkSQL和Hive On Spark都是在Spark上实现SQL的解决方案。Spark早先有Shark项目用来实现SQL层,不过后来推翻重做了,就变成了SparkSQL。这是Spark官方Databricks的项目,Spark项目本身主推的SQL实现。
Hive On Spark比SparkSQL稍晚。Hive原本是没有很好支持MapReduce之外的引擎的,而Hive On Tez项目让Hive得以支持和Spark近似的Planning结构(非MapReduce的DAG)。所以在此基础上,Cloudera主导启动了Hive On Spark。这个项目得到了IBM,Intel和MapR的支持(但是没有Databricks)。
Hive On Spark比SparkSQL稍晚。Hive原本是没有很好支持MapReduce之外的引擎的,而Hive On Tez项目让Hive得以支持和Spark近似的Planning结构(非MapReduce的DAG)。所以在此基础上,Cloudera主导启动了Hive On Spark。这个项目得到了IBM,Intel和MapR的支持(但是没有Databricks)。
相关文章推荐
- mysql5.5 对触发器,函数,存储引擎,事件进行主从复制情况.(转)
- SQL join笔记
- 数据库管理系统的设计与实现
- MySQL DateFormat函数
- oracle自动备份数据库
- SQL的join操作
- Memcached
- redis常见操作
- Oracle安装过程及可能产生的错误
- SQL - 分页存储过程
- 关于Dovecot 与 mysql 安装的一场巨汗。
- <<MySchool数据库设计优化>> 内部测试
- 将PL/SQL代码封装在机灵的包中
- sql学习笔记(二)
- 业务 加载DB数据到内存的 一些基本原则
- oracle11g 在azure云中使用rman进行实例迁移
- [mysql] mysqldump 导出数据库表
- 基于MongoDB GridFS的图片存储
- 关系型数据库工作原理-高速缓存(翻译自Coding-Geek文章)
- incompatible with sql_mode=only_full_group_by