hive内部标和外部表的区别
2015-07-19 23:10
417 查看
HIve 创建内部表时,会将数据移动到数据仓库指定的路径;创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变。
在删除表时,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删数据。
Hive中的读时模式与rdbm的写实模式:读时模式,只有在读取数据的时候hive才检查、解析具体的数据字段、schema,它的优势是load data 非常迅速,因为它不需要读取数据进行解析,仅仅进行文件的复制或者移动。
写时模式,的优势是提升了查询性能,因为预先解析之后可以对列建立索引,并压缩,但会花费更多的加载时间。
在删除表时,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删数据。
Hive中的读时模式与rdbm的写实模式:读时模式,只有在读取数据的时候hive才检查、解析具体的数据字段、schema,它的优势是load data 非常迅速,因为它不需要读取数据进行解析,仅仅进行文件的复制或者移动。
写时模式,的优势是提升了查询性能,因为预先解析之后可以对列建立索引,并压缩,但会花费更多的加载时间。
相关文章推荐
- Swift开发教程--如何自定义TabBarItem的图片显示
- java基础之instanceof的用法详解
- linux程序设计——IPC状态命令(第十四章)
- HDU1201 18岁生日
- 设计模式--职责链模式
- Tomcat虚拟目录的配置
- Palindrome Number
- 源代码控制管理工具_git&svn
- 2015071905 - 你付出了什么?
- WPF基础学习笔记(一)Dependency Object 和 Dependency Property
- hdu 2896 字典树解法
- C++中类的多继承
- String to Integer (atoi)
- shell脚本-批量添加或删除用户
- 八皇后问题
- MATLAB-GUI-CALLBACK用法
- poj 2236并查集
- 常用类库—--字符串
- 2015071904 - 要有意识地磨练自己的意志
- python while语句