hadoop和hive压缩格式对比【数据源建议RCFile+bz或RCFile+gz的方式可以节省空间,计算过程建议RCFile+snappy,空间换时间】
2016-01-04 11:27
573 查看
hadoop中4种压缩格式的特征的比较
http://my.oschina.net/mkh/blog/335395
Hive数据压缩
http://blog.csdn.net/cnbird2008/article/details/9182869
hive 中间结果和结果数据压缩
http://bupt04406.iteye.com/blog/1152539 http://m.blog.csdn.net/blog/chenyi8888/14281939
在hive中使用压缩需要灵活的方式,如果是数据源的话,采用RCFile+bz或RCFile+gz的方式,这样可以很大程度上节省磁盘空间;
而在计算的过程中,为了不影响执行的速度,可以浪费一点磁盘空间,建议采用RCFile+snappy的方式,这样可以整体提升hive的执行速度。
至于lzo的方式,也可以在计算过程中使用,只不过综合考虑(速度和压缩比)还是考虑snappy适宜。
hadoop,hive启用lzo压缩和创建lzo索引
http://slaytanic.blog.51cto.com/2057708/1162287/
http://my.oschina.net/mkh/blog/335395
Hive数据压缩
http://blog.csdn.net/cnbird2008/article/details/9182869
hive 中间结果和结果数据压缩
http://bupt04406.iteye.com/blog/1152539 http://m.blog.csdn.net/blog/chenyi8888/14281939
在hive中使用压缩需要灵活的方式,如果是数据源的话,采用RCFile+bz或RCFile+gz的方式,这样可以很大程度上节省磁盘空间;
而在计算的过程中,为了不影响执行的速度,可以浪费一点磁盘空间,建议采用RCFile+snappy的方式,这样可以整体提升hive的执行速度。
至于lzo的方式,也可以在计算过程中使用,只不过综合考虑(速度和压缩比)还是考虑snappy适宜。
hadoop,hive启用lzo压缩和创建lzo索引
http://slaytanic.blog.51cto.com/2057708/1162287/
相关文章推荐
- android 四大组件学习(引用)
- iOS开发 关于ALAsset获取图库图片分辨率iOS7/iOS9适配
- iOS开发- 相机(摄像头)获取到的图片自动旋转90度解决办法
- iOS 精度问题
- Android Support Design Library之NavigationView
- iOS库.a与.framework
- AsyncTask详解
- Android Fragment 动态、静态切换
- Unity Shader 学习笔记(十) 滚动效果Shader实例
- [ios][swift]使用swift闭包进行viewcontroller反向传值
- String.valueof(null) 与 String.valueof((Object)null)
- Android分辨率
- iOS沙盒路径总结及存储方法
- Android 3.X中WebView使用ZOOM崩溃的问题
- Android 发展史!
- android事件分发 入口(dispatchTouchEvent)
- iOS国际化
- android 中 smack重新登录openfire服务器
- nagios 监控
- 日积月累--Android动画