Hadoop第十讲
2015-07-02 12:36
218 查看
Hadoop与关系数据库交换数据
文本转换方案(转换为CSV,文本等文件)
自写Java程序(用JDBC读关系数据库中的数据用Hadoop的API写入)
Sqoop(SQL-to-HDFS工具)
厂商提供的解决方案
Hadoop-0.20.2下使用Sqoop:
配置文件
Sqoop命令选项
从MySQL导入数据的例子
操作之前需要创建一个用户以方便Sqoop使用,有权限对数据库进行处理。
导入到Hbase的命令
从Oracle导入数据
Oracle Big Data Conectors
可以将Hadoop中的文件作为外部表,进行直接访问。
Oracle HDFS直接连接器(ODCH)实验
实验环境:具体步骤可以搜索相关官方资料
应用于Hbase的对接:通过Thrift
Thrift是一个跨语言的服务部署架构。Thrift通过一个中间语言(IDL,接口定义语言)来定义RPC的接口和数据类型,然后通过一个编译器生成不同语言的代码,并有生成的代码负责RPC协议层和传输层的实现。
具体的原理和使用可以参见博客:
1. http://dongxicheng.org/search-engine/thrift-framework-intro/
2. http://dongxicheng.org/search-engine/thrift-guide/
文本转换方案(转换为CSV,文本等文件)
自写Java程序(用JDBC读关系数据库中的数据用Hadoop的API写入)
Sqoop(SQL-to-HDFS工具)
厂商提供的解决方案
Hadoop-0.20.2下使用Sqoop:
配置文件
Sqoop命令选项
从MySQL导入数据的例子
操作之前需要创建一个用户以方便Sqoop使用,有权限对数据库进行处理。
导入到Hbase的命令
从Oracle导入数据
Oracle Big Data Conectors
可以将Hadoop中的文件作为外部表,进行直接访问。
Oracle HDFS直接连接器(ODCH)实验
实验环境:具体步骤可以搜索相关官方资料
应用于Hbase的对接:通过Thrift
Thrift是一个跨语言的服务部署架构。Thrift通过一个中间语言(IDL,接口定义语言)来定义RPC的接口和数据类型,然后通过一个编译器生成不同语言的代码,并有生成的代码负责RPC协议层和传输层的实现。
具体的原理和使用可以参见博客:
1. http://dongxicheng.org/search-engine/thrift-framework-intro/
2. http://dongxicheng.org/search-engine/thrift-guide/
相关文章推荐
- python脚本内运行linux命令的方法
- shell 操作 MySQL
- linux(Ubuntu)常用命令整理 -- 基础篇 -- 持续更新
- FaceBook/infer-linux下源码环境搭建
- linux语句和shell的反复练习
- Shell日期处理函数
- sqoop 安装配置(Hadoop2.4 + hive0.13)
- Nginx 网址
- linux目录结构详细介绍
- Apache JK集群环境session丢失问题
- linux命令学习
- opencv 感兴趣区域建立ROI
- 关于linux里面编程语句while的运用,转载
- 研究SLAM网站和有用站点-sourcecode+测试数据
- Nginx屏蔽访问过于频繁的IP
- Linux网卡虚拟化
- 11款可以优化网站着陆页的工具
- ecshop运行超过30秒超时的限制解决办法
- interactivePopGestureRecognizer
- Linux命令之while - Bash中的While循环