您的位置:首页 > 数据库 > Oracle

SQOOP从Oracle导入数据到Hive时hang up在MapReduce作业过程

2016-10-21 14:38 731 查看
打算从Oracle一个模式中导入数据到Hive,打算导入的数据都存在视图里。

其他几个视图的导入过程都很顺利,有一个小坑是如果没有设置split-by column选项,只能用一个mapper(--num-mappers 1)。

基本语句为

sqoop import --hive-import --connect jdbc:oracle:thin:@//192.168.1.1:1521/orcl --username XXX --password XXX -m 1 --table DB.VIEW --as-textfile --hive-overwrite --create-hive-table --fields-terminated-by \\t --hive-table database.table
--null-string '\\N' --null-non-string '\\N';

但是有一个任务在执行MR时候一直卡死,状态是:

 INFO [IPC Server handler 23 on 50949] org.apache.hadoop.mapred.TaskAttemptListenerImpl: Progress of TaskAttempt attempt_1474343967582_0462_m_000000_0 is : 0.0

INFO [IPC Server handler 26 on 50949] org.apache.hadoop.mapred.TaskAttemptListenerImpl: Progress of TaskAttempt attempt_1474343967582_0462_m_000000_0 is : 0.0

INFO [IPC Server handler 25 on 50949] org.apache.hadoop.mapred.TaskAttemptListenerImpl: Progress of TaskAttempt attempt_1474343967582_0462_m_000000_0 is : 0.0

完成一直是0.0。

后来看了下数据库,发现这个视图中有一列需要从其他表抽取数据并经过大量计算。

结果选择除了这个列以外的列进行导入,任务顺利跑完。

最后把这个视图需要大量计算的列放到Hive里去跑。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: