您的位置:首页 > 其它

Hive create external table partition关联数据文件

2013-12-27 14:53 417 查看
EXTERNAL 外部表 在建表的时候制定一个指向实际数据的路径(LOCATION)

hive创建内部表时,会将数据移动到数据仓库指向的路径;

创建外部表时,仅记录数据所在的路径,不对数据的位置做任何改变,

在删除表的时候:

内部表的元数据和数据会被一起删除,

而外部表只删除元数据,不删除数据。

HDFS中已经导入了城市日期数据文件。

/user/songwei/cityFile/visitDate=2011-10-23

/user/songwei/cityFile/visitDate=2011-10-24

创建外部表:

create external table test1(ip STRING,city STRING) partitioned by(visitDate STRING)

row format delimited fields terminated by '\t' STORED AS TEXTFILE location '/user/songwei/cityFile'

在hive中执行:

select count(*) from test1 ;

没有任何返回结果。

这是因为hive并不会自动关联hdfs中指定目录的partitions目录。

需要通过:

alter table test1 add partition (visitDate=2011-10-23);进行分区与分区数据的关联。

此时可以通过查找hive对应的db的meta数据进行查看。

查找test1表:

select * from TBLS where TBL_NAME='test1'

找出表ID

查找该表对应的分区信息:

select * from PARTITIONS where tbl_id=1;

能够查到通过alter table test1 add partitions(visitDate=2011-10-23)添加的分区信息。

英文标签:query external table with partitions not return any data

可以通过如下语句转换外部表和内部表

alter table tablePartition set TBLPROPERTIES ('EXTERNAL'='TRUE'); //内部表转外部表

alter table tablePartition set TBLPROPERTIES ('EXTERNAL'='FALSE'); //外部表转内部表
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: