您的位置:首页 > 大数据

熟悉Hive 实验2

2016-06-13 00:06 190 查看

实验题目

探索Hive-熟悉Hive-使用Hive查询语言进行查询。

实验要求

使用不同的查询语句查询stock_data文件中的数据。

操作步骤

1.从表中检索数据
使用select查询date为‘2013-12-12’的一条数据。



结果在倒数第二行,经过32.266秒后,查询成功。

2.检索数据,并限定检索数量

检索数量小于1500000的三条数据。



结果在倒数3-5行,共3条,用时30秒左右。

3.使用HQL创建两个表Post_data_uk和Post_data_us;



建立两个表,并给出基本结构。

4.将附件数据载入表格;

从本地的文件中导入两表的数据。



5.使用first_name列连接两张表;



6.使用left outer join、right outer join和full outer join连接两张表;

left outer join:



right outer join:



full outer join:



7.创建包含分区的表Post_data,分区字段为country string;

建立Post_data:



8.加载post_uk和post_us数据到Post_data;

将post_uk和post_us分别加载到Post_data的uk及us分区中。



实验结果

查看建立结果:



总结

忙了这阵,需要总结HQL的基本操作,大概在七月初。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  学习笔记 大数据