CDH学习记录
2015-11-05 18:05
417 查看
本文简要概括Cloudera的用户体验指南中各章节内容:
+ 在线体验(Cloudera Live)
+ 本地虚拟机安装(QuickStart VM)
登录Hue可以在浏览器中通过Impala对数据进行检索,Impala中可以用标准SQL语句,和在关系数据库中没有区别。
利用Apache Flume整合日志文件以及Morphline中定义的日志文件转换规则
在Hue中高效查询日志数据
1. 安装
两种方式体验Cloudera产品+ 在线体验(Cloudera Live)
+ 本地虚拟机安装(QuickStart VM)
2. 场景一:导入并查询关系数据
通过sqoop命令把存在于mysql数据库中的数据在内部以mapreduce任务的方式导入到HDFS中,文件格式为Apache Parquet(为hadoop中的分析型应用设计的数据格式),随后创建Impala/Apache Hive表。登录Hue可以在浏览器中通过Impala对数据进行检索,Impala中可以用标准SQL语句,和在关系数据库中没有区别。
3. 场景二:批量导入文件数据
通过”CREATE EXTERNAL TABLE”导入网站访问日志数据到HIVE中,然后在Impala中用SQL进行产品的访问排行。4. 场景三:分析日志数据
利用Apache solr建立日志索引配置文件利用Apache Flume整合日志文件以及Morphline中定义的日志文件转换规则
在Hue中高效查询日志数据
相关文章推荐
- Cloudera 推动即时通讯巨头 LINE 实现数据驱动的创新
- Build Your Own Cluster
- Cloudera大数据培训开班信息
- Cloudera Hadoop管理员培训课程—成都站
- Cloudera Hadoop Developer开发者课程免费听
- Cloudera Hadoop Developer数据分析师—上海
- Cloudera 开发者 北京
- “暖心回馈”Cloudera全套课程价值11000元免费送!!
- Hadoop Sentry 学习
- Troubleshooting: java.lang.RuntimeException: HMaster Aborted
- 离线安装cloudera manager5.0.2
- 【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析
- Hadoop技术预览
- Impala简明调优手册
- trying new thing
- 方案四成功了奥
- so now what
- ssh无密码登陆配置以及yum安装之前遇到的问题解决
- Cloudera Impala: Real-Time Queries in Apache Hadoop, For Real