hive UDF开发入门(转)
2012-08-30 15:45
337 查看
编译源码保存的位置:I:\hive0.70\ql\src\java\org\apache\hadoop\hive\ql\exec
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以。
Hive的UDF开发只需要重构UDF类的evaluate函数即可。例:
package com.hrj.hive.udf;
import org.apache.hadoop.hive.ql.exec.UDF;
public class helloUDF extends UDF {
public String evaluate(String str) {
try {
return "HelloWorld " + str;
} catch (Exception e) {
return null;
}
}
}
将该java文件编译成helloudf.jar
hive> add jar helloudf.jar;
hive> create temporary function helloworld as 'com.hrj.hive.udf.helloUDF';
hive> select helloworld(t.col1) from t limit 10;
hive> drop temporary function helloworld;
注:
helloworld为临时的函数,所以每次进入hive都需要add jar以及create temporary操作
UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF
本文出自 “胡汝建个人博客” 博客,请务必保留此出处/article/4452612.html
Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以。
Hive的UDF开发只需要重构UDF类的evaluate函数即可。例:
package com.hrj.hive.udf;
import org.apache.hadoop.hive.ql.exec.UDF;
public class helloUDF extends UDF {
public String evaluate(String str) {
try {
return "HelloWorld " + str;
} catch (Exception e) {
return null;
}
}
}
将该java文件编译成helloudf.jar
hive> add jar helloudf.jar;
hive> create temporary function helloworld as 'com.hrj.hive.udf.helloUDF';
hive> select helloworld(t.col1) from t limit 10;
hive> drop temporary function helloworld;
注:
helloworld为临时的函数,所以每次进入hive都需要add jar以及create temporary操作
UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF
本文出自 “胡汝建个人博客” 博客,请务必保留此出处/article/4452612.html
相关文章推荐
- hive入门学习:UDF开发
- Hive UDF函数开发及企业规范
- Hive UDF开发(多个参数)
- Hive UDF函数开发及企业规范
- hive UDF开发实例
- Hive UDF开发
- hive udaf开发入门和运行过程详解
- hive udf开发超详细手把手教程
- hive开发UDF随记
- Hive UDF开发
- Hive UDF函数开发及企业规范
- Hive UDF开发指南
- hive UDF开发注意事项
- Hive UDF 开发
- [置顶] linux中用eclipse开发Hadoop mapreduce与Hive UDF实例详解及其配置说明
- Hive UDF函数开发及企业规范
- hive中UDF开发:解析json对象和解析json数组对象
- python hive udf开发
- Hive UDF开发-简介
- Hive UDF函数开发及企业规范