您的位置:首页 > 其它

hive UDF开发入门(转)

2012-08-30 15:45 337 查看
编译源码保存的位置:I:\hive0.70\ql\src\java\org\apache\hadoop\hive\ql\exec

Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以。

Hive的UDF开发只需要重构UDF类的evaluate函数即可。例:

package com.hrj.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;

public class helloUDF extends UDF {

public String evaluate(String str) {

try {

return "HelloWorld " + str;

} catch (Exception e) {

return null;

}

}

}

将该java文件编译成helloudf.jar

hive> add jar helloudf.jar;

hive> create temporary function helloworld as 'com.hrj.hive.udf.helloUDF';

hive> select helloworld(t.col1) from t limit 10;

hive> drop temporary function helloworld;

注:

helloworld为临时的函数,所以每次进入hive都需要add jar以及create temporary操作

UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF

本文出自 “胡汝建个人博客” 博客,请务必保留此出处/article/4452612.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: