hive笔记-通过修改源码注册永久UDF
2018-01-12 23:28
274 查看
准备:先下载对应版本的源码,并源码编译一次。
1、找出对应的java文件,并对其修改
[root@hadoop001 hive-1.1.0-cdh5.7.0]# find . -name FunctionRegistry.java
./ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java
2、修改FunctionRegistry.java文件,在文件的static块中参考其它函数的注册方法和导入自定义的java文件即可。
例如参考:Substr这个函数
import org.apache.hadoop.hive.ql.udf.UDFSubstr;
import org.apache.hadoop.hive.ql.udf.HelloWord; // 添加自定义UDF的包
static {
system.registerGenericUDF("concat", GenericUDFConcat.class);
system.registerUDF("my_hello", HelloWord.class, false, new FunctionResource[0]); // 添加注册信息
system.registerUDF("substr", UDFSubstr.class, false);
...
}
3、进入UDFSubstr.java(实现Substr的文件)的同级目录,直接vi HelloWord.java ,然后复制黏贴感觉更效率。
4、编译 mvn clean package -Phadoop-2 -DskipTests -Pdist5、替换lib(替换前别忘了备份、替换前别忘了备份、替换前别忘了备份),这里别忘了把原来lib中mysql驱动拷贝回来
6、进入hive检查是否存在该函数
hive> desc function my_hello;
OK
my_hello(String)
Time taken: 0.018 seconds, Fetched: 1 row(s)
OK。
hive> select my_hello(ename) from emp_dept_partition limit 3;
OK
HelloWord:SMITH
HelloWord:JONES
HelloWord:SCOTT
Time taken: 0.108 seconds, Fetched: 3 row(s)
【来自@若泽大数据】
1、找出对应的java文件,并对其修改
[root@hadoop001 hive-1.1.0-cdh5.7.0]# find . -name FunctionRegistry.java
./ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java
2、修改FunctionRegistry.java文件,在文件的static块中参考其它函数的注册方法和导入自定义的java文件即可。
例如参考:Substr这个函数
import org.apache.hadoop.hive.ql.udf.UDFSubstr;
import org.apache.hadoop.hive.ql.udf.HelloWord; // 添加自定义UDF的包
static {
system.registerGenericUDF("concat", GenericUDFConcat.class);
system.registerUDF("my_hello", HelloWord.class, false, new FunctionResource[0]); // 添加注册信息
system.registerUDF("substr", UDFSubstr.class, false);
...
}
3、进入UDFSubstr.java(实现Substr的文件)的同级目录,直接vi HelloWord.java ,然后复制黏贴感觉更效率。
[root@hadoop001 hive-1.1.0-cdh5.7.0]# find . -name UDFSubstr.java ./ql/src/java/org/apache/hadoop/hive/ql/udf/UDFSubstr.javaHelloWord.java代码如下
package org.apache.hadoop.hive.ql.udf; import org.apache.hadoop.hive.ql.exec.Description; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; @Description( name = "my_hello", value = "my_hello(String)", extended = "return new Text(\"HelloWord:\" + s.toString());" ) public class HelloWord extends UDF { public Text evaluate(final Text s) { if (s == null) { return null; } return new Text("HelloWord:" + s.toString()); } public static void main(String str[]) { System.out.println("hello"); Text s = new Text("abc"); System.out.println(new HelloWord().evaluate(s).toString()); } }
4、编译 mvn clean package -Phadoop-2 -DskipTests -Pdist5、替换lib(替换前别忘了备份、替换前别忘了备份、替换前别忘了备份),这里别忘了把原来lib中mysql驱动拷贝回来
6、进入hive检查是否存在该函数
hive> desc function my_hello;
OK
my_hello(String)
Time taken: 0.018 seconds, Fetched: 1 row(s)
OK。
hive> select my_hello(ename) from emp_dept_partition limit 3;
OK
HelloWord:SMITH
HelloWord:JONES
HelloWord:SCOTT
Time taken: 0.108 seconds, Fetched: 3 row(s)
【来自@若泽大数据】
相关文章推荐
- hive udf开发以及永久注册udf函数
- hive udf开发以及永久注册udf函数
- 不改ueditor源码,通过修改配置文件,实现图片放到工程外目录
- (源码实例)通过层DIV实现,当鼠标放在链接上面,显示图片及文字 - 流星絮语 JAVA学习笔记 - CSDNBlog
- js笔记一:通过jQuery添加修改样式
- 自定义UDTF和hive自定义函数的永久注册
- Hive之UDF创建永久函数
- ubuntu16.04通过修改transmission源码编译安装transmission,使得其能够通过ipv6在六维下载
- 将自定义函数 helloUDF2 注册到hive 源码中,并且重新编译hive
- Hive源码编译及阅读修改调试
- struts国际化默认保存在request中,一般通过过滤器修改让其保存在session;这介绍如何从<s:text>源码中修改local
- (6)birt笔记 - 通过传递变量来动态修改数据集SQL
- hive的学习笔记2-hive源码的编译
- 通过Foxit和坚果云实现iPad和PC的pdf同步阅读(修改,笔记)
- OBS源码阅读笔记--如何在外部修改推流分辨率
- Android 4.2 通过修改FrameWork源码实现动态隐藏导航栏,实现全屏
- java WEB开发 找回密码 如何通过注册时候的邮箱找回(修改)密码
- Netty源码分析笔记之运行Netty 源码自带的例子example时,编译不通过
- 通过修改源码,免插件实现wordpress去除链接中的category
- 第69课:SparkSQL通过Hive数据源实战学习笔记