hive sql按照固定长度分隔字符串
2017-08-18 12:11
1556 查看
1.问题引出
hive sql中提供了字符串分隔函数split,但是该函数并不能按照固定长度来分隔字符串。因此要想实现按照固定长度来分隔字符串,需要我们来自定义UDF函数来实现。
2.整体思路
hivesql中提供的字符串分隔函数split可以按照指定的字符或者正则表达式来分隔字符串,因此我们可以将字符串按照固定的长度来添加指定的字符,之后就可以使用split函数来分隔该字符串以达到按照固定长度来分割字符串的目的。
3. 自定义函数代码
publicString evaluate(Stringcontext,intstep){
if(context.length()<step){
returncontext;
}
StringBuilder sb=newStringBuilder();
intstart= 0;
sb.append(context.substring(0,step));
start+=step;
while(context.length()>=start+step){
sb.append(","+context.substring(start,start+step));
start+=step;
}
if(context.length()>start){
sb.append(","+context.substring(start));
}
returnsb.toString();
}
该函数要求输入一个字符串和int类型的指定长度,返回的结果就是该字符串按照固定长度添加英文逗号的结果字符串。
4. 实验
以下所有的代码都在hive客户端(命令行)中执行。
1. 将程序jar包上传至服务器,并在hive中创建临时函数
addjar /opt/cloudera/parcels/CDH/lib/hive/lib/change.jar;
create temporary function change as 'cn.baihe.wzq.change.Change';
上面两句话大家按照自己存放jar包的位置和类的完全限定名编写就行。
2. 调用自定义函数演示
hive>select change('123456789', 2);
OK
12,34,56,78,9
hive>select change('123456789', 9);
OK
123456789
hive>select change('123456789', 10);
OK
123456789
hive>select change('', 2);
OK
如果输入的字符串为空,则返回的结果也为空。这个效果可以在代码中看出来。
5. 按照固定长度分隔字符串
hive>select split(change('123456789', 2), ',');
OK
["12","34","56","78","9"]
hive sql中提供了字符串分隔函数split,但是该函数并不能按照固定长度来分隔字符串。因此要想实现按照固定长度来分隔字符串,需要我们来自定义UDF函数来实现。
2.整体思路
hivesql中提供的字符串分隔函数split可以按照指定的字符或者正则表达式来分隔字符串,因此我们可以将字符串按照固定的长度来添加指定的字符,之后就可以使用split函数来分隔该字符串以达到按照固定长度来分割字符串的目的。
3. 自定义函数代码
publicString evaluate(Stringcontext,intstep){
if(context.length()<step){
returncontext;
}
StringBuilder sb=newStringBuilder();
intstart= 0;
sb.append(context.substring(0,step));
start+=step;
while(context.length()>=start+step){
sb.append(","+context.substring(start,start+step));
start+=step;
}
if(context.length()>start){
sb.append(","+context.substring(start));
}
returnsb.toString();
}
该函数要求输入一个字符串和int类型的指定长度,返回的结果就是该字符串按照固定长度添加英文逗号的结果字符串。
4. 实验
以下所有的代码都在hive客户端(命令行)中执行。
1. 将程序jar包上传至服务器,并在hive中创建临时函数
addjar /opt/cloudera/parcels/CDH/lib/hive/lib/change.jar;
create temporary function change as 'cn.baihe.wzq.change.Change';
上面两句话大家按照自己存放jar包的位置和类的完全限定名编写就行。
2. 调用自定义函数演示
hive>select change('123456789', 2);
OK
12,34,56,78,9
hive>select change('123456789', 9);
OK
123456789
hive>select change('123456789', 10);
OK
123456789
hive>select change('', 2);
OK
如果输入的字符串为空,则返回的结果也为空。这个效果可以在代码中看出来。
5. 按照固定长度分隔字符串
hive>select split(change('123456789', 2), ',');
OK
["12","34","56","78","9"]
相关文章推荐
- SQL获得固定长度的随机字符串
- 将字符串按固定长度分隔成子串
- python 按照固定长度分割字符串的方法小结
- python按照固定长度分割字符串
- Sql将一个整型数字转换成带前导零的固定长度数字字符串
- SQL截取非固定长度(有关键字符)的字符串
- Sql 将一个整型数字转换成带前导零的固定长度数字字符串
- python 按照固定长度分割字符串
- 按固定长度分割字符串
- PHP explode 按照固定字符截字符串成数组
- Collections练习之按照字符串长度进行排序
- c#按照指定长度切分字符串
- 产生随机字符串,固定长度的
- SQL字符串逗号分隔函数
- 更改sql多条数据,更新替换字符串中固定的字符串
- sql server 2005 T-SQL binary 和 varbinary (Transact-SQL)固定长度或可变长度的 Binary 数据类型。
- 将一个以逗号分隔的字符串拆分单个记录,并生成插入sql语句
- 通用固定长度编码格式的字符串查找算法的实现
- 【SQL】小心字符串拼接导致长度爆表
- ASP.NET - 截取固定长度字符串显示在页面,多余部分显示为省略号