您的位置:首页 > 数据库

hive sql按照固定长度分隔字符串

2017-08-18 12:11 1556 查看
1.问题引出

        hive sql中提供了字符串分隔函数split,但是该函数并不能按照固定长度来分隔字符串。因此要想实现按照固定长度来分隔字符串,需要我们来自定义UDF函数来实现。

 

2.整体思路

        hivesql中提供的字符串分隔函数split可以按照指定的字符或者正则表达式来分隔字符串,因此我们可以将字符串按照固定的长度来添加指定的字符,之后就可以使用split函数来分隔该字符串以达到按照固定长度来分割字符串的目的。

3. 自定义函数代码
     publicString evaluate(Stringcontext,intstep){
        if(context.length()<step){
           returncontext;
        }
        StringBuilder sb=newStringBuilder();
        intstart= 0;
        sb.append(context.substring(0,step));
        start+=step;
        while(context.length()>=start+step){
           sb.append(","+context.substring(start,start+step));
           start+=step;
        }
        if(context.length()>start){
           sb.append(","+context.substring(start));
        }
        returnsb.toString();
     }
     该函数要求输入一个字符串和int类型的指定长度,返回的结果就是该字符串按照固定长度添加英文逗号的结果字符串。
 
4. 实验
     以下所有的代码都在hive客户端(命令行)中执行。
    1. 将程序jar包上传至服务器,并在hive中创建临时函数
          addjar /opt/cloudera/parcels/CDH/lib/hive/lib/change.jar;
          create temporary function change as 'cn.baihe.wzq.change.Change';
          上面两句话大家按照自己存放jar包的位置和类的完全限定名编写就行。
   2. 调用自定义函数演示
        hive>select change('123456789', 2);
          OK
          12,34,56,78,9
     
      hive>select change('123456789', 9);
        OK
        123456789
 
      hive>select change('123456789', 10);
        OK
        123456789
 
      hive>select change('', 2);
        OK
     
      如果输入的字符串为空,则返回的结果也为空。这个效果可以在代码中看出来。
 
5. 按照固定长度分隔字符串
     hive>select split(change('123456789', 2), ',');
       OK
        ["12","34","56","78","9"]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: