Oracle从字符串资源中得到想要的数据分析
2012-06-13 16:29
197 查看
[oracle]从字符串资源中得到想要的数据分析
需求:订单分析,按照游戏,帐号级别,游戏帐号职业,区服,价格区间分析各款交易数据走势
。
目标:订单表(order)
处理分析:订单中可以直接读到的标示有游戏、区服、价格。并且已经有相关配置可以关联此类
信息。
问题分析1:帐号职业,帐号级别等交易信息在订单中没有详细的标示,只可以通过其他信息获
取。
处理思路1:通过订单中的标题大概的分析职业和帐号级别。
标题格式如:
![](http://pic002.cnblogs.com/images/2012/418191/2012061316245712.png)
处理思路:从标题中提取出职业和帐号等级。
职业:
substr
(
o5.bizoffername,
instr(o5.bizoffername,'【',1,1)+1,
instr(o5.bizoffername,' ',1,1)-(instr(o5.bizoffername,'【',1,1)+1)
)
级别:
substr
(
o5.bizoffername,
instr(o5.bizoffername,' ',1,3)+1,
instr(o5.bizoffername,'级',1,1)-(instr(o5.bizoffername,' ',1,3)+1)
)
处理结果如图:
![](http://pic002.cnblogs.com/images/2012/418191/2012061316251432.png)
问题分析2:级别类似'50'这样的是从字符串中提取出来的,作为参数和帐号级别区间维度比较
时会发生无效字符。
处理思路2:果断的想到把字符转化为number,to_number。
问题分析3:转化为to_number后还是会遇到无效字符。
处理思路3:还存在着其他问题,于是创建了一个自定义函数is_number。
CREATE OR REPLACE FUNCTION is_number(parameter VARCHAR2) RETURN NUMBER IS
val NUMBER;
BEGIN
val := TO_NUMBER(NVL(parameter, 'a'));--参数为空则复制字符a
RETURN 1;
EXCEPTION--当遇到'40'这样的TO_NUMBER转化正常,当遇到'40的'时TO_NUMBER异常返回0,
WHEN OTHERS THEN
RETURN 0;
END;
然后看了用思路1处理出来的基础数据,用where IS_NUMBER(级别)=0,发现确实存在一些很少的
处理不规范的'你好20'类似级别字段与number区间判断时就报错了,根源所在。于是只好排除了
这几十条不规则的数据。最终得到业务的需求:
需求:订单分析,按照游戏,帐号级别,游戏帐号职业,区服,价格区间分析各款交易数据走势
。
目标:订单表(order)
处理分析:订单中可以直接读到的标示有游戏、区服、价格。并且已经有相关配置可以关联此类
信息。
问题分析1:帐号职业,帐号级别等交易信息在订单中没有详细的标示,只可以通过其他信息获
取。
处理思路1:通过订单中的标题大概的分析职业和帐号级别。
标题格式如:
![](http://pic002.cnblogs.com/images/2012/418191/2012061316245712.png)
处理思路:从标题中提取出职业和帐号等级。
职业:
substr
(
o5.bizoffername,
instr(o5.bizoffername,'【',1,1)+1,
instr(o5.bizoffername,' ',1,1)-(instr(o5.bizoffername,'【',1,1)+1)
)
级别:
substr
(
o5.bizoffername,
instr(o5.bizoffername,' ',1,3)+1,
instr(o5.bizoffername,'级',1,1)-(instr(o5.bizoffername,' ',1,3)+1)
)
处理结果如图:
![](http://pic002.cnblogs.com/images/2012/418191/2012061316251432.png)
问题分析2:级别类似'50'这样的是从字符串中提取出来的,作为参数和帐号级别区间维度比较
时会发生无效字符。
处理思路2:果断的想到把字符转化为number,to_number。
问题分析3:转化为to_number后还是会遇到无效字符。
处理思路3:还存在着其他问题,于是创建了一个自定义函数is_number。
CREATE OR REPLACE FUNCTION is_number(parameter VARCHAR2) RETURN NUMBER IS
val NUMBER;
BEGIN
val := TO_NUMBER(NVL(parameter, 'a'));--参数为空则复制字符a
RETURN 1;
EXCEPTION--当遇到'40'这样的TO_NUMBER转化正常,当遇到'40的'时TO_NUMBER异常返回0,
WHEN OTHERS THEN
RETURN 0;
END;
然后看了用思路1处理出来的基础数据,用where IS_NUMBER(级别)=0,发现确实存在一些很少的
处理不规范的'你好20'类似级别字段与number区间判断时就报错了,根源所在。于是只好排除了
这几十条不规则的数据。最终得到业务的需求:
![](http://pic002.cnblogs.com/images/2012/418191/2012061316254770.png)
相关文章推荐
- Oracle从字符串资源中得到想要的数据分析
- 利用Oracle分析函数实现多行数据合并为一行
- Oracle instr()函数获取数据字段已知字符串的位置
- oracle函数+过程,解析字符串信息作为字段,并动态更新数据表
- oracle查询结果字符串用于查询条件in中,查不到数据
- oracle下数据的排序分组row_number() over()--分析函数,可用于去重
- Thread Dump分析Oracle SOA的JDBC连接池资源抢夺问题
- java多线程,将oracle中数据导入到sql到文件(包括大字段转换成字符串)
- 在PHP代码中处理JSON 格式的字符串【或用file_get_content得到的数据】
- Oracle中多行数据聚合成一行(这里讨论的是字符串的聚合)的几种方案和他们的对比
- 常用数据分析资源
- Oracle ERP 报表:类数字格式字符串数据的前置0被截取和被科学计数法表示
- 统计分析&数据挖掘&数学优化&developer 方面的资源列表(持续添加中。。。)强烈推荐
- oracle 正则表达式 ( 前端传入连续字符串分析..)
- 小象学院 数据分析和数据挖掘资源分享
- ORACLE 数据分析和动态采样
- oracle中字符串类型数据不全
- 从一个字符串中提取想要的数据
- Oracle字符乱码、数据越界访问典型Bug分析
- oracle 分析问题时细心观察数据的规律