您的位置:首页 > 数据库

【正则】构造复杂SQL语句的正则表达式1

2010-10-29 09:13 363 查看
以前做人口数据库时经常写些比较长的SQL语句,最长至上百行,看懂也得半天,恰巧在项目中遇见需要提取其中的条件子句,那时对正则也研究了一下,所以就顺便用正则写了个SQL语句分析、校验工具。正则表达式一般用在验证模式中,但个人认为验证只是正则的功能之一,在文本数据处理中才能发挥它的真正作用。利用正则表达式校验分析SQL语句,对于日常开发中,可能有简单问题复杂化之嫌,但这属于一个学习SQL和正则的绝佳机会。
【问题】先提出一个很简单的问题:如何提取Select语句中的使用的表和字段,以及过滤条件?

select count(distinct pis_p_renk_1.sysid) as result,
pis_p_renk.juzhd as address,
pis_p_guanlshx.guanlshx as guanlshx,
pis_p_renk.hukxzh as hukxzh
from pis_p_renk,
pis_p_guanlshx,
pis_p_zhuxyy,
pis_p_zinshx,
pis_p_guanx,
pis_p_renk as pis_p_renk_1
where pis_p_renk.sysid = pis_p_guanlshx.renkid
and pis_p_renk.sysid = pis_p_zhuxyy.renkid
and pis_p_renk_1.sysid = pis_p_guanx.renkid
and pis_p_renk.sysid = pis_p_guanx.guanxrid
and pis_p_guanx.sysid = pis_p_zinshx.guanxid
and pis_p_guanx.guanxlx = '2'
and pis_p_renk_1.xingb = '2'
and substr(pis_p_renk.chushrq, 1, 6) between substr('@StartTime', 1, 6) and
substr('@EndTime', 1, 6)
and pis_p_guanlshx.dangq = '1'
and (pis_p_guanlshx.guanlshxbdshj = '' or
pis_p_guanlshx.guanlshxbdshj is null or
pis_p_guanlshx.guanlshxbdshj is null or
substr(pis_p_guanlshx.guanlshxbdshj, 1, 6) <=
substr(pis_p_renk.chushrq, 1, 6))
and pis_p_renk.juzhd like '@Address%'
and pis_p_zinshx.zinshx not in ('3', '4', '8')
and pis_p_renk.zhengcnw = '5'
and pis_p_renk.xingb = '2'

(一)以下是概括分析思路:
将Select语句中各组成部分进行粗粒度、细粒度划分,然后将细粒度部分匹配正则表达式,再将细粒度合成粗粒度部分,最后组成完整正则表达式,可以校验语句,在正则捕获中可以获取各组成部分。
SQL正则构建工具:用于粗粒度、细粒度正则匹配。



SQL语句分析工具:分析SQL语句各组成部分。



(二)语句构造粗粒度分析(待续)

(三)细粒度正则匹配

(四)完整正则表达式搭建
(五)SQL正则分析过程
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: