巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行
2014-08-07 00:00
483 查看
问题提出
先造一些测试数据以说明题目:
DECLARE @TestData TABLE(ID INT,Col1 VARCHAR(20),Col2 VARCHAR(20))
INSERT INTO @TestData(ID,Col1,Col2)
SELECT 1,'New','Approved' UNION ALL
SELECT 2,'Approved','Commited' UNION ALL
SELECT 3,'Commited','In Progress' UNION ALL
SELECT 4,'New','Approved' UNION ALL
SELECT 5,'New','Approved' UNION ALL
SELECT 6,'New','Approved' UNION ALL
SELECT 7,'Approved','Removed'
SELECT * FROM @TestData
数据说明,ID列连续自增,列1和列2都是TFS中PBI的状态记录,就是从什么变更到什么,如新建到批准,批准到提交神马的
现在要求连续且相同的状态变更记录合并,不连续或者不同的状态变更保留,例如:
以上图为例,ID为1,4,5,6的记录都是从New到Approved状态,但是记录1与记录4、5、6不相邻,或者说不连续,那么就要分成两组,
记录1一组,记录4、5、6一组,其它记录因为状态变更不相同所以全部保留,最后的查询结果应该长成下图这个样子:
继续之前你可以先自己试下,这可能会带来新的解题思路,
解题思路
该问题的关键在于GROUP BY会把记录1、4、5、6合并在一起,而这不符合要求,仅需要合并4、5、6,源表里没有这样一个字段可以将记录1与记录4、5、6区分开来,这是解题的关键
这里可以利用RANK函数配合使用PARTITION关键字,首先把1456分到一组去,同时产生一个组内排名的新字段R,这个排名R很关键,后边会用到,见下图:
RANK函数不了解的点这里
RANK函数以Col1 + Col2为分组条件,这样分成了四组,分别是New-Approved、Approved-Commited、Commited-In Progress、Approved-Removed
在New-Approved组内,记录1、4、5、6分别排名1、2、3、4;其它组内仅一条记录,在其组内排名均为1
现在制造了一个R字段,R字段标识了每条记录在其组内的排名,排名自1开始递增,
源表内ID自增,组内排名R递增,这就是解题的关键,
当连续相同的记录出现时,其ID与其排名R在同时递增,则其差值是相同的,拿到这个差值就可以很容易解决题目了,看下图:
记录4、5、6相同且连续出现,其ID与其排名在同时增长,其差值则保持不变,这里使用Col1 + Col2 + Gap作为分组条件即可将记录4、5、6合并,再取个最小ID出来,问题解决,完整脚本如下:
可是如果ID不连续时怎么办呢?这个不难,参考[MSSQL]ROW_NUMBER函数
先造一些测试数据以说明题目:
DECLARE @TestData TABLE(ID INT,Col1 VARCHAR(20),Col2 VARCHAR(20))
INSERT INTO @TestData(ID,Col1,Col2)
SELECT 1,'New','Approved' UNION ALL
SELECT 2,'Approved','Commited' UNION ALL
SELECT 3,'Commited','In Progress' UNION ALL
SELECT 4,'New','Approved' UNION ALL
SELECT 5,'New','Approved' UNION ALL
SELECT 6,'New','Approved' UNION ALL
SELECT 7,'Approved','Removed'
SELECT * FROM @TestData
数据说明,ID列连续自增,列1和列2都是TFS中PBI的状态记录,就是从什么变更到什么,如新建到批准,批准到提交神马的
现在要求连续且相同的状态变更记录合并,不连续或者不同的状态变更保留,例如:
以上图为例,ID为1,4,5,6的记录都是从New到Approved状态,但是记录1与记录4、5、6不相邻,或者说不连续,那么就要分成两组,
记录1一组,记录4、5、6一组,其它记录因为状态变更不相同所以全部保留,最后的查询结果应该长成下图这个样子:
继续之前你可以先自己试下,这可能会带来新的解题思路,
解题思路
该问题的关键在于GROUP BY会把记录1、4、5、6合并在一起,而这不符合要求,仅需要合并4、5、6,源表里没有这样一个字段可以将记录1与记录4、5、6区分开来,这是解题的关键
这里可以利用RANK函数配合使用PARTITION关键字,首先把1456分到一组去,同时产生一个组内排名的新字段R,这个排名R很关键,后边会用到,见下图:
RANK函数不了解的点这里
RANK函数以Col1 + Col2为分组条件,这样分成了四组,分别是New-Approved、Approved-Commited、Commited-In Progress、Approved-Removed
在New-Approved组内,记录1、4、5、6分别排名1、2、3、4;其它组内仅一条记录,在其组内排名均为1
现在制造了一个R字段,R字段标识了每条记录在其组内的排名,排名自1开始递增,
源表内ID自增,组内排名R递增,这就是解题的关键,
当连续相同的记录出现时,其ID与其排名R在同时递增,则其差值是相同的,拿到这个差值就可以很容易解决题目了,看下图:
记录4、5、6相同且连续出现,其ID与其排名在同时增长,其差值则保持不变,这里使用Col1 + Col2 + Gap作为分组条件即可将记录4、5、6合并,再取个最小ID出来,问题解决,完整脚本如下:
可是如果ID不连续时怎么办呢?这个不难,参考[MSSQL]ROW_NUMBER函数
相关文章推荐
- 巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行
- [MSSQL]SQL疑难杂症实战记录-巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行
- 利用partition分组查询 查询每个分组第一条数据
- 巧妙利用JDK1.8新特性解决多if判断及其性能测试
- 将两个递增的链表合并成一个递减的链表(相同的元素只留下一个),并要求利用原表结点
- Xutils 使用get请求时,连续请求返回数据相同问题的解决
- 解决两相同数据同步的问题(续)
- 两组字符串数据比较合并相同数据
- SQL SERVER2000教程-第五章 处理数据 第二十二节 利用UNION对多条SQL查询语句合并生成表
- asp两组字符串数据比较合并相同数据
- 利用笛卡尔乘积和外连接解决保留行数据问题
- 本文是笔者根据数据库编程经验,利用C++语言的模板、继承、授权、多态等面向对象特性,借鉴命令模式,实现了对象在关系数据中的存储,降低应用系统与数据库之间的耦合,提高开发效率。
- asp两组字符串数据比较合并相同数据
- 合并相同记录字段数据
- SQL学习之查询技巧 查询第3的数据 用一条语句分组,排序 并查询某一排名
- 利用触发器和INSERT INTO ...SELECT...解决Oracle 数据匹配问题
- GridView、DataGrid 表头合并、表体合并[合并相邻行相同数据的单元格]
- 数据库时间段分组查询解决方法和数据转储方法
- 如何合并相同单元格的数据
- C#中同一DataTable中合并相同条件的行数据