找出某列中重复的数据。
2010-04-13 15:06
113 查看
--方法一
--用时: 00: 00: 29.09
select b.m_no,b.sq,b.p_roll,b.npl,b.tr_date from t_tr b,
(select count(*),m_no,sq,p_roll,npl
from t_tr
group by m_no,sq,p_roll,npl
having count(*)>1) a
where b.m_no=a.m_no and b.sq=a.sq and b.p_roll=a.p_roll and b.npl=a.npl
order by b.tr_date
--方法二
--用时:n秒,最后只好卡叉掉
select m_no,sq,p_roll,npl,tr_date
from t_tr a
where a.rowid!=(select max(rowid)
from t_tr b
where a.m_no=b.m_no and a.sq=b.sq and a.p_roll=b.p_roll and a.npl=b.npl)
--方法三
--用时:5秒,
--使用oracle的分析函数
select M_NO,SQ,PT,P_ROLL,P_YDS,P_KGS,tr_date,dept from TR
where (M_NO,SQ,nvl(PT,'<NULL>'),p_roll) in
(select M_NO,SQ,Nvl(PT,'<NULL>'),P_ROLL from
(select M_NO,SQ,PT,P_ROLL,Row_Number() over (partition By M_NO,SQ,PT,P_ROLL order by M_NO,SQ,PT,P_ROLL) rn
from tr order by M_NO,SQ,PT,P_ROLL) t
where rn>1)
and tr_date>to_date('2004-04-01','yyyy-mm-dd')
小结:合理的使用oracle的分析函数可以很大的提高sql的执行效率。
select * from user
where uid not in(select u1.uid from user as u1,user as u2 《==这里面一个not in 就找到了那个最大的uid。 所以你最终结果查出了重复名字中id最大的那个
《===这个select是查出了在当前重复名称下,所有uid1<uid2 的id,而此时uid1里面的id肯定不包含最大的那个uid,画图想想,
where u1.uid < u2.uid and u1.username=u2.username and u1.username in
(select username from user group by username))《==这个查出了所有有重复的名字
这条sql语句终于进化了。嘿嘿。是这样的
select * from
user u1 ,(select min(uid) as minuid,username from user group by username) u2--u2查询出的是将重复的username排掉,并得到该组username中最小的id
where
u1.uid=u2.minuid and u1.username=u2.username --id唯一,通过唯一的id
就能得到一条不重复的全记录了。因为我选择的是min(id)id是不重复的,所以可以不写这些。如果是min(email)可能,email会有重复
的,在表连接的时候就要加上where条件中,后面的那个条件
order by u1.uid
--用时: 00: 00: 29.09
select b.m_no,b.sq,b.p_roll,b.npl,b.tr_date from t_tr b,
(select count(*),m_no,sq,p_roll,npl
from t_tr
group by m_no,sq,p_roll,npl
having count(*)>1) a
where b.m_no=a.m_no and b.sq=a.sq and b.p_roll=a.p_roll and b.npl=a.npl
order by b.tr_date
--方法二
--用时:n秒,最后只好卡叉掉
select m_no,sq,p_roll,npl,tr_date
from t_tr a
where a.rowid!=(select max(rowid)
from t_tr b
where a.m_no=b.m_no and a.sq=b.sq and a.p_roll=b.p_roll and a.npl=b.npl)
--方法三
--用时:5秒,
--使用oracle的分析函数
select M_NO,SQ,PT,P_ROLL,P_YDS,P_KGS,tr_date,dept from TR
where (M_NO,SQ,nvl(PT,'<NULL>'),p_roll) in
(select M_NO,SQ,Nvl(PT,'<NULL>'),P_ROLL from
(select M_NO,SQ,PT,P_ROLL,Row_Number() over (partition By M_NO,SQ,PT,P_ROLL order by M_NO,SQ,PT,P_ROLL) rn
from tr order by M_NO,SQ,PT,P_ROLL) t
where rn>1)
and tr_date>to_date('2004-04-01','yyyy-mm-dd')
小结:合理的使用oracle的分析函数可以很大的提高sql的执行效率。
select * from user
where uid not in(select u1.uid from user as u1,user as u2 《==这里面一个not in 就找到了那个最大的uid。 所以你最终结果查出了重复名字中id最大的那个
《===这个select是查出了在当前重复名称下,所有uid1<uid2 的id,而此时uid1里面的id肯定不包含最大的那个uid,画图想想,
where u1.uid < u2.uid and u1.username=u2.username and u1.username in
(select username from user group by username))《==这个查出了所有有重复的名字
这条sql语句终于进化了。嘿嘿。是这样的
select * from
user u1 ,(select min(uid) as minuid,username from user group by username) u2--u2查询出的是将重复的username排掉,并得到该组username中最小的id
where
u1.uid=u2.minuid and u1.username=u2.username --id唯一,通过唯一的id
就能得到一条不重复的全记录了。因为我选择的是min(id)id是不重复的,所以可以不写这些。如果是min(email)可能,email会有重复
的,在表连接的时候就要加上where条件中,后面的那个条件
order by u1.uid
相关文章推荐
- JAVA找出List集合中重复次数最多的数据和次数
- 100万个电话号码在文件里,找出重复的;内存不足以放下所有数据。
- 大数据-25亿个数找出不重复的整数-双层桶-代码
- 在Excel表格中找出重复数据
- 海量日志数据__怎么在海量数据中找出重复次数最多的一个;提取出某日访问网站次数最多的那个IP;提取出某日访问网站次数最多的前n个IP
- Excel 中如何找出两列数据中不重复的记录
- 数据库中通过group by找出表中的重复数据
- sql语句,如何找出重复的数据
- SQL找出重复数据只保留一条
- Excel函数找出重复数据
- EXCEL----数据处理(一)----找出两列数据(单列无重复)中的重复项并知道不重复部分的来源
- leetcode182-Duplicate Emails(找出出现重复的数据)
- 数据结构——算法之(001)(在一个数组中找出重复数值)
- 找出字符串数组中不重复的数据并输出所在位置
- TOP-K排序算法,从海量不重复数据中找出最大/小的K个数
- sql语句 找出重复的数据(多列) SQL2005 引擎有更好的做法【转】
- EXCEL----数据处理(一)----找出两列数据(单列无重复)中的重复项并知道不重复部分的来源
- Excel 中如何找出两列数据中不重复的记录
- 找出数组中的缺失数据和重复数据
- 一是关于怎样找出和去除重复数据,这在另一个帖子利已有详细介绍。二是关于找出某一列里最大或最小的前几个,或是大于或小于某一个值(最大值或平均值)的数据