您的位置:首页 > 其它

union 与 union all的区别

2009-06-10 21:47 351 查看
创建了一基于三张千万行级别表的视图,表的链接靠UNION来实现,示例sql如下:

CREATE VIEW emaillogView

WITH SCHEMABINDING

AS

SELECT DataTime, UserName, SourceIp, DestIp, EmailFrom, EmailTo, EmailCc, EmailBcc, EmailSub,EmailDate, OrderId FROM dbo.emaillog
UNION
SELECT DataTime, UserName, SourceIp,
DestIp, EmailFrom, EmailTo, EmailCc, EmailBcc, EmailSub,EmailDate,
OrderId FROM dbo.emaillog1

UNION
SELECT DataTime, UserName, SourceIp,
DestIp, EmailFrom, EmailTo, EmailCc, EmailBcc, EmailSub,EmailDate,
OrderId FROM dbo.emaillog2

通过select查询视图时发现超级慢,但对单张基表查询却发现比较快,查了半天的问题,却发现是UNION的使用问题,UNION默认会对数据进行排序,去除重复,几千万的数据进行排序,速度可想而知。。。更改为UNION ALL速度明显提高。

下面为UNION 与 UNION ALL的区别说明:

在数据库中,UNION和UNION
ALL关键字都是将两个结果集合并为一个,但这两者从使用和效率上来说都有所不同。
UNION在进行表链接后会筛选掉重复的记录,所以在表链接后会对所产生的结果集进行排序运算,删除重复的记录再返回结果。

实际大部分应用中是不会产生重复的记录,最常见的是过程表与历史表UNION。如:

select * from gc_dfys

union

select * from ls_jg_dfys

这个SQL在运行时先取出两个表的结果,再用排序空间进行排序删除重复的记录,最后返回结果集,如果表数据量大的话可能会导致用磁盘进行排序。

而UNION
ALL只是简单的将两个结果合并后就返回。这样,如果返回的两个结果集中有重复的数据,那么返回的结果集就会包含重复的数据了。

从效率上说,UNION ALL
要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复的数据的话,那么就使用UNION ALL,如下:

select * from gc_dfys

union all

select * from ls_jg_dfys

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: