您的位置:首页 > 运维架构

Teradata 之top n与sample n

2015-10-26 13:10 232 查看
Teradata取n条样本数据的方法有两种:

select top x * from table;

select * from table sample n;

那么二者有什么区别呢?说明如下:

TOP N

如果有Order By关键字首先要对数据库的数据进行排序,然后获取N条数据或者抽样比率为N;

如果没有Order By关键字,要做一次STAT FUNCTION的全AMP收集,然后选择某一个或者几个AMP 来抽取数据。

Sample N

首先要对数据库的数据进行全表扫描,然后获取N数据;

采用的是Sampling的形式。
[@more@]

性能比较:

当数据量比较小的时候,TOP N的速度要比Sample的速度快;

当数据量比较大的时候,Sample N的速度要比TOP的速度快。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: