Teradata 之top n与sample n
2015-10-26 13:10
232 查看
Teradata取n条样本数据的方法有两种:
select top x * from table;
select * from table sample n;
那么二者有什么区别呢?说明如下:
TOP N
如果有Order By关键字首先要对数据库的数据进行排序,然后获取N条数据或者抽样比率为N;
如果没有Order By关键字,要做一次STAT FUNCTION的全AMP收集,然后选择某一个或者几个AMP 来抽取数据。
Sample N
首先要对数据库的数据进行全表扫描,然后获取N数据;
采用的是Sampling的形式。
[@more@]
性能比较:
当数据量比较小的时候,TOP N的速度要比Sample的速度快;
当数据量比较大的时候,Sample N的速度要比TOP的速度快。
select top x * from table;
select * from table sample n;
那么二者有什么区别呢?说明如下:
TOP N
如果有Order By关键字首先要对数据库的数据进行排序,然后获取N条数据或者抽样比率为N;
如果没有Order By关键字,要做一次STAT FUNCTION的全AMP收集,然后选择某一个或者几个AMP 来抽取数据。
Sample N
首先要对数据库的数据进行全表扫描,然后获取N数据;
采用的是Sampling的形式。
[@more@]
性能比较:
当数据量比较小的时候,TOP N的速度要比Sample的速度快;
当数据量比较大的时候,Sample N的速度要比TOP的速度快。
相关文章推荐
- Linux学习进阶路线图
- 【Linux】Ubuntu下使用QQ
- DaoCloud:Docker是企业互联网服务的入口平台
- Linux如何开启ftp服务及常见问题
- linux下mysql的配置优化
- Linux下UDP通讯开发
- linux 下的socket 客户端开发
- openSession和getCurrentSession之间的区别
- mooc-linux内核课-1
- 架构师八荣八耻
- Using HDInsight tools to optimize hive script
- linux动态库的制作和路径安装
- linux常见命令
- [No000031]操作系统 Operating Systems 之Open the OS!
- 使用 /sys 文件系统访问 Linux 内核
- 推荐一个比较便宜的买数字证书的网站
- Linux中ifreq 结构体分析和使用(转)
- linux查看服务器负载 load average
- dubbo架构详解
- 使用openssl创建自签名证书及部署到IIS教程