您的位置:首页 > 数据库

Teradata SQL 笔记

2016-03-23 11:14 337 查看
http://cuishen.iteye.com/blog/638968

HELP 帮助用户了解数据库中各种对象的结构

SHOW 帮助用户了解某种对象的定义,即返回其DDL语句

EXPLAIN 返回一个SQL语句经优化处理后的执行步骤,注意并未真正执行

FALLBACK 对数据加以保护的一种方式,是冗余的备份

RENAME 对表重命名

NULLIFZERO 对数据作累计处理时,忽略零值

ZEROIFNULL 对数据作累计处理时,将空值作零处理

WITH...BY 对详细数据记录作分类统计(Sub-Total)时有用

MODIFY USER/DATABASE 对用户/数据库对象作动态修改而无需数据库重组

HELP 命令 参数 说明

HELP DATABASE databasename; 可以显示一个指定数据库所包含的所有对象

HELP USER username; 显示某个用户中所包含对象的信息

HELP TABLE tablename; 显示某张表的信息

HELP VIEW viewname; 显示某个视图的信息

HELP MACRO macroname; 显示某个宏的信息

HELP COLUMN table or viewname.*; 显示表/视图的各列的信息

HELP COLUMN table or viewname.colname . . ., colname; 显示表/视图某几列的信息

HELP INDEX tablename; 显示某个表中的所有索引定义

HELP STATISTICS tablename; 显示表的统计

HELP CONSTRAINT table or viewname.constraintname; 显示定义在某个表/视图上的约束定义

HELP JOIN INDEX join_indexname; 显示连接索引的定义

HELP TRIGGER triggername; 显示触发器的信息

HELP PROCEDURE procedurename; 显示存储过程的信息

HELP PROCEDURE procedurename ATTRIBUTES;

HELP 'SQL'; 得到所有SQL命令的列表信息

HELP 'SQL sqlcommand'; 得到某个特定SQL命令的使用方法

如要知道这些数据库对象是用什么样的DDL命令创建的,则要使用SHOW命令:

SHOW命令 参数

SHOW TABLE Tablename ;

SHOW VIEW Viewname;

SHOW MACRO Macroname;

SHOW INDEX Tablename;

SHOW JOIN INDEX join_indexname;

SHOW TRIGGER Triggername;

SHOW PROCEDURE Procedurename;

EXPLAIN命令:利用EXPLAIN命令,可以了解Teradata执行一个SQL交易请求的详细过程和计划,这对于更进一步地理解Teradata的查询处理机制有很大的帮助。另一方面,对于复杂SQL交易的调试来说,这也是不可缺少的一个工具。

利用EXPLAIN解释一个SQL交易的方法很简单,就是在原来SQL语句的前面加上EXPLAIN即可,其它完全不变。

在LIKE结构的字符串中,'%'和'_'可以作为通配符使用,但是如果需要匹配这些字符本身(比如查找95%),即把它们作为一般字符时使用,我们可以通过定义ESCAPE字符来达到这个目的,紧跟在ESCAPE字符后的’%’和’_’作为一般字符看待。

例:

LIKE ''%A%%AAA__'' ESCAPE ''A''

在这个表达式中,将字母A定义为ESCAPE字符,其中:

! 第一个%为通配符;

! 第一个A和其后的%联合表示字符%;

! 第三个%为通配符;

! 第二个A和其后的A联合表示字符A;

! 第四个A和其后的’_’联合表示字符_;

! 最后一个’_’为通配符。

对于表达式的操作数如果是字符,ANSI标准中是区分大小写的,如果不要区分大小写,可以使用UPPER函数将其转换成大写字母来进行匹配。Teradata缺省不区分大小写,如果要区分,可以使用其扩展参数CASESPECIFIC。

NULL的使用

NULL的说明:

! NULL显示没有数据的字段

! NULL表示不存在或未发现的值

! NULL既不是数字类型也不是字符类型

! 具有NULL值的字段可以被压缩,不占任何空间

NULL也可以参与运算,其运算规则为:

! NULL在算术运算中产生的结果为NULL(空)

! NULL在比较运算中产生的结果为False

! UNKNOWN DATA, MISSING DATA和NULL是同样的含义

! 当进行升序排列时,NULL在数字列排列在负数前,在字符列排列在空格

前。



CREATE MACRO macroname AS ( . . . ); 定义宏

EXECUTE macroname; 执行宏语句

SHOW MACRO macroname; 显示宏定义

REPLACE MACRO macroname AS ( . . . ); 改变宏定义

DROP MACRO macroname; 从字典中删除宏定义

EXPLAIN EXEC macroname; 显示宏执行的解释

EXISTS在子查询中的使用

EXISTS可以使用在子查询中,用来表示查询至少返回一行。如果前面加上否定词NOT,则表示查询时无记录存在。EXISTS可以代替IN,而NOT EXISTS可以代替NOT IN。

CHARACTERS函数

CHARACTERS函数也是Teradata的扩展,用于计算VARCHAR型数据字段的实际字符串长度。CHARACTERS函数可以简写成CHARACTER、CHARS或者CHAR。

TRIM函数

ANSI标准的TRIM函数用于去除字符数据中前头或后端的空格或者二进制数据(BYTE与VARBYTE)中前头或后端的零。在Teradata缺省模式下,TRIM (<expression>)只能去除后端的空格或二进制零。

SELECT CAST (salary_amount AS FORMAT ''$$$,$$9.99'');

SELECT (1000/salary_amount) * 100

(FORMAT 'ZZ9%')

(TITLE 'Increase Percentage')

FROM employee

WHERE employee_number = 1004;

SELECT (CAST (1000/salary_amount) * 100 AS FORMAT 'ZZ9%'

TITLE 'Increase Percentage') FROM ...

FORMAT短语中可以使用的格式化字符主要为:

$ 美元标识符

9 数字位

Z 将数字中的前缀零去除

, 在指定位置插入逗号

. 指定小数点位置

- 在指定位置插入连字号

/ 在指定位置插入斜线

% 在指定位置插入百分号

X 字符数据,每个X代表一个字符

G 图形数据.一个G代表一个逻辑字符(双字节)

B 在指定位置插入空格

对日期的格式化处理

在Teradata中,日期数据的缺省输出格式是:YY/MM/DD,这和ANSI标准是一样的。而ANSI标准建议的日期显示格式是:YYYY-MM-DD。

其它一些常用的日期显示格式列举如下,其中的B表示空格。

YYYY/MM/DD'

YYYY-MM-DD'

YYYY.DDD'

DBMMMBYYYY'

MMBDD,BYYYY'

YYYYBMMMBDD'

YY/MM/DD'

D-MM-YY'

YBDDD'

MM'

下面是一些对日期进行格式化的例子。

句法 结果

FORMAT 'YYYY/MM/DD' 1996/03/27

FORMAT 'DDbMMMbYYYY' 27 Mar 1996

FORMAT 'mmmBdd,Byyyy' Mar 27, 1996

FORMAT 'DD.MM.YYYY' 27.03.1996

FORMAT 'MM/DD/YY' 03/27/96

FORMAT 'MMM.DD.YY' Mar.27.96

FORMAT 'yy -- mm -- dd' 96 -- 03 -- 27

FORMAT 'DDDYY' 08696

SELECT last_name,first_name,hire_date (FORMAT 'mmmBdd,Byyyy')

FROM employee

ORDER BY last_name;

利用FORMAT短语,可以将字符字段或表达式进行截取处理,这种处理只影响显示格式,而不会影响数据的内部存储格式。

Teradata的属性函数

属性函数 返回信息说明

TYPE 数据类型

TITLE 标题短语

FORMAT 格式短语

NAMED NAMED子句

CHARACTERS 字符个数

Teradata DDL允许在创建表时指定表的物理属性,包括:

A. SET 不允许记录重复,例:CREATE SET TABLE table1 ...

B. MULTISET 允许记录重复,例:CREATE MULTISET TABLE table1 ...

C. 数据保护要结合FALLBACK和JOURNAL (流水或日志)。

FALLBACK是Teradata的一种数据保护机制,数据表的每一条记录都同时存放两份,而且位于不同的AMP所控制的存储单元中;当数据发生问题或者AMP失败时,可以利用存放在其他AMP上的数据保证对数据表的访问。

- FALLBACK 使用FALLBACK保护机制

- NO FALLBACK 不使用FALLBACK保护机制

日志有BEFORE和AFTER两种,分别保存了一条记录变化前后的状态。当系统出错时,可以利用日志进行恢复。

D. 存储空间选项

DATABLOCKSIZE用来指定数据块大小,最小的数据块为6144字节,最大的数据块是32256字节。

FREESPACE用来定义在每个磁盘柱面上保留的空间(0-75%)。

例:

CREATE MULTISET TABLE table_1

, FALLBACK, NO JOURNAL

, FREESPACE = 10 PERCENT

, DATABLOCKSIZE = 16384 BYTES

(field1 INTEGER);

虽然TD的DDL里有primary key,但是实际上存储在TD数据字典里的只有index:

A. 没有在CREATE TABLE时指定PI

IF 定义了PK,THEN PK = UPI

ELSE IF 存在定义为UNIQUE的字段,

THEN 第一个NIQUE的字段为UPI

ELSE 表中定义的第一个字段作为NUPI

B. CREATE TABLE时指定了PI

IF 定义了PK,THEN PK作为USI

AND为每一个定义为UNIQUE的字段建立一个USI

新建一张表TB1,表结构与TB2一样,不需要数据。

Create table TB1 as TB2 with no data;

使用子查询创建表,并选择所需的列。

CREATE TABLE emp1 AS(SELECT employee_number, department_number, salary_amount FROM employee) WITH NO DATA;

往TB1表中装入TB2表的数据(也可以是有选择性的,需指定字段)

INSERT INTO TB1 SELECT * from TB2;

交易完整性

在Teradata中,系统将保证一个交易的完整。怎样才算是一个交易呢,在Teradata中,根据其所处方式的不同在处理时也有所不同。在Teradata缺省模式下,以分号结束的每个SQL语句都是一个完整的交易,也可以使用BT (Begin Transaction)和ET (End Transaction)来显示地定义一个交易。下面看一个例子:

例:

缺省方式

.LOGON

INSERT row1; (txn #1)

INSERT row2; (txn #2)

.LOGOFF

用BT和ET显示定义交易

.LOGON

BT;

INSERT row1; (txn #1)

INSERT row2;

COMMIT WORK;

ET;

.LOGOFF

第一部分中有两个SQL语句,用分号结束,表示两个交易,任何一个失败不会影响另一个的执行。而第二部分用BT和ET显示地规定:在BT和ET之间的所有SQL是一个交易,只有最后的COMMIT WORK执行成功后,才会真正地更新数据库。执行过程中任何一个SQL语句失败,都会使整个交易失败,系统将自动进行恢复(Rollback)处理。

在ANSI方式下,必须进行显示地提交才能完成一个交易。

利用WITH BY进行数据小计

WITH BY的主要特点包括:

A. 它为明细数据表创建分类小计。

B. 跟GROUP BY不同的是,WITH BY没有剔除明细记录,而是在明细记录后面按照分类增加小计行。

C. 可以允许多于一个字段进行小计,即小计当中可以嵌套小计。

D. 输出结果将根据BY后面的所有字段自动进行排序。

E. 它是Teradata的一个扩展特性。

举例:

1. WITH BY, WITH和ORDER BY的联合使用:

SELECT last_name AS NAME

,salary_amount AS SALARY

,department_number AS DEPT

FROM employee

WITH SUM (SALARY) BY DEPT

WITH SUM (SALARY) (TITLE 'GRAND TOTAL')

ORDER BY NAME;

结果如下:

NAME SALARY DEPT

Kanieski 29250.00 301

Stein 29450.00 301

-------------

Sum (SALARY) 58700.00

Johnson 36300.00 401

Trader 37850.00 401

-------------

Sum (SALARY) 74150.00

Ryan 31200.00 403

Villegas 49700.00 403

-------------

Sum (SALARY) 80900.00

-------------

GRAND TOTAL 213750.00

2. WITH和GROUP BY的联合使用:

SELECT department_number (TITLE 'dept_no')

,SUM (salary_amount)

,AVG (salary_amount)

FROM employee

GROUP BY department_number

WITH SUM (salary_amount) (TITLE 'GRAND TOTAL')

,AVG (salary_amount) (TITLE '')

ORDER BY department_number;

结果如下:

dept_no SUM (salary_amount) AVG (salary_amount)

301 58700.00 29350.00

401 74150.00 37075.00

403 80900.00 40450.00

--------------------- ----------------------

GRAND TOTAL 213750.00 35635.00

集合操作

集合操作主要包括:合并操作(UNION)、相交操作(INTERSECT)和排外操作(EXCEPT)

Teradata的集合操作与标准ANSI集合操作的不同之出在于返回结果的重复记录处理上。在ANSI标准中集合操作将重复记录自动剔除,而Teradata增加了ALL关键词,ALL关键词允许保留重复记录。

我们将有关集合操作的一些补充规则列举如下:

1. 在子查询中不能使用集合操作

2. 在定义视图时不能使用集合操作

3. 不能包含WITH或WITH BY子句

4. 集合操作的优先级为:INTERSECT第一,其后分别为UNION和 EXCEPT,从左到右。可以使用括号改变优先级。

5. 每一个SELECT语句必须有一个FROM <表名>的子句

6. 每个单独的SELECT语句中可以使用GROUP BY

7. Group By不能用于或影响整个返回结果集

8. 重复记录将会抛弃,除非使用ALL选项

字符串函数

SUBSTRING函数:用来从字符串中析取一个子字符串,其格式为:

SUBSTRING (<字符串表达式> FROM <开始位置> [ FOR <长度> ])

如:

SELECT SUBSTRING('catalog' FROM 5 FOR 3);

结果为log。

字符串合并:字符串合并的符号是"||",它把两个字符串串联成一个字符串。其基本格式为:

<字符串1> || <字符串2>

INDEX (字符串定位函数):INDEX用来在一个字符串中定位一个子串的开始位置。如下面的例子:

SELECT INDEX('abc', 'b'); 返回结果2

CASE 表达式

A. 基于值(Valued)的CASE语句,例如:

SELECT SUM(

CASE department_number

WHEN 401 THEN salary_amount

ELSE 0

END) / SUM(salary_amount)

FROM employee;

B. 基于搜索(Searched)的CASE语句,例如:

SELECT last_name,

CASE

WHEN salary_amount < 30000

THEN 'Under $30K'

WHEN salary_amount < 40000

THEN 'Under $40K'

WHEN salary_amount < 50000

THEN 'Under $50K'

ELSE

'Over $50K'

END

FROM employee

ORDER BY salary_amount;

C. NULLIF表达式

NULLIF实际上用来作为CASE语句在某种情况下的缩写,其格式为:

NULLIF ( <expression1> , <expression2> )

规则是:

如果表达式1等于表达式2,则返回NULL

如果表达式1不等于表达式2,则返回表达式1的值。

例:

SELECT call_number

,labor_hours (TITLE 'ACTUAL HOURS')

,NULLIF (labor_hours, 0)

(TITLE 'NULLIF ZERO HOURS')

FROM call_employee

ORDER BY labor_hours;

注意:在除法表达式中,如果被除数有可能为零值,经常使用NULLIF来避免除零错。

D. COALESCE(接合)表达式

COALESCE实际上也是CASE语句在某种特殊情况下的宿写。COALESCE将返回第一个非NULL表达式的值。其格式为:

COALESCE ( <expression1> , <expression2> [, <expressionX> ] )

例:从phone_table表中,列出姓名和电话号码,如果办公室电话存在则列出办公室电话,否则列出家里电话。

SELECT name

,COALESCE (office_phone, home_phone)

FROM phone_table;

例:转换可能的NULL值为零:

SELECT course_name

,COALESCE (num_students, 0)

(TITLE '# Students')

FROM class_schedule;

简单排队RANK

排队函数(RANK)的语法是:

RANK(colname)

这里,colname表示排队的列名,其结果降序排列。

问题

显示商店1001的产品销售额排队。

解答

SELECT storeid, prodid, sales, RANK(sales)

FROM salestbl

WHERE storeid = 1001;

结果

storeid prodid sales Rank

1001 F 150000.00 1

1001 A 100000.00 2

1001 C 60000.00 3

1001 D 35000.00 4

如上所示,列Rank的最大值代表最低的销售额。

带限定的排队

QUALIFY子句限制排队输出的最终结果。QUALIFY子句与HAVING子句类似,使输出限制在一定范围内。

问题

按商店得到销售前3名的产品。

解答

SELECT storeid, prodid, sales, rank(sales)

FROM salestbl

GROUP BY storeid

QUALIFY rank(sales) <= 3;

结果

storeid prodid sales Rank

1001 A 100000.00 1

1001 C 60000.00 2

1001 D 35000.00 3

1002 A 40000.00 1

1002 C 35000.00 2

1002 D 25000.00 3

1003 B 65000.00 1

1003 D 50000.00 2

1003 A 30000.00 3
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: