C核心技术手册(五)
2010-11-30 00:19
204 查看
1.1 字符集
C将编译器编译源代码的环境(即:编译环境)和编译好的程序运行所依赖的环境(即:运行环境)区别对待,所以,C定义了两种类型的字符集,源文件中使用的称做源字符集,执行程序使用的称做执行时字符集。在一些C的实现的,两种类型是一样的,如果不同,编译器会将其转化为执行时字符集。每种字符集均包含基本字符集和扩展字符。C没有指定扩展字符,这些通常由本地语言来决定,扩展字符和基本字符集一起构成了扩展字符集。
基本字符集和扩展字符集都包括下面的字符类型:
拉丁字母:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
数字
0 1 2 3 4 5 6 7 8 9
29个标点符号
! " # % & ' ( ) * + , - . / : ; < = > ? [ / ] ^ _ { | } ~
五种空白字符
空格、水平TAB,垂直TAB,新行,分页
基本的执行时字符集包四种非打印字符:
Null: 表识字符串结束;
警报(alter)
退格(backspace)
回车(carriage return)
为了表示这些字符,需要以一个反斜杠(/)进行转义,
/0 表示null;
/a 表示警报(alter)
/b 表示退格(backspace);
/r 表示回车(carriage return)
每个字符实际的值因程序不同而各异,C语言仅做以下规定:
l 基本字符集中的每个字符占一个字节;
l 字符Null为所有位均为0的一个字节;
l 十进制正数由小到大排列;