汉字在计算机中的表示
2017-03-24 10:28
771 查看
汉字在计算机中的表示
一、一个汉字在计算机中占两个字节的位置
西文字符中的ASCII码表示西文字符是,用的是7位的ASCII码,为了在计算机中存储,最高位(第八位)默认为0,所以可以表示27个不同的字符;扩展的ASCII码,使用的第八位,不在默认为0,所以最多可以表示28个字符。
中文跟西文不大一样。中文的一个汉字占16位,也就是两个字节的位置。编码方式跟ASCII码类似,但是为了与ASCII码区别开来,最高位默认为1.
二、汉字编码的过程
汉字编码分为外码、机内码、字形码、矢量汉字四个阶段。
外码是输入码,就像搜狗那样的输入法。机内码有国标码、BIG5等,这个过程是不会在电脑屏幕上显示的。字形码以点阵形式表示一个汉字。矢量汉字是用一种软件在屏幕上显示汉字字形,可以随意的放大缩小。
国标码是 用于计算机之间或与终端之间信息交换时的汉字代码(GB2312,GBK,GB18030), 由连续的两个字节组成,每个字节七位有效,最高位为1。
字形码是确定一个汉字字形点阵的代码, 汉字字形点阵中的每个点对应一个二进制位。
矢量汉字是用软件描述汉字 ,矢量字库保存对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在输出时要经过一定的数学运算。 矢量汉字可随意放大、缩小而不变形。 Windows使用的字库为以上两类。在FONTS目录下,扩展名为FON的文件为点阵字库;扩展名为TTF为矢量字库。
三、汉字信息处理过程
一、一个汉字在计算机中占两个字节的位置
西文字符中的ASCII码表示西文字符是,用的是7位的ASCII码,为了在计算机中存储,最高位(第八位)默认为0,所以可以表示27个不同的字符;扩展的ASCII码,使用的第八位,不在默认为0,所以最多可以表示28个字符。
中文跟西文不大一样。中文的一个汉字占16位,也就是两个字节的位置。编码方式跟ASCII码类似,但是为了与ASCII码区别开来,最高位默认为1.
二、汉字编码的过程
汉字编码分为外码、机内码、字形码、矢量汉字四个阶段。
外码是输入码,就像搜狗那样的输入法。机内码有国标码、BIG5等,这个过程是不会在电脑屏幕上显示的。字形码以点阵形式表示一个汉字。矢量汉字是用一种软件在屏幕上显示汉字字形,可以随意的放大缩小。
国标码是 用于计算机之间或与终端之间信息交换时的汉字代码(GB2312,GBK,GB18030), 由连续的两个字节组成,每个字节七位有效,最高位为1。
字形码是确定一个汉字字形点阵的代码, 汉字字形点阵中的每个点对应一个二进制位。
矢量汉字是用软件描述汉字 ,矢量字库保存对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在输出时要经过一定的数学运算。 矢量汉字可随意放大、缩小而不变形。 Windows使用的字库为以上两类。在FONTS目录下,扩展名为FON的文件为点阵字库;扩展名为TTF为矢量字库。
三、汉字信息处理过程
相关文章推荐
- 字符,汉字在计算机中的表示方法
- 计算机中汉字的二进制编码表示
- 汉字在计算机中的表示
- 各种信息在计算机中的表示(数字、字母、汉字)
- 汉字在计算机中的表示
- “程序员节” 说说“信息在计算机中的表示方法”
- 无限数加法 超出计算机表示范围 溢出 int型
- 1、计算机中数的表示
- 深入理解计算机系统(2.4)------整数的表示(无符号编码和补码编码)
- C语言printf IEEE (数字在计算机中的表示)
- 负数在计算机中如何表示
- 变量在计算机内存中的表示
- 0.1在计算机中不能被精确表示(浮点数的陷阱其实也是二进制下的陷阱?)
- 浅谈C++中Char、int和flaot在计算机中的表示
- 三维几何模型在计算机内的表示
- 关于浮点数和整数在计算机中的表示
- 计算机是如何解析我们的汉字和英文?什么是字符集?为什么会出现乱码?
- 计算机中的数(一):数在计算机中的表示
- 数字在计算机中的表示(原码、反码、补码)个人备忘
- 深入理解计算机系统--信息表示和处理