汉字在计算机中的表示
2015-02-22 13:46
363 查看
[b]汉字在计算机中的表示[/b]
一、一个汉字在计算机中占两个字节的位置
西文字符中的ASCII码表示西文字符是,用的是7位的ASCII码,为了在计算机中存储,最高位(第八位)默认为0,所以可以表示27个不同的字符;扩展的ASCII码,使用的第八位,不在默认为0,所以最多可以表示28个字符。
中文跟西文不大一样。中文的一个汉字占16位,也就是两个字节的位置。编码方式跟ASCII码类似,但是为了与ASCII码区别开来,最高位默认为1.
二、汉字编码的过程
汉字编码分为外码、机内码、字形码、矢量汉字四个阶段。
外码是输入码,就像搜狗那样的输入法。机内码有国标码、BIG5等,这个过程是不会在电脑屏幕上显示的。字形码以点阵形式表示一个汉字。矢量汉字是用一种软件在屏幕上显示汉字字形,可以随意的放大缩小。
国标码是 用于计算机之间或与终端之间信息交换时的汉字代码(GB2312,GBK,GB18030), 由连续的两个字节组成,每个字节七位有效,最高位为1。
字形码是确定一个汉字字形点阵的代码, 汉字字形点阵中的每个点对应一个二进制位。
矢量汉字是用软件描述汉字 ,矢量字库保存对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在输出时要经过一定的数学运算。 矢量汉字可随意放大、缩小而不变形。 Windows使用的字库为以上两类。在FONTS目录下,扩展名为FON的文件为点阵字库;扩展名为TTF为矢量字库。
三、汉字信息处理过程
一、一个汉字在计算机中占两个字节的位置
西文字符中的ASCII码表示西文字符是,用的是7位的ASCII码,为了在计算机中存储,最高位(第八位)默认为0,所以可以表示27个不同的字符;扩展的ASCII码,使用的第八位,不在默认为0,所以最多可以表示28个字符。
中文跟西文不大一样。中文的一个汉字占16位,也就是两个字节的位置。编码方式跟ASCII码类似,但是为了与ASCII码区别开来,最高位默认为1.
二、汉字编码的过程
汉字编码分为外码、机内码、字形码、矢量汉字四个阶段。
外码是输入码,就像搜狗那样的输入法。机内码有国标码、BIG5等,这个过程是不会在电脑屏幕上显示的。字形码以点阵形式表示一个汉字。矢量汉字是用一种软件在屏幕上显示汉字字形,可以随意的放大缩小。
国标码是 用于计算机之间或与终端之间信息交换时的汉字代码(GB2312,GBK,GB18030), 由连续的两个字节组成,每个字节七位有效,最高位为1。
字形码是确定一个汉字字形点阵的代码, 汉字字形点阵中的每个点对应一个二进制位。
矢量汉字是用软件描述汉字 ,矢量字库保存对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在输出时要经过一定的数学运算。 矢量汉字可随意放大、缩小而不变形。 Windows使用的字库为以上两类。在FONTS目录下,扩展名为FON的文件为点阵字库;扩展名为TTF为矢量字库。
三、汉字信息处理过程
相关文章推荐
- 字符,汉字在计算机中的表示方法
- 各种信息在计算机中的表示(数字、字母、汉字)
- 汉字在计算机中的表示
- 汉字在计算机中的表示
- 计算机中汉字的二进制编码表示
- 0.1在计算机中不能被精确表示(浮点数的陷阱其实也是二进制下的陷阱?)
- C/C++中的整数和浮点数在计算机中是如何表示的?
- 有符号数与无符号数在计算机中的表示
- C#中 利用汉字在计算机里面的编码来得到汉字的首拼音 及 阿拉伯数字
- 汉字及英文字符的ascii表示
- python 变量在计算机内存中的表示
- 计算机视觉和模式识别中的稀疏表示(Sparse Representation for Computer Vision and Pattern Recognition)
- 漫谈计算机基础之信息的处理与表示(1)
- 数字转成汉字表示
- 负数在计算机中的表示
- 【计算机系统学习-信息表示和处理】【一、信息的存储】
- 计算机中信息的表示与处理
- 计算机中数的表示与存储
- 浮点数在计算机中不能准确表示范例
- 负数在计算机中的表示方法