您的位置:首页 > 理论基础

计算机中汉字的二进制编码表示

2012-07-02 15:46 169 查看
1.常用汉字有3000~5000,无法用一个字节编码。

2.我国公布的《通用汉字字符集(基本集)及其交换码标准》GB2312-80共收集了7445个字符,用两个字节编码一个字符,每个字节最高位为0。GB2312-80编码简称国标码。

3.汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。

4.汉字输入码又称为外码, 是指从键盘上输入汉字时使用的编码。主要有三类: 数字编码, 拼音编码和字型编码。

数字编码是用一串数字代表一个汉字。最常用的是区位码.。它是把国标码的每一个字节减去00100000(20H)得到的, 被减去的是控制字符. 高字节为区码, 低字节为位码. 无重码, 难记忆。

拼音编码是以汉字读音为基础的输入方法. 简单, 重码率高, 输入速度较慢。

字形编码是根据汉字形状确定的编码. 因为构成汉字的部件是一定的, 所以对这些部件进行编码,按书写顺序依次输入, 就能表示一个汉字. 常见的有五笔字形码和表形码。

5.字形码用在汉字输出时产生汉字字形。有两种显示字形的方法:矢量字符和位图(Bitmap)字符。

6.汉字信息处理系统必须要包含汉字库,字库中存储汉字子模,供显示和打印输出时使用。字库可以使固化在只读存储器芯片上的汉卡,也可以是以文件形式存储在软盘或硬盘上的软字库。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: