计算机中汉字的二进制编码表示
2012-07-02 15:46
169 查看
1.常用汉字有3000~5000,无法用一个字节编码。
2.我国公布的《通用汉字字符集(基本集)及其交换码标准》GB2312-80共收集了7445个字符,用两个字节编码一个字符,每个字节最高位为0。GB2312-80编码简称国标码。
3.汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。
4.汉字输入码又称为外码, 是指从键盘上输入汉字时使用的编码。主要有三类: 数字编码, 拼音编码和字型编码。
数字编码是用一串数字代表一个汉字。最常用的是区位码.。它是把国标码的每一个字节减去00100000(20H)得到的, 被减去的是控制字符. 高字节为区码, 低字节为位码. 无重码, 难记忆。
拼音编码是以汉字读音为基础的输入方法. 简单, 重码率高, 输入速度较慢。
字形编码是根据汉字形状确定的编码. 因为构成汉字的部件是一定的, 所以对这些部件进行编码,按书写顺序依次输入, 就能表示一个汉字. 常见的有五笔字形码和表形码。
5.字形码用在汉字输出时产生汉字字形。有两种显示字形的方法:矢量字符和位图(Bitmap)字符。
6.汉字信息处理系统必须要包含汉字库,字库中存储汉字子模,供显示和打印输出时使用。字库可以使固化在只读存储器芯片上的汉卡,也可以是以文件形式存储在软盘或硬盘上的软字库。
2.我国公布的《通用汉字字符集(基本集)及其交换码标准》GB2312-80共收集了7445个字符,用两个字节编码一个字符,每个字节最高位为0。GB2312-80编码简称国标码。
3.汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。
4.汉字输入码又称为外码, 是指从键盘上输入汉字时使用的编码。主要有三类: 数字编码, 拼音编码和字型编码。
数字编码是用一串数字代表一个汉字。最常用的是区位码.。它是把国标码的每一个字节减去00100000(20H)得到的, 被减去的是控制字符. 高字节为区码, 低字节为位码. 无重码, 难记忆。
拼音编码是以汉字读音为基础的输入方法. 简单, 重码率高, 输入速度较慢。
字形编码是根据汉字形状确定的编码. 因为构成汉字的部件是一定的, 所以对这些部件进行编码,按书写顺序依次输入, 就能表示一个汉字. 常见的有五笔字形码和表形码。
5.字形码用在汉字输出时产生汉字字形。有两种显示字形的方法:矢量字符和位图(Bitmap)字符。
6.汉字信息处理系统必须要包含汉字库,字库中存储汉字子模,供显示和打印输出时使用。字库可以使固化在只读存储器芯片上的汉卡,也可以是以文件形式存储在软盘或硬盘上的软字库。
相关文章推荐
- 计算机中字符的二进制编码表示(ASCII)
- 汉字在计算机中的表示
- 字符,汉字在计算机中的表示方法
- 汉字在计算机中的表示
- 汉字在计算机中的表示
- 各种信息在计算机中的表示(数字、字母、汉字)
- sql server中单引号拼接字符串(书写错误会出现错误"浮点值 XXXX 超出了计算机表示范围(8 个字节)。“XX”附近有语法错误。")
- 深入理解计算机系统:信息的处理和表示(二)整数四则运算
- 深入理解计算机系统 ——第三章 程序的机器级表示
- 写一个程序,语言不限,能将人民币金额从阿拉伯数字转换为大写汉字表示。例如,把1234.56转换为壹仟贰佰叁拾肆圆零伍角陆分。
- 计算机表示正负数
- 原码、反码、补码最清楚的解释,计算机中负数的表示
- 计算机数据表示
- 深入理解计算机系统(2.3)---整数的表示方式精解》无符号与补码编码(重要)
- 计算机中数值的表示
- [计算机] -32768~32767 计算机中的 -1 表示
- 数据在计算机里的表示方法
- 计算机中基本类型float值表示和大小比较问题
- 原码、反码、补码,计算机中负数的表示
- 在计算机中,原码、反码、补码、移码的表示