计算机编码
2016-04-28 17:28
330 查看
说到计算机编码,首先我们聊一下计算机编码的来源,我们很多人都应该知道,计算机只能识别1和0,也就是说计算机只能处理二进制的数据,比如101010101这样的数据。
为了让计算机去识别其他数据,比如比如0-9,a-z,A-Z,等等一些字符,我们是需要制定一套规则来表示的,比如A用1110来表示,B用1111来表示,制定了这样的规则后,计算机就可以去实现识别其他字符了。那么这套规则就叫做计算机编码。
所以计算机编码就是计算机2进制数字和其他字符的映射的关系。
下面我们就来聊一下计算计中常见的计算机编码:
1.ASCII码:
美国国家标准协会制定了一种编码,称为ASCII码。
这种编码方式是用一个字节(8位数二进制)来表示一个字符,理论上共可以表示2^8=256个字符。因为美国国家语言是英语,只要能表示0-9,a-z,A-Z,特殊符号就可以了。所以这种编码对美国等使用英语的国家是非常适用的。
2.ANSI编码:
但是对于其他国家来说,比如中国,我们的汉字数量是非常多的,256个字符完全不够用,所以很多国家为了显示本国的语言,都对ASCII编码进行了扩展,使用2个字 节进行表示(16位二进制数,理论上可以表示2^16=65536个字符),统称为ANSI编码,这其中有:
GB2312:中国的GB2312码,它包括了6763个汉字,600多个字符。
GBK :后来为了一些罕见的字符,我们国家有对GBK2312进行了扩展,用来显示罕见的,古汉语汉字(已经收录了2.1万个,K的含义就是扩展的意思)
JIS :日本的 JIS码
BIG5 :台湾的BIG5(繁体字)
等等…
3. Unicode码:
后来为了解决传统的字符编码方案的局限性,和兼容性问题,产生了Unicode编码,它用4个字节(32位二进制)表示一个字符,解决了兼容性问题,虽然想法很不错,但是效率太低。
4.utf8码:
是一种针对unicode的可变长度的字符编码,又称为万国码。比如a-z用一个字节表示,但是汉字用3个字节表示。既减少了长度,又保证了兼容性。
结束语:所以utf8成为了我们现在使用最多的一种编码方式!
为了让计算机去识别其他数据,比如比如0-9,a-z,A-Z,等等一些字符,我们是需要制定一套规则来表示的,比如A用1110来表示,B用1111来表示,制定了这样的规则后,计算机就可以去实现识别其他字符了。那么这套规则就叫做计算机编码。
所以计算机编码就是计算机2进制数字和其他字符的映射的关系。
下面我们就来聊一下计算计中常见的计算机编码:
1.ASCII码:
美国国家标准协会制定了一种编码,称为ASCII码。
这种编码方式是用一个字节(8位数二进制)来表示一个字符,理论上共可以表示2^8=256个字符。因为美国国家语言是英语,只要能表示0-9,a-z,A-Z,特殊符号就可以了。所以这种编码对美国等使用英语的国家是非常适用的。
2.ANSI编码:
但是对于其他国家来说,比如中国,我们的汉字数量是非常多的,256个字符完全不够用,所以很多国家为了显示本国的语言,都对ASCII编码进行了扩展,使用2个字 节进行表示(16位二进制数,理论上可以表示2^16=65536个字符),统称为ANSI编码,这其中有:
GB2312:中国的GB2312码,它包括了6763个汉字,600多个字符。
GBK :后来为了一些罕见的字符,我们国家有对GBK2312进行了扩展,用来显示罕见的,古汉语汉字(已经收录了2.1万个,K的含义就是扩展的意思)
JIS :日本的 JIS码
BIG5 :台湾的BIG5(繁体字)
等等…
3. Unicode码:
后来为了解决传统的字符编码方案的局限性,和兼容性问题,产生了Unicode编码,它用4个字节(32位二进制)表示一个字符,解决了兼容性问题,虽然想法很不错,但是效率太低。
4.utf8码:
是一种针对unicode的可变长度的字符编码,又称为万国码。比如a-z用一个字节表示,但是汉字用3个字节表示。既减少了长度,又保证了兼容性。
结束语:所以utf8成为了我们现在使用最多的一种编码方式!
相关文章推荐
- 关于PHP通过PDO用中文条件查询MySQL的问题。
- 保证asp叶面一定不会出现乱码 UTF8
- ASP编码必备的8条原则
- Perl ASCII 字符判断
- XML指南——XML编码
- C#中字符串编码处理
- ExtJS中文乱码之GBK格式编码解决方案及代码
- 程序员趣味读物 谈谈Unicode编码
- 文本文件编码方式区别
- 与ASCII码相关的C语言字符串操作函数
- C语言安全编码之数值中的sizeof操作符
- C#实现获取文本文件的编码的一个类(区分GB2312和UTF8)
- 常用字符集编码详解(ASCII GB2312 GBK GB18030 unicode UTF-8)
- VC中BASE64编码和解码使用详解
- 计算机中的字符串编码、乱码、BOM等问题详解
- JoshChen_web格式编码UTF8-无BOM的小细节分析
- Base64编码解码原理及C#编程实例
- C#编码好习惯小结
- javascript编码的几个方法详细介绍
- 深入理解Python字符编码 推荐