您的位置:首页 > 其它

浅析一下ASCII和UNICODE的区别

2016-01-12 12:52 211 查看
我们都知道编码方式有ASCII和Unicode,但是ASCII和Unicode的区别是什么呢?


计算机是美国人发明的所以最早的编码是ASCII编码,用8个bit表示一个字节Byte所以一个字节表示的最大长度就是(1111,1111)也就是255个字符。这在当时是够用了可以表示大小写的英文字母以及一些特殊字符。但是随着计算机的普及问题来了,汉字怎么编码呢?

如果汉字用ASCII编码显然不合适,一个汉字至少需要2个字节而且还不能和ASCII冲突,所以中国制定了GB2312编码用来把汉字编进去。但是世界上这么多国家这么多语言没个国家都制定自己的编码岂不是很麻烦。

此时 Unicode编码横空出世解决了这个难题。

Unicode把所有语言都统一到一套编码中这样就不会出现乱码的情况。Unicode一般采用2个字节编码,而一些生僻一点字可能采用4个字节编码。

现在来说一说ASCII和Unicode的区别:

ASCII 一般采用1个字节编码

Unicode 一般采用2个字节编码

例如: ‘A’用ASCII编码就是 0100 0001,而Unicode编码表示就是0000 0000 0100 0001.我们明显发现Unicode如果表示简单字符那么就要浪费大量的空间来存储,试想如果一个文档基本都是英文字母那么用Unicode存储会比ASCII浪费大量的空间。

为了避免这种情况采用一种全新的编码方式UTF-8编码,可以称作可变长的Unicode。utf-8把Unicode根据长度分为1-6个字节,一般的英文字母用1个字节表示,一般的汉字用3个字节表示,而一些生僻的汉字用4-6个字节,这样传输存储就会大大降低空间。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  编码 unicode ascii