您的位置:首页 > 其它

常用的编码

2018-01-08 10:07 176 查看
ASCII码是标准化字符集,使用7个二进制位编码,可以表示128个字符,通常ASCII表示的是英文字母的二进制编码,

例如大写字母'A'的二进制编码为65,python代码如下:

>>> ord('A')
65
>>> chr(65)
'A'Unicode是另外一种编码方式,是为了解决传统编码方式的局限而产生的,它为每种语言中的每个字符设置了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转化的要求。对每种语言的每个字符用两个字节长的ID号进行编码,从而规定出一个多达65536个字符的编码空间。
UTF-8编码是一种可变长度的Unicode的实现方法,是一个多字节的编码体系,英文对应Unicode的单字节,中文、日韩文对应Unicode的三字节。我们可以看出UTF-8与Unicode编码方式的区别是,编码长度的不同。Unicode采用固定长度的两个字节来表示,而UTF-8可以采用一到四个字节,不同的长度来表示。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: