常用的编码
2018-01-08 10:07
176 查看
ASCII码是标准化字符集,使用7个二进制位编码,可以表示128个字符,通常ASCII表示的是英文字母的二进制编码,
例如大写字母'A'的二进制编码为65,python代码如下:
>>> ord('A')
65
>>> chr(65)
'A'Unicode是另外一种编码方式,是为了解决传统编码方式的局限而产生的,它为每种语言中的每个字符设置了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转化的要求。对每种语言的每个字符用两个字节长的ID号进行编码,从而规定出一个多达65536个字符的编码空间。
UTF-8编码是一种可变长度的Unicode的实现方法,是一个多字节的编码体系,英文对应Unicode的单字节,中文、日韩文对应Unicode的三字节。我们可以看出UTF-8与Unicode编码方式的区别是,编码长度的不同。Unicode采用固定长度的两个字节来表示,而UTF-8可以采用一到四个字节,不同的长度来表示。
例如大写字母'A'的二进制编码为65,python代码如下:
>>> ord('A')
65
>>> chr(65)
'A'Unicode是另外一种编码方式,是为了解决传统编码方式的局限而产生的,它为每种语言中的每个字符设置了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转化的要求。对每种语言的每个字符用两个字节长的ID号进行编码,从而规定出一个多达65536个字符的编码空间。
UTF-8编码是一种可变长度的Unicode的实现方法,是一个多字节的编码体系,英文对应Unicode的单字节,中文、日韩文对应Unicode的三字节。我们可以看出UTF-8与Unicode编码方式的区别是,编码长度的不同。Unicode采用固定长度的两个字节来表示,而UTF-8可以采用一到四个字节,不同的长度来表示。
相关文章推荐
- 提高java编码效率的常用但容易忘记的方法
- (3)Android入门——android编码规范 & 常用布局 & 常用控件
- iOS 字符串常用编码互相转换
- 常用汉字的UTF-8编码及编码范围
- Java常用工具类封装——Base64 编码和解码
- 常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、unicode、UTF-8 [转]
- 常用语音编码的WAVE文件头格式剖析
- 常用mysql命令_关于编码
- android编码规范 & 常用布局 & 常用控件
- 常用的编码简介
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- PHP检测字符串是否为UTF8编码的常用方法
- 基带传输的常用编码
- 几种常用编码及其用法介绍
- tomcat管理界面常用设置 -- 设定URI 编码
- Css中常用中文字体的Unicode编码对照
- linux驱动程序之触摸屏(涵盖了常用的事件编码)
- Response一些常用的场景和浏览器和服务器间编码问题
- Protocol 编码的三种常用方式
- 常用字符集及编码