话说ASCII,Unicode,UTF-8
2016-06-01 23:48
218 查看
重新温习了一下python2(廖雪峰的教程很赞),希望能够温故而知新一点,对学过的东西不要只是肤浅地理解,这也符合人的认知规律(螺旋式的上升)。
看到字符串编码的时候,想搞明白Unicode和UTF-8到底是什么,有什么关系,因为平时都是无脑用UTF-8,大概知道它是个可变长的编码方案,并且能够对目前世界上所有的文字编码(真的吗?其实没那么夸张啦,只是涵盖了绝大部分会用到的,目前Unicode标准还在不断地修改和扩展中,参见wiki:Unicode)。
上图是教程里写的一段话。
google了一下,发现了字符编码笔记:ASCII,Unicode和UTF-8(阮一峰的网络日志)总结得很好的一篇文章,大意是说——Unicode只是规定了字符的二进制表示,但是具体在内存里的表示,没有规定,这就造成了有多种具体的表示方案了,UTF-8就是其中的一种(前缀码)。
wiki则解释得更加详细啦:
Unicode的实现方式不同于编码方式。一个字符的Unicode编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式(Unicode Transformation Format,简称为UTF)。
不过python3里统一使用Unicode编码了,所以就不用傻傻分不清楚了,不过了解清楚其意思和实现,对于整体的理解还是很有帮助的(不要依赖于code candy)。
看到字符串编码的时候,想搞明白Unicode和UTF-8到底是什么,有什么关系,因为平时都是无脑用UTF-8,大概知道它是个可变长的编码方案,并且能够对目前世界上所有的文字编码(真的吗?其实没那么夸张啦,只是涵盖了绝大部分会用到的,目前Unicode标准还在不断地修改和扩展中,参见wiki:Unicode)。
上图是教程里写的一段话。
google了一下,发现了字符编码笔记:ASCII,Unicode和UTF-8(阮一峰的网络日志)总结得很好的一篇文章,大意是说——Unicode只是规定了字符的二进制表示,但是具体在内存里的表示,没有规定,这就造成了有多种具体的表示方案了,UTF-8就是其中的一种(前缀码)。
wiki则解释得更加详细啦:
Unicode的实现方式不同于编码方式。一个字符的Unicode编码是确定的。但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式(Unicode Transformation Format,简称为UTF)。
不过python3里统一使用Unicode编码了,所以就不用傻傻分不清楚了,不过了解清楚其意思和实现,对于整体的理解还是很有帮助的(不要依赖于code candy)。
相关文章推荐
- 杂七杂八
- python~pandas常用代码
- NSURLSession/NSURLConnection HTTP load failed (kCFStreamErrorDomainSSL, -9802)
- 迪杰斯特拉算法的证明
- iOS监听系统键盘的弹起和回收
- 前端实现图片压缩上传
- 让 jQuery UI draggable 适配移动端
- UIView添加UITapGestureRecognizer和UITableView点击冲突
- L1-009
- 第二阶段团队项目冲刺站立会议(九)
- Java8 新特性----函数式接口,以及和Lambda表达式的关系
- JavaScript Array.splice方法替换问题
- 一位客户的务虚会议
- 【JAVA】七 JAVA Dictionary 一 HashTable
- 对外贸电商平台选择又迷茫了
- Sciliy 1007. To and Fro
- 字典树Trie
- c++ 类的基础
- 【LeetCode】105. Construct Binary Tree from Preorder and Inorder Traversal 解题报告
- RecyclerView中利用GridLayoutManager实现item四周都带有分割线效果(更正版!!!)