关于编码的小知识
2015-09-17 22:21
239 查看
(一) unicode编码
1.unicode编码是一种在计算机上使用的字符编码
2.unicode为每种语言中的每个字符都设定了统一并且唯一的二进制编码,以此来达到满足跨语言,跨平台进 行文本转换和处理的要求
(二)UTF-8
1.UTF-8是一种针对unicode的可变长度的字符编码,又叫万国码这是为了节省空间而优化unicode。我的理解 是UTF-8是unicode的升级版
2.UTF-8可以实现在网页上同一页面显示多种语言
3.UTF-8的编码规则:
(1)对于单字节符号,字节第一位为0,后面7位均为这个符号的unicode码;(对于英文字母,UTF-8编码和 ASCII码是相同的)
(2)对于n(n>1)字节的符号:第一个字节的前n位为1,第n+1位为0,后面字节的前2位一律设为10
剩下的没提到的全为这个符号的unicode码;
学习参考网址:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
1.unicode编码是一种在计算机上使用的字符编码
2.unicode为每种语言中的每个字符都设定了统一并且唯一的二进制编码,以此来达到满足跨语言,跨平台进 行文本转换和处理的要求
(二)UTF-8
1.UTF-8是一种针对unicode的可变长度的字符编码,又叫万国码这是为了节省空间而优化unicode。我的理解 是UTF-8是unicode的升级版
2.UTF-8可以实现在网页上同一页面显示多种语言
3.UTF-8的编码规则:
(1)对于单字节符号,字节第一位为0,后面7位均为这个符号的unicode码;(对于英文字母,UTF-8编码和 ASCII码是相同的)
(2)对于n(n>1)字节的符号:第一个字节的前n位为1,第n+1位为0,后面字节的前2位一律设为10
剩下的没提到的全为这个符号的unicode码;
学习参考网址:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
相关文章推荐
- Linux 与 Windows 对UNICODE 的处理方式
- Unicode详细分析解释
- vbs中将GB2312转Unicode的代码
- XML指南——XML编码
- C#中字符串编码处理
- ExtJS中文乱码之GBK格式编码解决方案及代码
- 程序员趣味读物 谈谈Unicode编码
- 文本文件编码方式区别
- C语言安全编码之数值中的sizeof操作符
- C#实现获取文本文件的编码的一个类(区分GB2312和UTF8)
- 常用字符集编码详解(ASCII GB2312 GBK GB18030 unicode UTF-8)
- VC中BASE64编码和解码使用详解
- C#实现Json转Unicode的方法
- 计算机中的字符串编码、乱码、BOM等问题详解
- UTF-8、Unicode 标准化表单、BOM
- Base64编码解码原理及C#编程实例
- C#编码好习惯小结
- ASP UTF-8页面乱码+GB2312转UTF-8 +生成UTF-8格式的文件(编码)第1/2页
- 深入理解Python字符编码 推荐
- mysql 设置编码