utf8与gb2313的区别
2015-10-30 18:57
302 查看
1、UTF-8:Unicode
TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。
2、GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。
把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB
13000—1的全部中、日、韩(CJK)汉字,共计20902字。
TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。
2、GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。
把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB
13000—1的全部中、日、韩(CJK)汉字,共计20902字。
相关文章推荐
- C++求积分代码
- KMP算法求next数组和nextval…
- 分治与递归——循环赛日程表
- c++电话本程序
- 部分背包问题-贪心法源码
- 【转】SWAP函数的几种写法
- c++任意数循环赛另一种递归实现方…
- 51单片机电子琴C代码
- 51单片机-播放天空之城
- 基于STM32神舟系列开发板的读取绝…
- 基于STM32神舟系列开发板的串口通…
- STM32流水灯,小畅当初弄的小儿科…
- [转载]用Mathematica写动态…
- 01背包问题-动态规划源码
- LoadRunner测试50人同时登陆下单
- CSS布局之--各种居中
- Random类详解
- WebApi传参总动员(二)
- Python练习册,第 0005 题
- [NOIP 2013]花匠 DP