常用编码范围
2015-04-21 09:19
155 查看
编码范围
1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文
2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韩文)
xAC00-xD7A3 (韩文)
u0800-u4e00 (日文)
ps: 韩文是大于[u9fa5]的字符
正则例子(使用PHP):
preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配
preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配
另外一些:
有时候我们也会用到全角英文、特殊符号等
全角英文的UTF8是: uff21 – uff5a ,是从大写A开始到小写的z。
utf8中的 uff20是@
utf8中的 uff01到 uff09是我们美式键盘上shift + 从1到9键上的特殊符号。要注意的是因为@是 uff20,所以 uff02是双引号,同时6的……是两个符号的组合,所以也不存在,正题提前一位(也就是说ff06是&, ff09是))。
utf8中的全角数字是 uff10 – uff19 ,对应关系自然是0-9 。
1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文
2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韩文)
xAC00-xD7A3 (韩文)
u0800-u4e00 (日文)
ps: 韩文是大于[u9fa5]的字符
正则例子(使用PHP):
preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配
preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配
另外一些:
有时候我们也会用到全角英文、特殊符号等
全角英文的UTF8是: uff21 – uff5a ,是从大写A开始到小写的z。
utf8中的 uff20是@
utf8中的 uff01到 uff09是我们美式键盘上shift + 从1到9键上的特殊符号。要注意的是因为@是 uff20,所以 uff02是双引号,同时6的……是两个符号的组合,所以也不存在,正题提前一位(也就是说ff06是&, ff09是))。
utf8中的全角数字是 uff10 – uff19 ,对应关系自然是0-9 。
相关文章推荐
- 常用汉字的UTF-8编码及编码范围
- 常用汉字的UTF-8编码及编码范围
- 各个国家 不同字符集的unicode 编码范围
- 日期转换工具以及常用的字符,产生随机数,将java流中的编码转换为utf-8----java
- 视频音频常用编码解码介绍
- 常用语音编码的WAVE文件头格式剖析--各种编码
- [转]常用字符集编码详解
- Java常用工具类封装——Base64 编码和解码
- 编码中常用的SQL语法
- 常用的编码
- 对各字符集编码范围的总结
- ios各种编码格式范围深坑
- php常用各种文件头编码
- eclipse常用设置(字体设置、jdk版本更改、编码更改)
- 嵌入式 OpenSSL 常用函数——Base64编码及解码和证书操作
- ACCESS常用数字类型的说明和取值范围
- 常用编码介绍
- 标准音阶及常用乐器频率范围对照表(完全版)
- 【lotus Notes/Source Insight/Notepad++】软件开发常用工具设置技巧,提高工作编码效率
- 常用数列的范围问题