perl正则表达式中各种字符集的整理
2007-09-24 15:23
453 查看
UTF8
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/xc0-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}
UTF16
[Copy to clipboard] [ - ]
CODE:
[/x00-/xd7][/xe0-/xff]|[/xd8-/xdf][/x00-/xff]{2}
JIS
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|[/x21-/x5f]|[/x21-/x7e]{2}
SJIS
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|[/xa1-/xdf]|([/x81-/x9f]|[/xe0-/xef])([/x40-/x7e]|[/x80-/xfc])
EUC_JP
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|/x81[/xa1-/xdf]|[/xa1-/xfe][/xa1-/xfe]|/x8f[/xa1-/xfe]{2}
EUC_JP标点符号及特殊字符
[Copy to clipboard] [ - ]
CODE:
[/xa1-/xa2][/xa0-/xfe]
EUC_JP全角数字
[Copy to clipboard] [ - ]
CODE:
/xa3[/xb0-/xb9]
EUC_JP全角大写英文
[Copy to clipboard] [ - ]
CODE:
/xa3[/xc1-/xda]
EUC_JP全角小写英文
[Copy to clipboard] [ - ]
CODE:
/xa3[/xe1-/xfa]
EUC_JP全角平假名
[Copy to clipboard] [ - ]
CODE:
/xa4[/xa1-/xf3]
EUC_JP全角片假名 2007-03-12 15:00更新
[Copy to clipboard] [ - ]
CODE:
/xa3[/xb0-/xb9]|/xa3[/xc1-/xda]|/xa5[/xa1-/xf6][/xa3][/xb0-/xfa]|[/xa1][/xbc-/xbe]|[/xa1][/xdd]
EUC_JP全角汉字 2007-03-12 15:06更新
[Copy to clipboard] [ - ]
CODE:
[/xb0-/xcf][/xa0-/xd3]|[/xd0-/xf4][/xa0-/xfe]|[/xB0-/xF3][/xA1-/xFE]|[/xF4][/xA1-/xA6]|[/xA4][/xA1-/xF3]|[/xA5][/xA1-/xF6]|[/xA1][/xBC-/xBE]
Big5
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|[/xa1-/xfe])
GBK
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]
GB2312汉字
[Copy to clipboard] [ - ]
CODE:
[/xb0-/xf7][/xa0-/xfe]
GB2312半角标点符号及特殊符号
[Copy to clipboard] [ - ]
CODE:
/xa1[/xa2-/xfe]
GB2312罗马数组及项目序号
[Copy to clipboard] [ - ]
CODE:
/xa2([/xa1-/xaa]|[/xb1-/xbf]|[/xc0-/xdf]|[/xe0-/xe2]|[/xe5-/xee]|[/xf1-/xfc])
GB2312全角标点及全角字母
[Copy to clipboard] [ - ]
CODE:
/xa3[/xa1-/xfe]
GB2312日文平假名
[Copy to clipboard] [ - ]
CODE:
/xa4[/xa1-/xf3]
GB2312日文片假名
[Copy to clipboard] [ - ]
CODE:
/xa5[/xa1-/xf6]
補充:
GB18030
[Copy to clipboard] [ - ]
CODE:
[/x00-/x7f]|[/x81-/xfe][/x40-/xfe]|[/x81-/xfe][/x30-/x39][/x81-/xfe][/x30-/x39]
2007-03-12 21:35 补充
日文半角空格
[Copy to clipboard] [ - ]
CODE:
/x20
SJIS全角空格
[Copy to clipboard] [ - ]
CODE:
(?:/x81/x81)
SJIS全角数字
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x4f-/x58])
SJIS全角大写英文
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x60-/x79])
SJIS全角小写英文
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x81-/x9a])
SJIS全角平假名
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x9f-/xf1])
SJIS全角平假名扩展
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x9f-/xf1]|/x81[/x4a/x4b/x54/x55])
SJIS全角片假名
[Copy to clipboard] [ - ]
CODE:
(?:/x83[/x40-/x96])
SJIS全角片假名扩展
[Copy to clipboard] [ - ]
CODE:
(?:/x83[/x40-/x96]|/x81[/x45/x5b/x52/x53])
EUC_JP全角空格
[Copy to clipboard] [ - ]
CODE:
(?:/xa1/xa1)
EUC半角片假名
[Copy to clipboard] [ - ]
CODE:
(?:/x8e[/xa6-/xdf])
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/xc0-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}
UTF16
[Copy to clipboard] [ - ]
CODE:
[/x00-/xd7][/xe0-/xff]|[/xd8-/xdf][/x00-/xff]{2}
JIS
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|[/x21-/x5f]|[/x21-/x7e]{2}
SJIS
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|[/xa1-/xdf]|([/x81-/x9f]|[/xe0-/xef])([/x40-/x7e]|[/x80-/xfc])
EUC_JP
[Copy to clipboard] [ - ]
CODE:
[/x20-/x7e]|/x81[/xa1-/xdf]|[/xa1-/xfe][/xa1-/xfe]|/x8f[/xa1-/xfe]{2}
EUC_JP标点符号及特殊字符
[Copy to clipboard] [ - ]
CODE:
[/xa1-/xa2][/xa0-/xfe]
EUC_JP全角数字
[Copy to clipboard] [ - ]
CODE:
/xa3[/xb0-/xb9]
EUC_JP全角大写英文
[Copy to clipboard] [ - ]
CODE:
/xa3[/xc1-/xda]
EUC_JP全角小写英文
[Copy to clipboard] [ - ]
CODE:
/xa3[/xe1-/xfa]
EUC_JP全角平假名
[Copy to clipboard] [ - ]
CODE:
/xa4[/xa1-/xf3]
EUC_JP全角片假名 2007-03-12 15:00更新
[Copy to clipboard] [ - ]
CODE:
/xa3[/xb0-/xb9]|/xa3[/xc1-/xda]|/xa5[/xa1-/xf6][/xa3][/xb0-/xfa]|[/xa1][/xbc-/xbe]|[/xa1][/xdd]
EUC_JP全角汉字 2007-03-12 15:06更新
[Copy to clipboard] [ - ]
CODE:
[/xb0-/xcf][/xa0-/xd3]|[/xd0-/xf4][/xa0-/xfe]|[/xB0-/xF3][/xA1-/xFE]|[/xF4][/xA1-/xA6]|[/xA4][/xA1-/xF3]|[/xA5][/xA1-/xF6]|[/xA1][/xBC-/xBE]
Big5
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|[/xa1-/xfe])
GBK
[Copy to clipboard] [ - ]
CODE:
[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]
GB2312汉字
[Copy to clipboard] [ - ]
CODE:
[/xb0-/xf7][/xa0-/xfe]
GB2312半角标点符号及特殊符号
[Copy to clipboard] [ - ]
CODE:
/xa1[/xa2-/xfe]
GB2312罗马数组及项目序号
[Copy to clipboard] [ - ]
CODE:
/xa2([/xa1-/xaa]|[/xb1-/xbf]|[/xc0-/xdf]|[/xe0-/xe2]|[/xe5-/xee]|[/xf1-/xfc])
GB2312全角标点及全角字母
[Copy to clipboard] [ - ]
CODE:
/xa3[/xa1-/xfe]
GB2312日文平假名
[Copy to clipboard] [ - ]
CODE:
/xa4[/xa1-/xf3]
GB2312日文片假名
[Copy to clipboard] [ - ]
CODE:
/xa5[/xa1-/xf6]
補充:
GB18030
[Copy to clipboard] [ - ]
CODE:
[/x00-/x7f]|[/x81-/xfe][/x40-/xfe]|[/x81-/xfe][/x30-/x39][/x81-/xfe][/x30-/x39]
2007-03-12 21:35 补充
日文半角空格
[Copy to clipboard] [ - ]
CODE:
/x20
SJIS全角空格
[Copy to clipboard] [ - ]
CODE:
(?:/x81/x81)
SJIS全角数字
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x4f-/x58])
SJIS全角大写英文
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x60-/x79])
SJIS全角小写英文
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x81-/x9a])
SJIS全角平假名
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x9f-/xf1])
SJIS全角平假名扩展
[Copy to clipboard] [ - ]
CODE:
(?:/x82[/x9f-/xf1]|/x81[/x4a/x4b/x54/x55])
SJIS全角片假名
[Copy to clipboard] [ - ]
CODE:
(?:/x83[/x40-/x96])
SJIS全角片假名扩展
[Copy to clipboard] [ - ]
CODE:
(?:/x83[/x40-/x96]|/x81[/x45/x5b/x52/x53])
EUC_JP全角空格
[Copy to clipboard] [ - ]
CODE:
(?:/xa1/xa1)
EUC半角片假名
[Copy to clipboard] [ - ]
CODE:
(?:/x8e[/xa6-/xdf])
相关文章推荐
- Python正则表达式匹配各种标准形式整理
- 正则表达式学习整理大全
- 最严谨的校验email地址的正则表达式及各种语言对应版
- javascript 正则表达式知识点总结:(转并整理)
- 解析posix与perl标准的正则表达式区别
- [整理] 正则表达式的学习参考资料
- 解析posix与perl标准的正则表达式区别
- Delphi 正则表达式之TPerlRegEx 类的属性与方法(1): 查找
- 超常用的PHP正则表达式收集整理
- perl 的mail严格正则表达式到底要怎么写?
- 强大的Perl正则表达式实例详解
- [整理]常用正则表达式
- 批处理 正则表达式(findstr) 整理
- C#正则表达式整理备忘(四)
- C#正则表达式整理备忘 实例
- Delphi 正则表达式之TPerlRegEx 类的属性与方法(5): Compile、Study
- asp.net 验证正则表达式 精心整理
- C#正则表达式经典分类整理集合手册
- js 验证各种格式类型的正则表达式
- 常用的正则表达式整理