您的位置:首页 > 编程语言 > Python开发

Python用正则表达式判断中文字符

2011-09-27 15:56 567 查看
str,GBK编码:“高字节从0x81到0xFE,低字节从0x40到0xFE,同时不包括0x7F。”

unicode,汉字范围: 4e00 - 9fa5 。

# coding=gbk
import re
m = re.match('[\u4e00-\u9fa5]+', '中文')
print (m.group(0))
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: