您的位置:首页 > 其它

用于“查找和替换”的正则表达式(三)

2009-12-21 11:27 459 查看
下表列出了用于指定 Unicode 字符属性数据库中列出的通用类别的两个字母的缩写词。您可以在正则表达式字符集中使用这些缩写词。例如,表达式 [:Nd:Nl:No] 匹配任何类型的数字。

有关 Unicode 字符属性数据库的详细信息,请参见 Unicode Standard 5.0 Character Properties(Unicode Standard 5.0 字符属性)。

表达式语法说明
大写字母:Lu匹配任何一个大写字母。
例如:

:Luhe 匹配“The”但不匹配“the”。

小写字母:Ll匹配任何一个小写字母。
例如:

:Llhe 匹配“the”但不匹配“The”。

词首大写字母:Lt匹配将大写字母和小写字母结合的字符,例如,Nj 和 Dz。
修饰符字母:Lm匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。
其他字母:Lo匹配其他字母,如哥特体字母 ahsa。
十进制数字:Nd匹配十进制数(如 0-9)和它们的双字节等效数。
字母数字:Nl匹配字母数字,例如罗马数字和表意数字零。
其他数字:No匹配其他数字,如旧斜体数字一。
开始标点符号:Ps匹配开始标点符号,例如左方括号和左大括号。
结束标点符号:Pe匹配结束标点符号,例如右方括号和右大括号。
左引号:Pi匹配左双引号。
右引号:Pf匹配单引号和右双引号。
破折号:Pd匹配破折号标记。
连接符号:Pc匹配下划线标记。
其他标点符号:Po匹配 (,)、?、"、!、@、#、%、&、*、/、(:)、(;)、' 和 /。
空白分隔符:Zs匹配空白。
行分隔符:Zl匹配 Unicode 字符 U+2028。
段落分隔符:Zp匹配 Unicode 字符 U+2029。
无间隔标记:Mn匹配无间隔标记。
组合标记:Mc匹配组合标记。
封闭标记:Me匹配封闭标记。
数学符号:Sm匹配 +、=、~、|、< 和 >。
货币符号:Sc匹配 $ 和其他货币符号。
修饰符号:Sk匹配修饰符号,如抑扬音、抑音符号和长音符号。
其他符号:So匹配其他符号,如版权符号、段落标记和度数符号。
其他控制:Cc匹配类似 TAB 和 NEWLINE 这样的 Unicode 控制字符。
其他格式:Cf格式控制字符,例如双向控制字符。
代理项:Cs匹配代理项对的一半。
其他私用:Co匹配私用区域的任何字符。
其他未分配字符:Cn匹配未映射到 Unicode 字符的字符。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: