您的位置:首页 > 其它

通配符家族简介

2015-12-27 20:53 232 查看
通配符和正则表达是常引起混淆的一组概念。因此参考wikipedia和其他一些通用的linux教材,视图将其弄明白。
通配符的概念据说起源于一个用于将文件路径(以通配字符为参数)转化为可执行命令的函数glob(),是'global command'的缩写,现在这个函数已经成为了shell里的库函数。但平时我们所谓的通配符对应的应该是'wildcard',也就是这个函数中的通配字符参数。

一般通配符(wildcard)用于聚集(glob)以系列名字类似的文件,而正则表达式(regexps)则常用于字符串的模式匹配。

通配字符一般只包括任意多字符通配符(*), 任意单字符通配符(?) 和 指定单字符通配符[]。但由于其不支持字符完备集的约束,因此没有被包含在正则表达式的范围内。 只能处理那些较为简单的匹配任务。

unix系统中的通配符增加了取反符[!],也有用[^]的。
dos和windows中的cmd中不支持[],而只能出现在模式的尾部。
类SQL语言中like关键字中的类通配符用_取代了?, %取代了
正则表达式中用.替代了?, .*替代了*,另外正则表达式支持局部匹配,而正则表达式仅支持整个字符串的匹配。

正则表达式又分为基本型和扩展型,其基本的规则如下:
基本正则表达式

元字符
. 任意单个字符
[] 任意匹配的单个字符
[^] 任意不匹配的单个字符

次数
* 任意多次
? 0次或1次
\ {m, n\ } 至少m次, 至多n次

位置
^ 行首
$ 行尾
< 词首
> 词尾

分组
\ ( \ ) 定义分组
\n 引用第n个分组

扩展正则表达式

元字符: 同

次数匹配:
+ 至少一次
? 不需要加

不需要加\

位置锚定:同

分组
() 不需要小括号
\1 同

逻辑符号 c|cat表示c或者cat
| 或者
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: