您的位置:首页 > 其它

"grep"及正则表达式的一般用法

2015-09-02 17:51 253 查看
grep:是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并能把匹配的行打印出来。
模式:由正则表达式的元字符及文本字符所编写的过滤条件;
元字符:字符不表示其字面意义,而用于表示通配或控制功能;
分两类:
基本正则表达式:BRE
扩展正则表达式:ERE
基本用法:grep [OPTIONS] PATTERN [FILE...]

基本选项:
--color=auto:对匹配到的串做高亮显示
-i            不区分大小写
-o           仅显示能够被模式匹配到的串本行
-v           显示模式匹配不到行
-E           使用扩展的正则表达式
-q, --quiet, --silent      不显示任何东西
实例:
显示etc/passwd文件内含root字符的行,并以高亮显示
[root@localhost yum.repos.d]# grep --color=auto |grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

匹配/etc/passwd文件内的"dns"字符(忽略大小写) -i
[root@localhost ~]# grep -i "dns" /etc/passwd
unbound:x:993:992:Unbound DNS resolver:/etc/unbound:/sbin/nologin
avahi:x:70:70:Avahi mDNS/DNS-SD Stack:/var/run/avahi-daemon:/sbin/nologin

只显示/etc/passwd文件中的“bash”字符 -o
[root@localhost ~]# grep -o "bash" /etc/passwd

除含有“nologin”字符的行 -v
[root@localhost ~]# grep -v "nologin" /etc/passwd

基本正则表达式的元字符:
字符匹配:
.: 匹配任意单个字符;
[]:匹配指定范围内的任意单个字符;
[^]:匹配指定范围内的任意单个字符
[:lower:]表示所有小写字母
[:upper:]表示所有大写字母
[:alpha:]表示所有字母
[:digit:]表示所有数字
[:alnum:]表示所有字母和数字
[:punct:]表示标点符号
[:space:]表示所有的空白字符

次数匹配:用于要指定其次数的字符的后面;
*: 任意次
\?:0或1次

\+:1或多次;
\{m\}:精确限制为m次;
\{m,n\}: 至少m次,至多n次,[m,n]
\{0,n\}:至多n次;
\{m,\}:至少m次;

.*: 匹配任意长度的任意字符

位置锚定:
^: 行首锚定;用于模式的最左侧
$: 行尾锚定;用于模式的最右侧
\<, \b: 词首锚定;用于表示单词的模式的左侧;
\>, \b:词尾锚定;用于表示单词的模式的右侧;
^$: 空白行

分组:\(\)

分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...
\1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
\2:....

后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符

扩展的正则表达式:
grep:基本正则表达式
-E: 扩展正则表达式
-F:不支持正则表达式
egrep:扩展正则表达式
fgrep:不支持正则表达式

扩展正则表达式的元字符与基本正则表达式的区别部分:
?: 0次或1次;
+: 1次以上;
{m}: 精确匹配m次;
{m,n}: 至少m次,至多n次;

锚定:
^: 锚定行首
$: 锚定行尾

分组:()
后向引用:\1, \2, ...

或者:
a|b
C|cat: 不表示Cat或cat,而表示C或cat;
要写成(C|c)at

作业:
1.显示/etc/passwd文件中以bash结尾的行
[root@localhost ~]# grep "bash$" /etc/passwd

2.显示/etc/passwd文件中的两位数或三位数
[root@localhost ~]# grep -o "\<[[:digit:]]\{2,3\}\>" /etc/passwd

3.显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行
[root@localhost ~]# netstat -tan |grep "LISTEN.*$"

4.添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名与其shell名相同的行
[root@localhost ~]# useradd bash
[root@localhost ~]# useradd basher
[root@localhost ~]# useradd -s /sbin/nologin nologin
[root@localhost ~]# grep "^\(\<[[:alnum:]]\+\>\).*\1$" /etc/passwd

5.显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)
[root@localhost ~]# useradd centos
[root@localhost ~]# useradd user1
[root@localhost ~]# cat /etc/passwd |cut -d: -f1,3,7 |egrep "^root|centos|user1"

6.找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行
[root@localhost ~]# egrep "\<[[:alpha:]_]+\>\(\)" /etc/rc.d/init.d/functions

7.使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名
[root@localhost ~]# echo /etc/rc.d/init.d/functions |egrep "([^/][[:alnum:]]+)$"   取出路径基名

[root@localhost ~]# echo /etc/rc.d/init.d/functions |egrep ".*/"                   取出目录名

8.找出ifconfig命令执行结果中1-255之间的数字
[root@localhost ~]# ifconfig |egrep "\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]\>)"
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  表达式 color