您的位置:首页 > 运维架构 > Linux

Linux基础(9)文本处理三剑客之grep

2016-07-13 20:05 633 查看
grep的作用:根据指定的模式搜索文本,将匹配到的文本行显示出来
语法格式:grep "PATTERN" file
PATTERN为正则表达式,grep一般是与正则表达式配合使用的,因此我们先介绍shell下的正则表达式。正则表达式,简单来说就是匹配规则。某一行文本与正则表达式进行匹配只有两种结果,要么匹配,要么不匹配。
接下来我们详细的介绍下正则表达式

1.元字符:
.: 匹配任意单个字符
[]: 匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符
字符集合:
[:digit:] or [0-9] 数字
[:lower:] or [a-z] 小写字母
[:upper:] or [A-Z] 大写字母
[:punct:] 标点符号
[:space:] 空白
[:alpha:] [a-zA-Z] 字母
[:alnum:] [a-zA-Z0-9] 字母+数字
[^[:digit:]] 非数字
2.匹配次数(贪婪模式, 一直匹配到最后):
*: 匹配其前面的字符任意次
a, b, ab, aab, acb, adb, amnb
a*b, a?b
a.*b
.*: 任意长度的任意字符 (注意,区别于通配符)
\?: 匹配其前面的字符1次或0次 别忘了转义\
\{m,n\}:匹配其前面的字符至少m次,至多n次 别忘了转义\
\{1,\} 至少1次
\{0,3\} 0到3次

3.位置锚定:
^: 锚定行首,此字符后面的任意内容必须出现在行首
$: 锚定行尾,此字符前面的任意内容必须出现在行尾
^$: 空白行

\<或\b: 锚定词首,其后面的任意字符必须作为单词首部出现
\>或\b: 锚定词尾,其前面的任意字符必须作为单词的尾部出现

4.分组: 别忘了转义
\(\)
\(ab\)* ab看做是一个整体
后向引用
\1: 引用第一个左括号以及与之对应的右括号所包括的所有内容
\2:
\3:
光说不练假把式。下面给出几个例子
1、显示/proc/meminfo文件中以不区分大小的s开头的行;
grep -i '^s' /proc/meminfo
grep '^[sS]' /proc/meminfo
2、显示/etc/passwd中以nologin结尾的行;
grep 'nologin$' /etc/passwd

取出默认shell为/sbin/nologin的用户列表
grep "nologin$' /etc/passwd | cut -d: -f1

取出默认shell为bash,且其用户ID号最小的用户的用户名
grep 'bash$' /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1

3、显示/etc/inittab中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;
grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab

4、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;
grep ':[0-9]:' /etc/inittab

5、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行;
grep '^[[:space:]]\{1,\}' /boot/grub/grub.conf

6、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
grep '^\([0-9]\).*\1$' /etc/inittab
7.分析/etc/inittab文件中如下文本中前两行的特征(每一行中出现在数字必须相同),请写出可以精 确找到类似两行的模式:
l1:1:wait:/etc/rc.d/rc 1
l3:3:wait:/etc/rc.d/rc 3
grep '^l\([0-9]\):\1.*\1$' /etc/inittab

本文出自 “厚积薄发” 博客,请务必保留此出处http://joedlut.blog.51cto.com/6570198/1826179
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: