您的位置:首页 > 其它

常用正则表达式 grep awk sed

2013-08-31 22:34 806 查看
常用正则表达式:
1.“.”代表任意单个字符
2.“^”代表行的开始
3.“$”代表行的结束,“^$” 就表示空行
4.“[…]”匹配括号中的字符之一
注意:不管[]里面多复杂,它的结果都是一个字符!

可以使用^做[]的内置前缀,在[]里的开头,表示除了其后跟着的其他任意字符
5.“*”用于修饰前导字符,表示前导字符出现0次或任意多次,“.*” 表示任意字符串
6.“\?”用于修饰前导字符,表示前导字符出现0或1次
7.“\+”用于修饰前导字符,表示前导字符出现1或多次

8.“\{n,m\}”用于修饰前导字符,表示前导字符出现n至m次(n和m都是整数,且n<m)

“\{n,m\}”还有其他几种形式:

“\{n\} ”连续的n个前导字符
“\{n,\}”连续的至少n个前导字符
9.“\”用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符
10.“|”表示或

11.“()”将部分内容合成一个单位组

sed的基本命令:
1.替换命令s
[root@server ~]#sed ‘s/day/night/’ <old>new
将文件old中每行第一次出现的day替换成night,将结果输出到文件new中。
/../../ 分割符(Delimiter),可以用别的符号代替,紧跟s的字符为分隔符
day 搜索字符串
night 替换字符串
2.用&表示匹配的字符串
[root@server ~]#sed ‘s/abc/(abc)/’ <old>new
[root@server ~]#sed ‘s/abc/(&)/’ <old>new
[root@server ~]#sed ‘s/[a-z]*/(&)/’ <old>new
3.sed默认只替换每行第一次出现的搜索字符串,利用/g可以替换所有搜索字符串。
[root@server ~]#sed ‘s/test/mytest/g’ example
[root@server ~]#sed ‘s/^192.168.0.1/&localhost/’example
4.使用-e选项可以对同一文件或行作多次修改
[root@server ~]#sed -e ‘3,5s/e/ha/’ -e ‘s/ll/aaa/’ a1
5.删除行,命令d
[root@server ~]#sed ‘/how/ d’ a1
附:nl可以将输出的文件内容自动加上行号
[root@server ~]#nl /etc/passwd | sed ‘3,$ d’
6.增加行,命令a(在指定的行后新增)或命令i(在指定的行前新增),后面可以接字符串,而这些字符串会在新的一行出现。
[root@server ~]#nl /etc/passwd | sed ‘2a xxxx’
[root@server ~]#nl /etc/passwd | sed ‘2i xxxx’
[root@server ~]#nl /etc/passwd | sed ‘2i xxx \
> yyy’
7.取代行,命令c,后面可以接字符串,这些字符串可以取代n1,n2行之间的内容
[root@server ~]#nl /etc/passwd | sed ‘2,5c xxxx’
8.打印,命令p
[root@server ~]#sed ‘/north/p’ datafile //默认输出所有行,找到north的行重复打印
[root@server ~]#sed -n ‘/north/p’ datafile //禁止默认输出,只打印找到north的行
[root@server ~]#nl /etc/passwd | sed -n ‘5,7p’ //仅列出/etc/passwd文件中的5至7行内容
注:sed 的-i选项可以直接修改文件中的内容
[root@server ~]#sed -i‘2i xxxx’ a1

grep命令的用法
参数:

1. -A NUM
[root@server ~]#grep –A 1 panda file //除了列出符合的行外,还列出后NUM行
2. -A NUM
[root@server ~]#grep -B 1 panda file //除了列出符合的行外,还列出前NUM行
3. -C NUM 列出符合行之外并列出上下各NUM行,默认值是2。

[root@server ~]#grep -C NUM pandafile

4.-c, --count 不显示符合样式行,只显示符合的总行数。若再加上-v,--invert-match,参数显示不符合的总行数

5.-i,--ignore-case 忽略大小写差别
6.-n,--line-number 在匹配的行前面打印行号

7.-v,--revert-match 反检索,显示不匹配的行

8.精确匹配:在抽取的字符串前加“\<”,在抽取的字符串后加“\>”
[root@server ~]#grep '\<cancel\>' filename
9.-s 可屏蔽错误信息,使其不显示在屏幕上
[root@server ~]#grep "root" /etc/password //没有password这个文件,加上-s会屏蔽错误信息

awk命令的用法
【布尔表达式】
①表达式中可以使用变量(如字段变量$1,$2等)和/regexp/
②布尔表达式中的操作符:
关系操作符: < > <= >= == !=
匹配操作符: value ~ /regexp/,如果value匹配/regexp/,则返回真
value !~ /regexp/ 如果value不匹配/regexp/,则返回真
[root@server ~]#awk '$2 > 10 {print "ok"}' xxxx
[root@server ~]#awk '$3 ~ /^d/ {print"ok"}' xxxx
③&&(与) 和 ||(或) 可以连接两个/regexp/或者布尔表达式,构成混合表达式。!(非) 可以用于布尔表达式或者/regexp/之前。
[root@server ~]#awk '($1 < 10 ) && ($2 > 10) {print "ok"}' xxxx
[root@server ~]#awk '/^d/ || /x$/ {print"ok"}' xxxx
(使用$1 , $3表示参照第1域和第3域时,注意用逗号做域分隔符)
例:
[root@server ~]#awk –F: ‘{print $1,$7}’ /etc/passwd
[root@server ~]#awk –F: ‘{print $1 “\t” $7}’ /etc/passwd
[root@server ~]#awk –F: ‘{print $1 “,” $7}’ /etc/passwd
[root@server ~]#awk –F: ‘$3>500 {print $1,$7}’ /etc/passwd
[root@server ~]#awk –F: ‘BEGIN {print “name,shell”} $3>500 {print $1”,”$7} END {print “blue,/bin/bash”}’/etc/passwd
[root@server ~]#awk ‘{print $0}’ /etc/passwd //$0所有记录
[root@server ~]#awk –F: ‘/root/’ /etc/passwd
[root@server ~]#awk –F: ‘/^root/’ /etc/passwd
[root@server ~]#awk –F: ‘/root/ {print $7}’ /etc/passwd
awk常用内置变量
FILENAME awk浏览的文件名
FS 设置输入域分隔符,等价于命令行-F选项
NF 浏览记录的域个数(每一行($0)拥有的字段总数)
NR 已读的记录数(awk所处理的是第几行数据)
除了awk的内置变量,awk还可以自定义变量
[root@server ~]#awk -F: ‘$3>500 { print “filename:” FILENAME “,linenumber:” NR “,columns:” NF “,linecontent:”$0}’ /etc/passwd
[root@server ~]#awk –F: ‘{print NF,NR,$0} END {print FILENAME}’ /etc/passwd
[root@server ~]#awk ‘{count++;print $0;} END {print “user count is:”,count}’ /etc/passwd

count是自定义变量,没有初始化时,默认是0,为保妥应初始化为0。
[root@server ~]#awk ‘BEGIN {count=0; print “[start]user count is:”, count} {count=count+1;print $0;}END {print “[end]user count is :”,count}’ /etc/passwd
例:统计某个文件夹下的文件占用的字节数
[root@server ~]#ls –l /etc/ | awk ‘BEGIN {size=0;} {size=size+$5;} END {print “[end]size is:”,size}’
如果以M为单位显示:
[root@server ~]#ls –l /etc/ | awk ‘BEGIN {size=0;} {size=size+$5;} END {print “[end]size is:”,size/1024/1024,”M”}’
注:以上统计没有包括子目录中的文件。
例:快速查看所有文件的长度及其总和,排除子目录:
[root@server ~]#ls –l /xxxx/ | awk ‘/^[^d]/ {print $9 “\t” $5;sum+=$5} END {print “total KB:” sum}’
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: