awk小知识
2015-08-14 13:43
162 查看
next和getline
next语句从输入文件中读取下一行,然后从头开始执行awk脚本。
getline从整体上来说,应这么理解它的用法:
当其左右无重定向符 | 或 < 时,getline作用于当前文件,读入当前文件的下一行给其后跟的变量var或$0(无变量);应该注意到,由于awk在处理getline之前已经读入了一行,所以getline得到的返回结果是隔行的。
当其左右有重定向符 | 或 < 时,getline则作用于定向输入文件,由于该文件是刚打开,并没有被awk读入一行,只是getline读入,那么getline返回的是该文件的第一行,而不是隔行。
next和getline在awk执行过程中都用于读取下一行数据,但他们却有着很重要的不同。
next读取下一行之后,把控制权交给了awk脚本的顶部,及next后面的语句将被忽略,重头执行那个awk的action,同时内置变量FNR等被重置。
getline却没有改变脚本的控制,读取下一行之后,继续运行当前的awk脚本,内置变量也不会被重置。getline执行之后,会覆盖$0的内容。
getline例子
$ awk '{getline;print $0,NR} ' file1
a 1 2
c 3 4
a 1 6
$ awk '{print $0,NR;getline} ' file1
a 1 1
b 2 3
d 4 5$ awk '{getline;print $0,NR;getline} ' file1
a 1 2
d 4 5
隔行处理数据
$ awk '{print $0,NR;getline} {print $0,NR}' file1
a 1 1
a 1 2
b 2 3
c 3 4
d 4 5
a 1 6
可以看到getline的操作是读取下一行数据到内存中
exit
在 awk中exit的执行有两种情况:当exit语句不在 END中时,任何操作中的exit命令表现得如同到了文件尾,所有模式或操作执行将停止,END模式中的操作被执行。而出现在END中的exit将导致程序终止。退出状态为0代表成功,非零值表示出错。
单引号 ( ' ' )
如果我们想查找的是Susan Goldberg,不能直接使用grep Susan Goldberg phonebook命令,grep会把Goldberg和phonebook当作需要搜索的文件
$ grep 'Susan Gold' phonebook
Susan Goldberg 403-212-4921
当shell碰到第一个单引号时,它忽略掉其后直到右引号的所有特殊字符
如果想打印单引号,可以采用如下方式
$ awk 'BEGIN{print "'\''"} '
或者用047代替单引号
$ awk '{print "\047"}'
双引号 ( " " )
双引号作用与单引号类似,区别在于它没有那么严格。单引号告诉shell忽略所有特殊字符,而双引号只要求忽略大多数,具体说,括在双引号中的三种特殊字符不被忽略:$,\,` ,即双引号会解释字符串的特别意思,而单引号直接使用字符串.如果使用双引号将字符串赋给变量并反馈它,实际上与直接反馈变量并无差别。如果要查询包含空格的字符串,经常会用到双引号。
$ x=*
$ echo $x
hello.sh menus.sh misc.sh phonebook tshift.sh
$ echo '$x'
$x
$ echo "$x"
*
这个例子可以看出无引号、单引号和双引号之间的区别。在最后一种情况中,双引号告诉shell在引号内照样进行变量名替换,所以shell把$x替换为*,因为双引号中不做文件名替换,所以就把*作为要显示的值传递给echo。
对于第一种情况需要进一步说明,shell在给变量赋值时不进行文件名替换(这从第三种情况中也能看出来),各步骤发生的精确次序如下:
shell扫描命令行,把x的值设为星号*;
shell再次扫描命令行,碰到星号*,把它替换成当前目录下的文件清单;
shell启动执行echo命令,把文件清单作为参数传递给echo.
这个赋值的先后次序非常重要:shell先作变量替换,然后作文件名替换,最后把这行处理为参数
反引号(``)
命令替换是指shell能够将一个命令的标准输出插在一个命令行中任何位置。
shell中有两种方法作命令替换:把shell命令用反引号或者$(...)结构括起来。
其中,$(...)格式受到POSIX标准支持,也利于嵌套。
$ echo The date and time is `date`
The date and time is 三 6月 15 06:10:35 CST 2005
$ echo Your current working directory is $(pwd)
Your current working directory is /home/howard/script.
反斜杠 backslash-escaped( \ )
反斜杠一般用作转义字符,或称逃脱字符,linux如果echo要让转义字符发生作用,就要使用-e选项,且转义字符要使用双引号
echo -e "\n"
反斜杠的另一种作用,就是当反斜杠用于一行的最后一个字符时,shell把行尾的反斜杠作为续行,这种结构在分几行输入长命令时经常使用
修改自:http://czmmiao.iteye.com/blog/1885572
http://czmmiao.iteye.com/blog/1887660
next语句从输入文件中读取下一行,然后从头开始执行awk脚本。
getline从整体上来说,应这么理解它的用法:
当其左右无重定向符 | 或 < 时,getline作用于当前文件,读入当前文件的下一行给其后跟的变量var或$0(无变量);应该注意到,由于awk在处理getline之前已经读入了一行,所以getline得到的返回结果是隔行的。
当其左右有重定向符 | 或 < 时,getline则作用于定向输入文件,由于该文件是刚打开,并没有被awk读入一行,只是getline读入,那么getline返回的是该文件的第一行,而不是隔行。
next和getline在awk执行过程中都用于读取下一行数据,但他们却有着很重要的不同。
next读取下一行之后,把控制权交给了awk脚本的顶部,及next后面的语句将被忽略,重头执行那个awk的action,同时内置变量FNR等被重置。
getline却没有改变脚本的控制,读取下一行之后,继续运行当前的awk脚本,内置变量也不会被重置。getline执行之后,会覆盖$0的内容。
getline例子
$ awk '{getline;print $0,NR} ' file1
a 1 2
c 3 4
a 1 6
$ awk '{print $0,NR;getline} ' file1
a 1 1
b 2 3
d 4 5$ awk '{getline;print $0,NR;getline} ' file1
a 1 2
d 4 5
隔行处理数据
$ awk '{print $0,NR;getline} {print $0,NR}' file1
a 1 1
a 1 2
b 2 3
c 3 4
d 4 5
a 1 6
可以看到getline的操作是读取下一行数据到内存中
exit
在 awk中exit的执行有两种情况:当exit语句不在 END中时,任何操作中的exit命令表现得如同到了文件尾,所有模式或操作执行将停止,END模式中的操作被执行。而出现在END中的exit将导致程序终止。退出状态为0代表成功,非零值表示出错。
单引号 ( ' ' )
如果我们想查找的是Susan Goldberg,不能直接使用grep Susan Goldberg phonebook命令,grep会把Goldberg和phonebook当作需要搜索的文件
$ grep 'Susan Gold' phonebook
Susan Goldberg 403-212-4921
当shell碰到第一个单引号时,它忽略掉其后直到右引号的所有特殊字符
如果想打印单引号,可以采用如下方式
$ awk 'BEGIN{print "'\''"} '
或者用047代替单引号
$ awk '{print "\047"}'
双引号 ( " " )
双引号作用与单引号类似,区别在于它没有那么严格。单引号告诉shell忽略所有特殊字符,而双引号只要求忽略大多数,具体说,括在双引号中的三种特殊字符不被忽略:$,\,` ,即双引号会解释字符串的特别意思,而单引号直接使用字符串.如果使用双引号将字符串赋给变量并反馈它,实际上与直接反馈变量并无差别。如果要查询包含空格的字符串,经常会用到双引号。
$ x=*
$ echo $x
hello.sh menus.sh misc.sh phonebook tshift.sh
$ echo '$x'
$x
$ echo "$x"
*
这个例子可以看出无引号、单引号和双引号之间的区别。在最后一种情况中,双引号告诉shell在引号内照样进行变量名替换,所以shell把$x替换为*,因为双引号中不做文件名替换,所以就把*作为要显示的值传递给echo。
对于第一种情况需要进一步说明,shell在给变量赋值时不进行文件名替换(这从第三种情况中也能看出来),各步骤发生的精确次序如下:
shell扫描命令行,把x的值设为星号*;
shell再次扫描命令行,碰到星号*,把它替换成当前目录下的文件清单;
shell启动执行echo命令,把文件清单作为参数传递给echo.
这个赋值的先后次序非常重要:shell先作变量替换,然后作文件名替换,最后把这行处理为参数
反引号(``)
命令替换是指shell能够将一个命令的标准输出插在一个命令行中任何位置。
shell中有两种方法作命令替换:把shell命令用反引号或者$(...)结构括起来。
其中,$(...)格式受到POSIX标准支持,也利于嵌套。
$ echo The date and time is `date`
The date and time is 三 6月 15 06:10:35 CST 2005
$ echo Your current working directory is $(pwd)
Your current working directory is /home/howard/script.
反斜杠 backslash-escaped( \ )
反斜杠一般用作转义字符,或称逃脱字符,linux如果echo要让转义字符发生作用,就要使用-e选项,且转义字符要使用双引号
echo -e "\n"
反斜杠的另一种作用,就是当反斜杠用于一行的最后一个字符时,shell把行尾的反斜杠作为续行,这种结构在分几行输入长命令时经常使用
修改自:http://czmmiao.iteye.com/blog/1885572
http://czmmiao.iteye.com/blog/1887660
相关文章推荐
- 文本处理工具AWK详解
- awk简介与学习笔记收集第1/3页
- linux shell awk获得外部变量(变量传值)简介
- sed或awk处理文件最后一行的实现方法
- awk中查看包含某两列字符的用法
- awk区间取值的例子
- awk实现Left、join查询、去除重复值以及局部变量讲解例子
- awk中让人郁闷的system()函数
- awk中实现ord函数功能
- awk中RS、ORS、FS、OFS的区别和联系小结
- 分享awk变量$0的妙用
- awk正则表达式和内置函数的使用方法实例详解
- Shell正则表达式之grep、sed、awk实操笔记
- Linux里awk中split函数的用法小结
- Shell对比两个文件中的记录有多少重复
- awk学习系列-第3/3部分
- grep,awk,sed实例
- Linux如何使用awk文本处理工具进行数组排序
- awk 正则表达式
- awk命令简介