您的位置:首页 > 运维架构 > Linux

【awk】诡异的错误,linux和windows换行的区别

2010-11-08 21:11 519 查看
题目:文件a,每行两列,格式为url ip,文件b每行一列,格式为url,通过awk实现找出b文件中的url是否在a文件中,如存在,将此url和对应的ip输出(文件大小不考虑)

编写文件a如下:

www.baidu.com 61.135.169.125
im.baidu.com 123.125.115.69
zhidao.baidu.com 123.125.115.90
tieba.baidu.com 123.125.65.93
mp3.baidu.com 123.125.114.76
img.baidu.com 123.125.114.171
video.baidu.com 123.125.114.32

编写文件b如下:

im.baidu.com
mp3.baidu.com
video.baidu.com

预期输出结果为:

im.baidu.com 123.125.115.69
mp3.baidu.com 123.125.114.76
video.baidu.com 123.125.114.32

设计awk命令如下:
awk 'ARGIND==1{s[$0]}ARGIND==2{if($1 in s) print $0}' b a

实际输出结果为空。
————————————————————————————————————
解决方法:
文件a和b是在windows下编写的,而windows下的换行为/r/n,linux下为/n。因此a文件的$0实则在末尾包含了“/r”。因此,重写awk代码如下:
awk 'ARGIND==1{s[$1]}ARGIND==2{if($1"/r" in s) print $0}' b a

得到预期的输入结果。
另外,要是windows和linux下的文件都有效,则可写代码如下:
awk 'ARGIND==1{s[$1]}ARGIND==2{if(($1"/r" in s)||($1 in s)) print $0}' b
a

————————————————————————————————————
参考资料:http://hi.baidu.com/fangm/blog/item/2e13fdfab2f739ddb48f31cb.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: