您的位置:首页 > 其它

UNIX高手的10个习惯之二

2009-06-09 10:55 316 查看
[align=left]Michael Stutz (stutz@dsl.org), 作家, 顾问[/align]
[align=left](本文出自IBM developerWorks 中国)[/align]

[align=left]###############上接UNIX高手的10个习惯之一#################[/align]

[align=left]第六弹 在列表中对命令分组[/b][/b][/align]
[align=left]大多数 Shell 都具有在列表中对命令分组的方法,以便您能将它们的合计输出向下传递到某个管道,或者将其任何部分或全部流重定向到相同的地方。您一般可以通过在某个 Subshell 中运行一个命令列表或通过在当前 Shell 中运行一个命令列表来实现此目的。[/align]
[align=left]在 Subshell 中运行命令列表[/align]
[align=left]使用括号将命令列表包括在单个组中。这样做将在一个新的 Subshell 中运行命令,并允许您重定向或收集整组命令的输出,如以下示例所示:[/align]
[align=left]清单 11. 好习惯 6 的示例:在 Subshell 中运行命令列表[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \[/b][/align]
[align=left]> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \[/b][/align]
[align=left]> | mailx admin -S "Archive contents"[/b][/align]
[align=left] [/align]
[align=left]在此示例中,该存档的内容将提取到 tmp/a/b/c/ 目录中,同时将分组命令的输出(包括所提取文件的列表)通过邮件发送到地址 admin。[/align]
[align=left]当您在命令列表中重新定义环境变量,并且您不希望将那些定义应用于当前 Shell 时,使用 Subshell 更可取。[/align]
[align=left]在当前 Shell 中运行命令列表[/align]
[align=left]将命令列表用大括号 ({}) 括起来,以在当前 Shell 中运行。确保在括号与实际命令之间包括空格,否则 Shell 可能无法正确解释括号。此外,还要确保列表中的最后一个命令以分号结尾,如以下示例所示:[/align]
[align=left]清单 12. 好习惯 6 的另一个示例:在当前 Shell 中运行命令列表[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ { cp ${VAR}a . && chown -R guest.guest a && \[/b][/align]
[align=left]> tar cvf newarchive.tar a; } | mailx admin -S "New archive"[/b][/align]
[align=left] [/align]
[align=left]第七弹 在 find 之外使用 xargs[/b][/b][/align]
[align=left]使用 xargs 工具作为筛选器,以充分利用从 find 命令挑选的输出。find 运行通常提供与某些条件匹配的文件列表。此列表被传递到 xargs 上,后者然后使用该文件列表作为参数来运行其他某些有用的命令,如以下示例所示:[/align]
[align=left]清单 13. xargs 工具的经典用法示例[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ find some-file-criteria some-file-path | \[/b][/align]
[align=left]> xargs some-great-command-that-needs-filename-arguments[/b][/align]
[align=left] [/align]
[align=left]然而,不要将 xargs 仅看作是 find 的辅助工具;它是一个未得到充分利用的工具之一,当您养成使用它的习惯时,将会希望进行所有试验,包括以下用法。[/align]
[align=left]传递空格分隔的列表[/align]
[align=left]在最简单的调用形式中,xargs 就像一个筛选器,它接受一个列表(每个成员分别在单独的行上)作为输入。该工具将那些成员放置在单个空格分隔的行上:[/align]
[align=left]清单 14. xargs 工具产生的输出示例[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ xargs[/b][/align]
[align=left] a[/b][/align]
[align=left] b[/b][/align]
[align=left] c[/b][/align]
[align=left] [/b][/align]
[align=left] Control-D[/b][/align]
[align=left] [/align]
[align=left]a b c[/align]
[align=left]~ $[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]您可以发送通过 xargs 来输出文件名的任何工具的输出,以便为其他某些接受文件名作为参数的工具获得参数列表,如以下示例所示:[/align]
[align=left]清单 15. xargs 工具的使用示例[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~/tmp $ ls -1 | xargs[/b][/align]
[align=left]December_Report.pdf README a archive.tar mkdirhier.sh[/align]
[align=left]~/tmp $ ls -1 | xargs file[/b][/align]
[align=left]December_Report.pdf: PDF document, version 1.3[/align]
[align=left]README: ASCII text[/align]
[align=left]a: directory[/align]
[align=left]archive.tar: POSIX tar archive[/align]
[align=left]mkdirhier.sh: Bourne shell script text executable[/align]
[align=left]~/tmp $[/align]
[align=left] [/align]
[align=left]xargs 命令不只用于传递文件名。您还可以在需要将文本筛选到单个行中的任何时候使用它:[/align]
[align=left]清单 16. 好习惯 7 的示例:使用 xargs 工具来将文本筛选到单个行中[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~/tmp $ ls -l | xargs[/b][/align]
[align=left]-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \[/align]
[align=left]root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \[/align]
[align=left]16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \[/align]
[align=left]joe joe 3239 Sep 30 12:40 mkdirhier.sh[/align]
[align=left]~/tmp $[/align]
[align=left] [/align]
[align=left]谨慎使用 xargs [/align]
[align=left]从技术上讲,使用 xargs 很少遇到麻烦。缺省情况下,文件结束字符串是下划线 (_);如果将该字符作为单个输入参数来发送,则它之后的所有内容将被忽略。为了防止这种情况发生,可以使用 -e 标志,它在不带参数的情况下完全禁用结束字符串。[/align]
[align=left]第八弹 了解何时 grep 应该执行计数——何时应该绕过[/b][/b][/align]
[align=left]避免通过管道将 grep 发送到 wc -l 来对输出行数计数。grep 的 -c 选项提供了对与特定模式匹配的行的计数,并且一般要比通过管道发送到 wc 更快,如以下示例所示:[/align]
[align=left]清单 17. 好习惯 8 的示例:使用和不使用 grep 的行计数[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ time grep and tmp/a/longfile.txt | wc -l[/b][/align]
[align=left]2811[/align]
[align=left] [/align]
[align=left]real 0m0.097s[/align]
[align=left]user 0m0.006s[/align]
[align=left]sys 0m0.032s[/align]
[align=left]~ $ time grep -c and tmp/a/longfile.txt[/b][/align]
[align=left]2811[/align]
[align=left] [/align]
[align=left]real 0m0.013s[/align]
[align=left]user 0m0.006s[/align]
[align=left]sys 0m0.005s[/align]
[align=left]~ $ [/align]
[align=left] [/align]
[align=left] [/align]
[align=left]除了速度因素外,-c 选项还是执行计数的好方法。对于多个文件,带 -c 选项的 grep 返回每个文件的单独计数,每行一个计数,而针对 wc 的管道则提供所有文件的组合总计数。[/align]
[align=left]然而,不管是否考虑速度,此示例都表明了另一个要避免地常见错误。这些计数方法仅提供包含匹配模式的行数——如果那就是您要查找的结果,这没什么问题。但是在行中具有某个特定模式的多个实例的情况下,这些方法无法为您提供实际匹配实例数量 的真实计数。归根结底,若要对实例计数,您还是要使用 wc 来计数。首先,使用 -o 选项(如果您的版本支持它的话)来运行 grep 命令。此选项 输出匹配的模式,每行一个模式,而不输出行本身。但是您不能将它与 -c 选项结合使用,因此要使用 wc -l 来对行计数,如以下示例所示:[/align]
[align=left]清单 18. 好习惯 8 的示例:使用 grep 对模式实例计数[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ grep -o and tmp/a/longfile.txt | wc -l[/b][/align]
[align=left]3402[/align]
[align=left]~ $[/align]
[align=left] [/align]
[align=left]在此例中,调用 wc 要比第二次调用 grep 并插入一个虚拟模式(例如 grep -c)来对行进行匹配和计数稍快一点。[/align]
[align=left]第九弹 匹配输出中的某些字段,而不只是对行进行匹配[/b][/b][/align]
[align=left]当您只希望匹配输出行中特定字段 中的模式时,诸如 awk 等工具要优于 grep。[/align]
[align=left]下面经过简化的示例演示了如何仅列出 12 月修改过的文件。[/align]
[align=left]清单 19. 坏习惯 9 的示例:使用 grep 来查找特定字段中的模式[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~/tmp $ ls -l /tmp/a/b/c | grep Dec[/b][/align]
[align=left]-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf[/align]
[align=left]-rw-r--r-- 1 root root 238 Dec 03 08:19 README[/align]
[align=left]-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar[/align]
[align=left]~/tmp $[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]在此示例中,grep 对行进行筛选,并输出其修改日期和名称中带 Dec 的所有文件。因此,诸如 December_Report.pdf 等文件是匹配的,即使它自从一月份以来还未修改过。这可能不是您希望的结果。为了匹配特定字段中的模式,最好使用 awk,其中的一个关系运算符对确切的字段进行匹配,如以下示例所示:[/align]
[align=left]
清单 20. 好习惯 9 的示例:使用 awk 来查找特定字段中的模式[/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~/tmp $ ls -l | awk '$6 == "Dec"'[/b][/align]
[align=left]-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar[/align]
[align=left]-rw-r--r-- 1 root root 238 Dec 03 08:19 README[/align]
[align=left]~/tmp $[/align]
[align=left] [/align]
[align=left]第十弹 停止对 cat 使用管道[/b][/b][/align]
[align=left]grep 的一个常见的基本用法错误是通过管道将 cat 的输出发送到 grep 以搜索单个文件的内容。这绝对是不必要的,纯粹是浪费时间,因为诸如 grep 这样的工具接受文件名作为参数。您根本不需要在这种情况下使用 cat,如以下示例所示:[/align]
[align=left]清单 21. 好习惯和坏习惯 10 的示例:使用带和不带 cat 的 grep[/align]
[align=left] [/align]
[align=left] [/align]
[align=left] [/align]
[align=left]~ $ time cat tmp/a/longfile.txt | grep and[/b][/align]
[align=left]2811[/align]
[align=left] [/align]
[align=left]real 0m0.015s[/align]
[align=left]user 0m0.003s[/align]
[align=left]sys 0m0.013s[/align]
[align=left]~ $ time grep and tmp/a/longfile.txt[/b][/align]
[align=left]2811[/align]
[align=left] [/align]
[align=left]real 0m0.010s[/align]
[align=left]user 0m0.006s[/align]
[align=left]sys 0m0.004s[/align]
[align=left]~ $ [/align]
[align=left] [/align]
[align=left] [/align]
[align=left]此错误存在于许多工具中。由于大多数工具都接受使用连字符 (-) 的标准输入作为一个参数,因此即使使用 cat 来分散 stdin 中的多个文件,参数也通常是无效的。仅当您使用带多个筛选选项之一的 cat 时,才真正有必要在管道前首先执行连接。[/align]
[align=left]结束语:养成好习惯[/align]
[align=left]最好检查一下您的命令行习惯中的任何不良的使用模式。不良的使用模式会降低您的速度,并且通常会导致意外错误。本文介绍了 10 个新习惯,它们可以帮助您摆脱许多最常见的使用错误。养成这些好习惯是加强您的 UNIX 命令行技能的积极步骤。[/align]
[align=left] [/align]

[align=left]#############################完###########################[/align]

本文出自ITMOV[/b]旗舰【[/b]Simon Xiao[/b]技术博客】[/b]&[/b]谢绝转载[/b]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: