文本处理命令—sort、uniq、wc、expand、unexpand、iconv、dos2unix、unix2dos
2013-10-26 19:10
429 查看
sort命令
功能说明:以行为单位对文件进行排序。
命令格式:sort [参数] [<文件> …]
常用参数:
-b:忽略前导的空格。
-d:只考虑空格、字母和数字。
-f:忽略字母的大小写。
-i:只考虑可打印字符。
-M:排序月份,(未知词) < “JAN” < … < “DEC”。
-n:根据字符串的数值进行排序。
-r:逆向排序。
-u:对相同的行只输出一行。
+n:n为数字,对指定的列进行排序,+0表示第1列,以空格或制表符作为列的间隔符。
使用示例:
$ sort file
$ sort -bd file
$ sort -bn file
$ sort -r file
$ sort -u file
$ sort +5 file
$ sort +5 -rb file
$ sort file1 file2
$ sort -br file1 file2
警告:1. 本地环境变量会影响排序结果。
2. 如果希望以字节的自然值获得最传统的排序结果,请设定LC_ALL=C。
uniq命令
功能说明:删除文本文件中相邻的重复的行并写到标准输出。
命令格式:uniq [参数] [<输入文件> [<输出文件>]]
常用参数:
-c:在每行前加上表示相应行目出现次数的前缀编号。
-d:只显示重复的行。
-i:忽略大小写差异。
-u:只显示出现一次的行。
-s<N>:<N>为数字,对各行前<N>个字符不作比较。
-w<N>:<N>为数字,对各行第<N>个字符以后的内容不作比较。
使用示例:
$ uniq file
$ uniq -i file
$ uniq -cd file
$ uniq -u file
www.au369.com
wc命令
功能说明:统计指定文本文件的行数、字数、字符数。
命令格式:wc [参数] [<文件>…]
常用参数:
-c:统计输出字节数。
-l:统计输出行数。
-L:统计输出最长一行的长度。
-w:统计输出单词数。
使用示例:
$wc file
$wc -l file
$wc -w file
$wc -c file
$wc -L file
http://www.au369.com
expand命令
功能说明:将文件中的制表符转换为空格,写到标准输出。
命令格式:expand [参数] [<文件> …]
常用参数:
-i:不转换非空格后的制表符。
-t<N>:设定每个制表符为指定<N>的宽度,而不是默认的80
使用示例:
$ expand file
$ expand -t4 file
unexpand命令
功能说明:将文件中的空格转换为制表符,写到标准输出。
命令格式:unexpand [参数] [<文件> …]
常用参数:
-a:转换所有空格字符而不仅仅是字母首部的空格。
--first-only:只转换首部的空格字符序列(覆盖-a选项)。
-t<N>:设定每个制表符为指定<N>的宽度,而不是默认的8(激活-a选项)。
使用示例:
$ unexpand file
$ unexpand -t4 file
iconv命令
功能说明:将文件从一种编码转换成另一种编码。
命令格式:iconv [参数] <输入文件>
常用参数:
-f <encoding>:指定原始文本编码。
-t <encoding>:指定要转换的编码。
-l:列出所有己知编码字符集。
-c:忽略输出中的无效字符。
-o<output file>:指定输出文件,而不是在标准输出上显示。
使用示例:
$ iconv -l
$ iconv -f ISO-8859-1 -t UTF-8 -o outputfile inputfile
$ iconv -f GB2312 -t UTF-8 -o outputfile inputfile
$ iconv -f GBK -t UTF-8 -o outputfile inputfile
$ iconv -f BIG5 -t UTF-8 -o outputfile inputfile
$ iconv -f UTF-8 -t GB2312 -o outputfile inputfile
dos2unix命令
功能说明:将DOS格式的文本文件转换成UNIX格式的文本文件。
命令格式:dos2unix [参数] <文件> [<输出文件>]
常用参数:
-k:不改变文件的时间戳。
-n:新文件模式,即不改变原文件将转换结果保存到指定的输出文件。
使用示例:
$ dos2unix dosfile
$ dos2unix -n dosfile linuxfile
$ dos2unix -k *
$ dos2unix -k -n dosfile linuxfile
提示:系统还提供了一个unix2dos命令,用于将UNIX格式的文本文件转换成格式的文本文件。使用方法与dos2unix命令一样。
功能说明:以行为单位对文件进行排序。
命令格式:sort [参数] [<文件> …]
常用参数:
-b:忽略前导的空格。
-d:只考虑空格、字母和数字。
-f:忽略字母的大小写。
-i:只考虑可打印字符。
-M:排序月份,(未知词) < “JAN” < … < “DEC”。
-n:根据字符串的数值进行排序。
-r:逆向排序。
-u:对相同的行只输出一行。
+n:n为数字,对指定的列进行排序,+0表示第1列,以空格或制表符作为列的间隔符。
使用示例:
$ sort file
$ sort -bd file
$ sort -bn file
$ sort -r file
$ sort -u file
$ sort +5 file
$ sort +5 -rb file
$ sort file1 file2
$ sort -br file1 file2
警告:1. 本地环境变量会影响排序结果。
2. 如果希望以字节的自然值获得最传统的排序结果,请设定LC_ALL=C。
uniq命令
功能说明:删除文本文件中相邻的重复的行并写到标准输出。
命令格式:uniq [参数] [<输入文件> [<输出文件>]]
常用参数:
-c:在每行前加上表示相应行目出现次数的前缀编号。
-d:只显示重复的行。
-i:忽略大小写差异。
-u:只显示出现一次的行。
-s<N>:<N>为数字,对各行前<N>个字符不作比较。
-w<N>:<N>为数字,对各行第<N>个字符以后的内容不作比较。
使用示例:
$ uniq file
$ uniq -i file
$ uniq -cd file
$ uniq -u file
www.au369.com
wc命令
功能说明:统计指定文本文件的行数、字数、字符数。
命令格式:wc [参数] [<文件>…]
常用参数:
-c:统计输出字节数。
-l:统计输出行数。
-L:统计输出最长一行的长度。
-w:统计输出单词数。
使用示例:
$wc file
$wc -l file
$wc -w file
$wc -c file
$wc -L file
http://www.au369.com
expand命令
功能说明:将文件中的制表符转换为空格,写到标准输出。
命令格式:expand [参数] [<文件> …]
常用参数:
-i:不转换非空格后的制表符。
-t<N>:设定每个制表符为指定<N>的宽度,而不是默认的80
使用示例:
$ expand file
$ expand -t4 file
unexpand命令
功能说明:将文件中的空格转换为制表符,写到标准输出。
命令格式:unexpand [参数] [<文件> …]
常用参数:
-a:转换所有空格字符而不仅仅是字母首部的空格。
--first-only:只转换首部的空格字符序列(覆盖-a选项)。
-t<N>:设定每个制表符为指定<N>的宽度,而不是默认的8(激活-a选项)。
使用示例:
$ unexpand file
$ unexpand -t4 file
iconv命令
功能说明:将文件从一种编码转换成另一种编码。
命令格式:iconv [参数] <输入文件>
常用参数:
-f <encoding>:指定原始文本编码。
-t <encoding>:指定要转换的编码。
-l:列出所有己知编码字符集。
-c:忽略输出中的无效字符。
-o<output file>:指定输出文件,而不是在标准输出上显示。
使用示例:
$ iconv -l
$ iconv -f ISO-8859-1 -t UTF-8 -o outputfile inputfile
$ iconv -f GB2312 -t UTF-8 -o outputfile inputfile
$ iconv -f GBK -t UTF-8 -o outputfile inputfile
$ iconv -f BIG5 -t UTF-8 -o outputfile inputfile
$ iconv -f UTF-8 -t GB2312 -o outputfile inputfile
dos2unix命令
功能说明:将DOS格式的文本文件转换成UNIX格式的文本文件。
命令格式:dos2unix [参数] <文件> [<输出文件>]
常用参数:
-k:不改变文件的时间戳。
-n:新文件模式,即不改变原文件将转换结果保存到指定的输出文件。
使用示例:
$ dos2unix dosfile
$ dos2unix -n dosfile linuxfile
$ dos2unix -k *
$ dos2unix -k -n dosfile linuxfile
提示:系统还提供了一个unix2dos命令,用于将UNIX格式的文本文件转换成格式的文本文件。使用方法与dos2unix命令一样。
相关文章推荐
- 文本处理命令—sort、uniq、wc、expand、unexpand、iconv、dos2unix、unix2dos
- Linux基础之文本处理命令(wc,cut,sort,uniq,diff,patch)
- 文本处理命令:cut,sort,wc,uniq
- 几个常用的文本处理shell 命令:find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk
- 文本处理命令 cat more less cut wc sort uniq
- linux常用命令-文本处理cut,sort,uniq,wc,tr
- 5_Shell语言―――文本处理命令之wc、tr、cut、join、sort和uniq
- iconv内容,convmv文件名,unix2dos,dos2unix文件格式转换,od/cut/wc/dd/diff/uniq/nice/du等命令,linux文件名乱码,文件名,文件内容,vim编码设置
- iconv内容,convmv文件名,unix2dos,dos2unix文件格式转换,od/cut/wc/dd/diff/uniq/nice/du等命令,linux文件名乱码,文件名,文件内容,vim编码设置
- 文本处理命令sort和uniq,文件比较和应用更改命令diff、patch
- 文本文件命令(wc,cut,sort,uniq)及常用参数
- Shell 常用字符处理命令cut/sort/wc/uniq/tee/tr/split
- 字符及文本处理之一:wc,cut,sort,uniq,tr,paste,split
- 文本文件操作命令cut wc sort uniq tr
- Linux下Bash的管线pipe命令,cut,grep,sort,wc,uniq,tee,tr,col,join,past,expand
- shell编程之高级文本处理命令:cut-sort-wc详解
- Linux管线命令 - cut,grep,sort,uniq,wc,tee,tr,col,join,paste,expand,split,xargs
- Linux管线命令 - cut,grep,sort,uniq,wc,tee,tr,col,join,paste,expand,split,xargs
- 文本处理wc,cut,sort,uniq,diff,patch
- Linux下Bash的管线pipe命令,cut,grep,sort,wc,uniq,tee,tr,col,join,past,expand