文件不同编码对linux sort命令的影响
2017-08-24 16:04
253 查看
中文编码不同对 Linux 中的 sort 命令的影响
linux中sort命令是非常常用的命令,平时一般用英文或数字key来排序,今天遇到了中文汉字作为key,排序输出的结果和自己预期的结果不一样,折腾半天,发现是与文件的编码有关(通过Lang这个语系变量设置可以得到正常的排序),下面贴出代码供遇到同样问题的人参考。root@linux:~$ vim input
今天 今天
你好 你好
今天 今天
root@linux:~$ LANG=en_US.UTF-8; sort -t' ' -k1,2 input > output root@linux:~$ vim output
今天 今天
你好 你好
今天 今天
root@linux:~$ LANG=GBK; sort -t' ' -k1,2 input > output root@linux:~$ vim output
今天 今天
今天 今天
你好 你好
相关文章推荐
- 今天在Mac机器上使用了Flex Builder编辑了一个源代码文件,保存后使用vim命令去打开时发现系统自动在每一行的结尾添加了^M符号,其实^M在Linux/Unix中是非常常见的,也就是我们在Win中见过的/r回车符号。由于编辑软件的编码问题,某些IDE的编辑器在编辑完文件之后会自动加上这个^M符号。看起来对我们的源代码没有任何影响,其实并不然,当我们把源代码文件Check In到svn之类
- linux清空文件、wc命令、sort命令 总结
- 用linux命令分析文件-排序-统计(sort, uniq, awk)
- iconv内容,convmv文件名,unix2dos,dos2unix文件格式转换,od/cut/wc/dd/diff/uniq/nice/du等命令,linux文件名乱码,文件名,文件内容,vim编码设置
- 在不同的Linux主机间复制文件,scp命令的常见用法。
- 转载_linux od命令: 按不同进制显示文件
- linux下的comm和diff命令:用来比较两个文件的不同之处
- linux命令之----sort命令用于将文本文件内容加以排序
- Linux执行ls命令后不同文件类型显示的颜色一样
- Linux下,ln、cp、mv、rm命令对文件链接数和索引节点号的影响
- 【Linux命令】用 scp 命令在不同主机之间拷贝文件或目录
- Linux下用python对文件内容按列进行排序-功能等同于Linux下的sort命令对文件内容进行排序
- Linux下不同文件编码的转换
- linux 命令之文件管理命令排序、去重,统计,转换(sort,uniq ,wc ,tr)
- linux下的comm和diff命令:用来比较两个文件的不同之处
- iconv内容,convmv文件名,unix2dos,dos2unix文件格式转换,od/cut/wc/dd/diff/uniq/nice/du等命令,linux文件名乱码,文件名,文件内容,vim编码设置
- 一行Linux命令查找所有非UTF-8编码的文件,再一行命令,都转换成UTF-8
- 不同Linux之间的文件复制 SCP 命令
- 用linux命令分析文件-排序-统计(sort, uniq, awk)
- “Linux文件的合并、排序和分割” 之 sort 命令详解