您的位置:首页 > 运维架构 > Shell

Shell 命令实现词频统计

2016-03-22 09:46 417 查看

杨贵福老师的方法

cat tr sed sort head 命令的综合使用方式1

$ cat pg11.txt |tr -cs A-Za-z\' '\n' |sed "/'/d"| tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head

结果为:

1797 the
884 and
804 to
679 a
619 of
537 she
515 it
462 said
423 in
395 you

\2. cat tr sed sort head 命令的综合使用方式2 (PS:刚刚加了sed这一条,用于删除 ' 这个被匹配的单词)

$ cat pg11.txt |tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort|uniq -c |sort -k1,1nr -k2 | head

结果为:

1797 the
884 and
804 to
679 a
619 of
537 she
515 it
462 said
423 in
395 you
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: