Linux中awk---例子
2015-06-24 16:32
483 查看
awk -F€ '{if(NF!=25) print $0}' a_10000_20140801_VGOP1-R2.10-63227_00_001.dat
awk -F€ '{if(length($16)>20) print $0}' i_10000_20140917_VGOP1-R2.13-75305_01_001.dat
awk -F'|' '$2~"[a-zA-Z]" {print $0}' lx_use_detail_log_201409*.txt
找出文件中第二列中包含字母的数据行,以‘|’作为分隔符;
awk -F'|' '$5~"[0-9]" {print $0}' i_10000_20141001_VGOP1-R2.13-21417_00_003.dat
awk -F€ '{ if (NF==17) printf("%s€%s\n\r", $1,$2 ) }' a_10000_20140814_VGOP1-R2.10-63217_00_020.dat>lihong.dat
awk -F€ '{ if (NF==17) printf("%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s\n\r", $1,$2,$3,$4,$5,$6,$8,$9,$10,$12,$14,$15,$16,$17 ) }' a_10000_20140814_VGOP1-R2.10-63217_00_020.dat>a_10000_20140814_VGOP1-R2.10-63217_00_020.dat.tmp
输出结果:
38000001€117.136.31.34
38000002€221.6.152.179
计算文件记录行数:
1:awk 'END{printf "%d\n", NR}' 数据文件名
2:cat 数据文件名 | sed -n '$='
3:wc -l 数据文件名
4:ls -l 文件名 | awk ‘{print $5}’、
awk 'BEGIN {ORS="\r\n"} {print $0 }' dong.txt
awk '{FS="\001"} {print $1"€"$2}' appGame.txt
除了awk的内置变量,awk还可以自定义变量。
下面统计/etc/passwd的账户人数
awk '{count++;print $0;} END{print "user count is ", count}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
......
user count is 40
count是自定义变量。之前的action{}里都是只有一个print,其实print只是一个语句,而action{}可以有多个语句,以;号隔开。
这里没有初始化count,虽然默认是0,但是妥当的做法还是初始化为0:
awk 'BEGIN {count=0;print "[start]user count is ", count} {count=count+1;print $0;} END{print "[end]user count is ", count}' /etc/passwd
[start]user count is 0 root:x:0:0:root:/root:/bin/bash
...
[end]user count is 40
统计某个文件夹下的文件占用的字节数
ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size}'
[end]size is 8657198
如果以M为单位显示:
ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024,"M"}' [end]size is 8.25889 M
注意,统计不包括文件夹的子目录。
条件语句
awk中的条件语句是从C语言中借鉴来的,见如下声明方式:
if (expression) {
statement;
statement;
... ...
} if (expression) {
statement;
} else {
statement2;
} if (expression) {
statement1;
} else if (expression1) {
statement2;
} else {
statement3;
}
统计某个文件夹下的文件占用的字节数,过滤4096大小的文件(一般都是文件夹):
ls -l |awk 'BEGIN {size=0;print "[start]size is ", size} {if($5!=4096){size=size+$5;}} END{print "[end]size is ", size/1024/1024,"M"}'
[end]size is 8.22339 M
循环语句
awk中的循环语句同样借鉴于C语言,支持while、do/while、for、break、continue,这些关键字的语义和C语言中的语义完全相同。
数组
因为awk中数组的下标可以是数字和字母,数组的下标通常被称为关键字(key)。值和关键字都存储在内部的一张针对key/value应用hash的表格里。
由于hash不是顺序存储,因此在显示数组内容时会发现,它们并不是按照你预料的顺序显示出来的。数组和变量一样,都是在使用时自动创建的,
awk 也同样会自动判断其存储的是数字还是字符串。一般而言,awk中的数组用来从记录中收集信息,可以用于计算总和、统计单词以及跟踪模板
被匹配的次数等等。
显示/etc/passwd的账户
awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}'/etc/passwd
0 root 1 daemon 2 bin 3 sys 4 sync 5 games
......
这里使用for循环遍历数组
awk -F€ '{if(length($16)>20) print $0}' i_10000_20140917_VGOP1-R2.13-75305_01_001.dat
awk -F'|' '$2~"[a-zA-Z]" {print $0}' lx_use_detail_log_201409*.txt
找出文件中第二列中包含字母的数据行,以‘|’作为分隔符;
awk -F'|' '$5~"[0-9]" {print $0}' i_10000_20141001_VGOP1-R2.13-21417_00_003.dat
awk -F€ '{ if (NF==17) printf("%s€%s\n\r", $1,$2 ) }' a_10000_20140814_VGOP1-R2.10-63217_00_020.dat>lihong.dat
awk -F€ '{ if (NF==17) printf("%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s€%s\n\r", $1,$2,$3,$4,$5,$6,$8,$9,$10,$12,$14,$15,$16,$17 ) }' a_10000_20140814_VGOP1-R2.10-63217_00_020.dat>a_10000_20140814_VGOP1-R2.10-63217_00_020.dat.tmp
输出结果:
38000001€117.136.31.34
38000002€221.6.152.179
计算文件记录行数:
1:awk 'END{printf "%d\n", NR}' 数据文件名
2:cat 数据文件名 | sed -n '$='
3:wc -l 数据文件名
4:ls -l 文件名 | awk ‘{print $5}’、
awk 'BEGIN {ORS="\r\n"} {print $0 }' dong.txt
awk '{FS="\001"} {print $1"€"$2}' appGame.txt
除了awk的内置变量,awk还可以自定义变量。
下面统计/etc/passwd的账户人数
awk '{count++;print $0;} END{print "user count is ", count}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
......
user count is 40
count是自定义变量。之前的action{}里都是只有一个print,其实print只是一个语句,而action{}可以有多个语句,以;号隔开。
这里没有初始化count,虽然默认是0,但是妥当的做法还是初始化为0:
awk 'BEGIN {count=0;print "[start]user count is ", count} {count=count+1;print $0;} END{print "[end]user count is ", count}' /etc/passwd
[start]user count is 0 root:x:0:0:root:/root:/bin/bash
...
[end]user count is 40
统计某个文件夹下的文件占用的字节数
ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size}'
[end]size is 8657198
如果以M为单位显示:
ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024,"M"}' [end]size is 8.25889 M
注意,统计不包括文件夹的子目录。
条件语句
awk中的条件语句是从C语言中借鉴来的,见如下声明方式:
if (expression) {
statement;
statement;
... ...
} if (expression) {
statement;
} else {
statement2;
} if (expression) {
statement1;
} else if (expression1) {
statement2;
} else {
statement3;
}
统计某个文件夹下的文件占用的字节数,过滤4096大小的文件(一般都是文件夹):
ls -l |awk 'BEGIN {size=0;print "[start]size is ", size} {if($5!=4096){size=size+$5;}} END{print "[end]size is ", size/1024/1024,"M"}'
[end]size is 8.22339 M
循环语句
awk中的循环语句同样借鉴于C语言,支持while、do/while、for、break、continue,这些关键字的语义和C语言中的语义完全相同。
数组
因为awk中数组的下标可以是数字和字母,数组的下标通常被称为关键字(key)。值和关键字都存储在内部的一张针对key/value应用hash的表格里。
由于hash不是顺序存储,因此在显示数组内容时会发现,它们并不是按照你预料的顺序显示出来的。数组和变量一样,都是在使用时自动创建的,
awk 也同样会自动判断其存储的是数字还是字符串。一般而言,awk中的数组用来从记录中收集信息,可以用于计算总和、统计单词以及跟踪模板
被匹配的次数等等。
显示/etc/passwd的账户
awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}'/etc/passwd
0 root 1 daemon 2 bin 3 sys 4 sync 5 games
......
这里使用for循环遍历数组
相关文章推荐
- Linux 误删文件
- Linux 查看进程以及子进程/线程
- 【读书笔记】Linux高性能服务器编程(第一篇 第四章)
- linux问题
- linux几种快速清空文件内容的方法
- Linux下查看系统支持最大内存及硬件信息
- linuxvi命令的使用
- Linux下SD卡启动制作
- 嵌入式linux 实现mdev SD卡和U盘自动挂载和卸载的方法 mdev.conf
- 如何处理qq for linux Dear user.your version of the software will be obsole
- Linux makefile 教程
- 如何重置CentOS 7的Root密码?设置CentOS 7的Root密码的方法与步骤
- linux内核驱动中_IO, _IOR, _IOW, _IOWR 宏的用法与解析
- Linux下VNC配置多个桌面和修改密码 不会当系统重启vnc失效
- linux应用程序问题
- Linux环境下ARM交叉编译找不到libz.so.1的动态库
- 【转】ARM Linux 3.x的设备树(Device Tree)
- Linux平台代码覆盖率测试工具GCOV的前端工具LCOV简介
- Linux平台代码覆盖率测试工具GCOV相关文件分析
- 在Linux2.6内核(CentOS)中编译内核模块的一个例子