秒杀linux下系统调用fork()面试题
2013-08-30 11:06
477 查看
秒杀linux下系统调用fork()面试题
第一道题(在之前博客也写过这道题:http://blog.csdn.net/chdhust/article/details/8535915):
题目:请问下面的程序一共输出多少个“-”?
如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。
要讲清这个题,我们首先需要知道fork()系统调用的特性,
fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-”);语句有buffer,所以,对于上述程序,printf(“-”);把“-”放到了缓存中,并没有真正的输出,在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
或是
就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)
面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
第二道题:
给出如下C程序,在linux下使用gcc编译:
要求如下:
已知从这个程序执行到这个程序的所有进程结束这个时间段内,没有其它新进程执行。
1、请说出执行这个程序后,将一共运行几个进程。
2、如果其中一个进程的输出结果是“pid1:1001, pid2:1002”,写出其他进程的输出结果(不考虑进程执行顺序)。
这里先列出一些必要的预备知识,对linux下进程机制比较熟悉的朋友可以略过。
1、进程可以看做程序的一次执行过程。在linux下,每个进程有唯一的PID标识进程。PID是一个从1到32768的正整数,其中1一般是特殊进程init,其它进程从2开始依次编号。当用完32768后,从2重新开始。
2、linux中有一个叫进程表的结构用来存储当前正在运行的进程。可以使用“ps aux”命令查看所有正在运行的进程。
3、进程在linux中呈树状结构,init为根节点,其它进程均有父进程,某进程的父进程就是启动这个进程的进程,这个进程叫做父进程的子进程。
4、fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
有了上面的预备知识,我们再来看看解题的关键。我认为,解题的关键就是要认识到fork将程序切成两段。看下图:
上图表示一个含有fork的程序,而fork语句可以看成将程序切为A、B两个部分。然后整个程序会如下运行:
step1、设由shell直接执行程序,生成了进程P。P执行完Part. A的所有代码。
step2、当执行到pid = fork();时,P启动一个进程Q,Q是P的子进程,和P是同一个程序的进程。Q继承P的所有变量、环境变量、程序计数器的当前值。
step3、在P进程中,fork()将Q的PID返回给变量pid,并继续执行Part. B的代码。
step4、在进程Q中,将0赋给pid,并继续执行Part. B的代码。
这里有三个点非常关键:
1、P执行了所有程序,而Q只执行了Part. B,即fork()后面的程序。(这是因为Q继承了P的PC-程序计数器)
2、Q继承了fork()语句执行时当前的环境,而不是程序的初始环境。
3、P中fork()语句启动子进程Q,并将Q的PID返回,而Q中的fork()语句不启动新进程,仅将0返回。
解题
下面利用上文阐述的知识进行解题。这里我把两个问题放在一起进行分析。
1、从shell中执行此程序,启动了一个进程,我们设这个进程为P0,设其PID为XXX(解题过程不需知道其PID)。
2、当执行到pid1 = fork();时,P0启动一个子进程P1,由题目知P1的PID为1001。我们暂且不管P1。
3、P0中的fork返回1001给pid1,继续执行到pid2 = fork();,此时启动另一个新进程,设为P2,由题目知P2的PID为1002。同样暂且不管P2。
4、P0中的第二个fork返回1002给pid2,继续执行完后续程序,结束。所以,P0的结果为“pid1:1001, pid2:1002”。
5、再看P2,P2生成时,P0中pid1=1001,所以P2中pid1继承P0的1001,而作为子进程pid2=0。P2从第二个fork后开始执行,结束后输出“pid1:1001, pid2:0”。
6、接着看P1,P1中第一条fork返回0给pid1,然后接着执行后面的语句。而后面接着的语句是pid2 = fork();执行到这里,P1又产生了一个新进程,设为P3。先不管P3。
7、P1中第二条fork将P3的PID返回给pid2,由预备知识知P3的PID为1003,所以P1的pid2=1003。P1继续执行后续程序,结束,输出“pid1:0, pid2:1003”。
8、P3作为P1的子进程,继承P1中pid1=0,并且第二条fork将0返回给pid2,所以P3最后输出“pid1:0, pid2:0”。
9、至此,整个执行过程完毕。
所得答案:
1、一共执行了四个进程。(P0, P1, P2, P3)
2、另外几个进程的输出分别为:
pid1:1001, pid2:0
pid1:0, pid2:1003
pid1:0, pid2:0
进一步可以给出一个以P0为根的进程树:
代码验证结果:
第三道题:
请补足横线,使之输出welcome xiyoulinux
if(_____)
printf(“xiyoulinux ”);
else
printf(“welcome”);
这道题如果在if中只写fork(),也不知道打印出来什么顺序的,所以想到函数wait(),等待子进程结束。
程序改写为:
运行结果:
可见这样才得到了正确的运行结果。
第四道题:
int main(){ return fork()&&fork()||fork();}
这道题一看头都晕了,但是抓其根本,再难也都能解决的!!
图中同一色彩的框图代表同一进程,可见,此时共产生5个进程;结合表达式的最终值分布情况可得,返回1的概率为3/5 造成此种结果,最主要的诱因,是fork()后,父进程与子进程返回没有先后顺序,有时父进程先返回,有时子进程先返回。所以,根据父子进程返回的不同结果,逻辑运算符&&和||选择是否执行其后的程序代码(此处即为fork)。
第五道题(EMC的一道笔试题)
这道题和第四道题比较类似,第一个fork()和最后一个fork()一定会执行,中间的同上图,在这里不画了。
所以这道题解法为:加上前面的fork和最后的fork,所有的进程都会执行,会产生4个分支,总共4*5=20个分支,也就是20个进程,除去main主进程,就是19个进程了。
参考来源:
1. http://blog.csdn.net/chdhust/article/details/8535915
2. http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html
3. http://blog.csdn.net/u010940849/article/details/9624987
4. http://taingg.blog.163.com/blog/static/1197204832012101281321861/
5. http://bbs.chinaunix.net/thread-1947534-1-1.html
第一道题(在之前博客也写过这道题:http://blog.csdn.net/chdhust/article/details/8535915):
题目:请问下面的程序一共输出多少个“-”?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | #include <stdio.h> #include <sys/types.h> #include <unistd.h> int main( void ) { int i; for (i=0; i<2; i++) { fork(); printf ( "-" ); } return 0; } |
要讲清这个题,我们首先需要知道fork()系统调用的特性,
fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。
所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-”);语句有buffer,所以,对于上述程序,printf(“-”);把“-”放到了缓存中,并没有真正的输出,在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。
另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存。
对于上面的问题,我们如果修改一下上面的printf的那条语句为:
1 | printf ( "-\n" ); |
1 2 | printf ( "-" ); fflush (stdout); |
我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | #include <stdio.h> #include <sys/types.h> #include <unistd.h> int main( void ) { int i; for (i=0; i<2; i++){ fork(); //注意:下面的printf有“n” printf ( "ppid=%d, pid=%d, i=%d n" , getppid(), getpid(), i); } sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树 return 0; } |
1 2 3 4 5 6 7 8 9 10 | ppid=8858, pid=8518, i=0 ppid=8858, pid=8518, i=1 ppid=8518, pid=8519, i=0 ppid=8518, pid=8519, i=1 ppid=8518, pid=8520, i=1 ppid=8519, pid=8521, i=1 $ pstree -p | grep fork |- bash (8858)-+-fork(8518)-+-fork(8519)---fork(8521) | | `-fork(8520) |
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
第二道题:
给出如下C程序,在linux下使用gcc编译:
#include "stdio.h" #include "sys/types.h" #include "unistd.h" int main() { pid_t pid1; pid_t pid2; pid1 = fork(); pid2 = fork(); printf("pid1:%d, pid2:%d\n", pid1, pid2); }
要求如下:
已知从这个程序执行到这个程序的所有进程结束这个时间段内,没有其它新进程执行。
1、请说出执行这个程序后,将一共运行几个进程。
2、如果其中一个进程的输出结果是“pid1:1001, pid2:1002”,写出其他进程的输出结果(不考虑进程执行顺序)。
这里先列出一些必要的预备知识,对linux下进程机制比较熟悉的朋友可以略过。
1、进程可以看做程序的一次执行过程。在linux下,每个进程有唯一的PID标识进程。PID是一个从1到32768的正整数,其中1一般是特殊进程init,其它进程从2开始依次编号。当用完32768后,从2重新开始。
2、linux中有一个叫进程表的结构用来存储当前正在运行的进程。可以使用“ps aux”命令查看所有正在运行的进程。
3、进程在linux中呈树状结构,init为根节点,其它进程均有父进程,某进程的父进程就是启动这个进程的进程,这个进程叫做父进程的子进程。
4、fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
有了上面的预备知识,我们再来看看解题的关键。我认为,解题的关键就是要认识到fork将程序切成两段。看下图:
上图表示一个含有fork的程序,而fork语句可以看成将程序切为A、B两个部分。然后整个程序会如下运行:
step1、设由shell直接执行程序,生成了进程P。P执行完Part. A的所有代码。
step2、当执行到pid = fork();时,P启动一个进程Q,Q是P的子进程,和P是同一个程序的进程。Q继承P的所有变量、环境变量、程序计数器的当前值。
step3、在P进程中,fork()将Q的PID返回给变量pid,并继续执行Part. B的代码。
step4、在进程Q中,将0赋给pid,并继续执行Part. B的代码。
这里有三个点非常关键:
1、P执行了所有程序,而Q只执行了Part. B,即fork()后面的程序。(这是因为Q继承了P的PC-程序计数器)
2、Q继承了fork()语句执行时当前的环境,而不是程序的初始环境。
3、P中fork()语句启动子进程Q,并将Q的PID返回,而Q中的fork()语句不启动新进程,仅将0返回。
解题
下面利用上文阐述的知识进行解题。这里我把两个问题放在一起进行分析。
1、从shell中执行此程序,启动了一个进程,我们设这个进程为P0,设其PID为XXX(解题过程不需知道其PID)。
2、当执行到pid1 = fork();时,P0启动一个子进程P1,由题目知P1的PID为1001。我们暂且不管P1。
3、P0中的fork返回1001给pid1,继续执行到pid2 = fork();,此时启动另一个新进程,设为P2,由题目知P2的PID为1002。同样暂且不管P2。
4、P0中的第二个fork返回1002给pid2,继续执行完后续程序,结束。所以,P0的结果为“pid1:1001, pid2:1002”。
5、再看P2,P2生成时,P0中pid1=1001,所以P2中pid1继承P0的1001,而作为子进程pid2=0。P2从第二个fork后开始执行,结束后输出“pid1:1001, pid2:0”。
6、接着看P1,P1中第一条fork返回0给pid1,然后接着执行后面的语句。而后面接着的语句是pid2 = fork();执行到这里,P1又产生了一个新进程,设为P3。先不管P3。
7、P1中第二条fork将P3的PID返回给pid2,由预备知识知P3的PID为1003,所以P1的pid2=1003。P1继续执行后续程序,结束,输出“pid1:0, pid2:1003”。
8、P3作为P1的子进程,继承P1中pid1=0,并且第二条fork将0返回给pid2,所以P3最后输出“pid1:0, pid2:0”。
9、至此,整个执行过程完毕。
所得答案:
1、一共执行了四个进程。(P0, P1, P2, P3)
2、另外几个进程的输出分别为:
pid1:1001, pid2:0
pid1:0, pid2:1003
pid1:0, pid2:0
进一步可以给出一个以P0为根的进程树:
代码验证结果:
第三道题:
请补足横线,使之输出welcome xiyoulinux
if(_____)
printf(“xiyoulinux ”);
else
printf(“welcome”);
这道题如果在if中只写fork(),也不知道打印出来什么顺序的,所以想到函数wait(),等待子进程结束。
程序改写为:
运行结果:
可见这样才得到了正确的运行结果。
第四道题:
int main(){ return fork()&&fork()||fork();}
问题:1.一共产生几个进程 2.返回值为1的概率为多少?
这道题一看头都晕了,但是抓其根本,再难也都能解决的!!
其实对于fork的分析,最直观的做法也最有效,画出进程关系图,两个问题便迎刃而解
这里要用到的有关fork的知识并不多,只需要知道fork的返回值:fork是一次调用,两次返回;子进程的返回值为0,父进程的返回值是新产生子进程的进程号(大于0)。对于&&操作符,若前操作数为0,则直接跳过后操作数的判断。
基于以上两个基本理论,通过图示,即可得出结论:
图中同一色彩的框图代表同一进程,可见,此时共产生5个进程;结合表达式的最终值分布情况可得,返回1的概率为3/5 造成此种结果,最主要的诱因,是fork()后,父进程与子进程返回没有先后顺序,有时父进程先返回,有时子进程先返回。所以,根据父子进程返回的不同结果,逻辑运算符&&和||选择是否执行其后的程序代码(此处即为fork)。
第五道题(EMC的一道笔试题)
int main(int argc, char* argv[]) { fork(); fork() && fork() || fork(); fork(); } 不算main这个进程自身,到底创建了多少个进程啊?
这道题和第四道题比较类似,第一个fork()和最后一个fork()一定会执行,中间的同上图,在这里不画了。
所以这道题解法为:加上前面的fork和最后的fork,所有的进程都会执行,会产生4个分支,总共4*5=20个分支,也就是20个进程,除去main主进程,就是19个进程了。
参考来源:
1. http://blog.csdn.net/chdhust/article/details/8535915
2. http://www.cnblogs.com/leoo2sk/archive/2009/12/11/talk-about-fork-in-linux.html
3. http://blog.csdn.net/u010940849/article/details/9624987
4. http://taingg.blog.163.com/blog/static/1197204832012101281321861/
5. http://bbs.chinaunix.net/thread-1947534-1-1.html
相关文章推荐
- 秒杀linux下系统调用fork()面试题
- 秒杀linux下系统调用fork()面试题
- 一道关于Linux系统下fork系统调用的面试题
- 一道关于Linux系统下fork系统调用的面试题
- 关于linux系统调用fork()的一道面试题
- 一道关于Linux系统下fork系统调用的面试题
- linux下fork系统调用的实现
- linux系统调用fork, vfork, clone
- [转]linux系统调用fork, vfork, clone
- linux下系统调用之fork()和vfork()探索
- Linux系统调用fork()用法详解1
- Linux中fork系统调用
- Linux 系统调用之 fork()——进程的创建
- Linux操作系统基础理论(2)----fork系统调用
- linux 系统调用fork vfork clone
- linux 系统调用fork
- Linux系统调用fork()用法详解
- linux: fork系统调用实现剖析
- linux 系统调用fork()
- linux系统调用之-fork、wait、waitpid