Linux第六次实验——谢飞帆
2016-04-03 19:38
411 查看
原创作品转载请注明出处+《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
在Linux中,task_struct其实就是通常所说的PCB。该结构定义位于:
task_struct比较庞大,大致可以分为几个部分:
进程状态(State)
进程调度信息(Scheduling Information)
各种标识符(Identifiers)
进程通信有关信息(IPC:Inter_Process Communication)
时间和定时器信息(Times and Timers)
进程链接信息(Links)
文件系统信息(File System)
虚拟内存信息(Virtual Memory)
页面管理信息(page)
对称多处理器(SMP)信息
和处理器相关的环境(上下文)信息(Processor Specific Context)
其它信息
其中比较重要的几个参数:
见如下语句:
do_fork 函数
而do_fork函数真正实现复制是
copy_process函数
copy_process()主要完成进程数据结构,各种资源的初始化。
(省略的IF语句)检查clone_flags参数,防止无效的组合进入
判断权限及允许范围的代码
对子进程的描述符初始化和复制父进程的资源给子进程
dup_task_struct()
![](//upload-images.jianshu.io/upload_images/307862-c17f68d310054768.png)
fork1.png
运行后首先停在sys_clone处:
![](//upload-images.jianshu.io/upload_images/307862-c9f902f4909124a7.png)
然后是do_fork,之后是copy_process:
![](//upload-images.jianshu.io/upload_images/307862-0424ed9c57fc8cb9.png)
fork3.png
进入copy_thread:
![](//upload-images.jianshu.io/upload_images/307862-5ad48cb5f1845bed.png)
fork4.png
在copy_thread中,我们可以查看p的值
![](//upload-images.jianshu.io/upload_images/307862-f03e0e5fe544585f.png)
fork5.png
但是回到copy_process后再查看,将得到一个
![](//upload-images.jianshu.io/upload_images/307862-a538d4be6506f473.png)
fork6.png
ret_from_fork按照之前的分析被调用,跟踪到
![](//upload-images.jianshu.io/upload_images/307862-39d5a8277154df1f.png)
fork7.png
*childregs的类型为pt_regs,里面存放了SAVE ALL中压入栈的参数
故在之后的RESTORE ALL中能顺利执行下去.
Linux为每个新创建的进程动态地分配一个
为了把内核中的所有进程组织起来,Linux提供了几种组织方式,其中哈希表和双向循环链表方式是针对系统中的所有进程(包括内核线程),而运行队列和等待队列是把处于同一状态的进程组织起来
fork()函数被调用一次,但返回两次
文/uglyyouth(简书作者)
原文链接:http://www.jianshu.com/p/d843695f3ee8
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
在Linux中,task_struct其实就是通常所说的PCB。该结构定义位于:
/include/linux/sched.h
task_struct比较庞大,大致可以分为几个部分:
进程状态(State)
进程调度信息(Scheduling Information)
各种标识符(Identifiers)
进程通信有关信息(IPC:Inter_Process Communication)
时间和定时器信息(Times and Timers)
进程链接信息(Links)
文件系统信息(File System)
虚拟内存信息(Virtual Memory)
页面管理信息(page)
对称多处理器(SMP)信息
和处理器相关的环境(上下文)信息(Processor Specific Context)
其它信息
其中比较重要的几个参数:
volatile long state;进程状态,可见
/include/linux/sched.h文件中的宏,TASK_RUNNING等
unsigned int rt_priority;实时优先级
unsigned int policy;调度策略
pid_t pid;进程标识符
struct task_struct __rcu *real_parent;real parent
struct list_head children;list of my children
struct files_struct *files;系统打开文件
分析内核处理过程sys_clone
fork、vfork和clone三个系统调用实际上都是通过do_fork来实现进程的创建.
见如下语句:
return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);
do_fork 函数
而do_fork函数真正实现复制是
copy_process
long do_fork(unsigned long clone_flags, unsigned long stack_start, unsigned long stack_size, int __user *parent_tidptr, int __user *child_tidptr) { ... p = copy_process(clone_flags, stack_start, stack_size, child_tidptr, NULL, trace); ... }
copy_process函数
copy_process()主要完成进程数据结构,各种资源的初始化。
p = dup_task_struct(current);
(省略的IF语句)检查clone_flags参数,防止无效的组合进入
p = dup_task_struct(current);调用dup_task_struct()为新进程创建一个内核栈
判断权限及允许范围的代码
对子进程的描述符初始化和复制父进程的资源给子进程
retval = sched_fork(clone_flags, p);完成调度相关的设置,将这个task分配给CPU
if (retval)语句群,复制共享进程的的各个部分
retval = copy_thread(clone_flags, stack_start, stack_size, p);复制父进程堆栈的内容到子进程的堆栈中去.这其中,copy_thread()函数中的语句
p->thread.ip = (unsigned long) ret_from_fork;决定了新进程的第一条指令地址.
dup_task_struct()
static struct task_struct *dup_task_struct(struct task_struct *orig) { struct task_struct *tsk; struct thread_info *ti; int node = tsk_fork_get_node(orig); int err; tsk = alloc_task_struct_node(node); if (!tsk) return NULL; ti = alloc_thread_info_node(tsk, node); if (!ti) goto free_tsk; err = arch_dup_task_struct(tsk, orig); if (err) goto free_ti; tsk->stack = ti; # ifdef CONFIG_SECCOMP tsk->seccomp.filter = NULL; # endif setup_thread_stack(tsk, orig); clear_user_return_notifier(tsk); clear_tsk_need_resched(tsk); set_task_stack_end_magic(tsk); # ifdef CONFIG_CC_STACKPROTECTOR tsk->stack_canary = get_random_int(); # endif atomic_set(&tsk->usage, 2); # ifdef CONFIG_BLK_DEV_IO_TRACE tsk->btrace_seq = 0; # endif tsk->splice_pipe = NULL; tsk->task_frag.page = NULL; account_kernel_stack(ti, 1); return tsk; free_ti: free_thread_info(ti); free_tsk: free_task_struct(tsk); return NULL; }
tsk = alloc_task_struct_node(node);为task_struct开辟内存
ti = alloc_thread_info_node(tsk, node);ti指向thread_info的首地址,同时也是系统为新进程分配的两个连续页面的首地址。
err = arch_dup_task_struct(tsk, orig);复制父进程的task_struct信息到新的task_struct里, (dst = src;)
tsk->stack = ti;task的对应栈
setup_thread_stack(tsk, orig);初始化thread info结构
set_task_stack_end_magic(tsk);栈结束的地址设置数据为栈结束标示(for overflow detection)
gdb跟踪sys_clone
用GDB来跟踪sys_clone,设置以下断点:![](http://upload-images.jianshu.io/upload_images/307862-c17f68d310054768.png)
fork1.png
运行后首先停在sys_clone处:
![](http://upload-images.jianshu.io/upload_images/307862-c9f902f4909124a7.png)
然后是do_fork,之后是copy_process:
![](http://upload-images.jianshu.io/upload_images/307862-0424ed9c57fc8cb9.png)
fork3.png
进入copy_thread:
![](http://upload-images.jianshu.io/upload_images/307862-5ad48cb5f1845bed.png)
fork4.png
在copy_thread中,我们可以查看p的值
![](http://upload-images.jianshu.io/upload_images/307862-f03e0e5fe544585f.png)
fork5.png
但是回到copy_process后再查看,将得到一个
value optimized out的提示,这是因为Linux内核打开gcc的-O2选项优化导致.如果想要关掉,可以参考:这里
![](http://upload-images.jianshu.io/upload_images/307862-a538d4be6506f473.png)
fork6.png
ret_from_fork按照之前的分析被调用,跟踪到
syscall_exit后无法继续.如果想在本机调试system call,那么当你进入system call时,系统已经在挂起状态了。如果想要跟踪调试system_call,可以使用kgdb等
![](http://upload-images.jianshu.io/upload_images/307862-39d5a8277154df1f.png)
fork7.png
新进程是从哪里开始执行的?
在之前的分析中,谈到copy_process中的copy_thread()函数,正是这个函数决定了子进程从系统调用中返回后的执行.
int copy_thread(unsigned long clone_flags, unsigned long sp, unsigned long arg, struct task_struct *p) { ... *childregs = *current_pt_regs(); childregs->ax = 0; if (sp) childregs->sp = sp; p->thread.ip = (unsigned long) ret_from_fork; ... }
子进程执行ret_from_fork
ENTRY(ret_from_fork) CFI_STARTPROC pushl_cfi %eax call schedule_tail GET_THREAD_INFO(%ebp) popl_cfi %eax pushl_cfi $0x0202 # Reset kernel eflags popfl_cfi jmp syscall_exit CFI_ENDPROC END(ret_from_fork)
执行起点与内核堆栈如何保证一致?
在ret_from_fork之前,也就是在copy_thread()函数中*childregs = *current_pt_regs();该句将父进程的regs参数赋值到子进程的内核堆栈,
*childregs的类型为pt_regs,里面存放了SAVE ALL中压入栈的参数
故在之后的RESTORE ALL中能顺利执行下去.
总结
Linux通过复制父进程来创建一个新进程,通过调用do_fork来实现Linux为每个新创建的进程动态地分配一个
task_struct结构.
为了把内核中的所有进程组织起来,Linux提供了几种组织方式,其中哈希表和双向循环链表方式是针对系统中的所有进程(包括内核线程),而运行队列和等待队列是把处于同一状态的进程组织起来
fork()函数被调用一次,但返回两次
文/uglyyouth(简书作者)
原文链接:http://www.jianshu.com/p/d843695f3ee8
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
相关文章推荐
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- linux 总线 设备 驱动
- Linux常用命令大全
- Linux内核分析-分析Linux内核创建一个新进程的过程
- Linux的网卡由eth0变成了eth1,如何修复
- linux命令(二)arch命令
- CentOS 6.0找不到ifcfg-eth0解决方案