Linux内核如何装载和启动一个可执行程序
2016-04-10 17:15
369 查看
原创作品 转载请注明出处
贺邦 《Linux内核分析》MOOC课程:http://mooc.study.163.com/course/USTC-1000029000
第七讲 Linux内核如何装载和启动一个可执行程序
一、理论知识
Linux中,可以从c源代码生产一个可执行程序,这其中要经过预处理、编译和链接的过程。可以参考以下图来理解这个过程:
![](http://images2015.cnblogs.com/blog/744507/201604/744507-20160404202218718-1459926619.png)
其中,目标文件中至少有编译后的机器指令代码、数据,也还包括了链接时所须要的一些信息,比如符号表、调试信息、字符串等。这Linux中,可执行文件的格式现在主要是ELF格式(对应于Windows中PE格式)。ELF的格式如下:
![](http://images2015.cnblogs.com/blog/744595/201604/744595-20160404215148250-1816542619.png)
链接,是收集、组织程序所需的不同代码和数据的过程,以便程序能被装入内存并被执行。链接过程分为两步:1.空间与地址分配;2.符号解析与重定位。
在Linux中,一个程序的执行是做为一个新的进程,使用execve系统调用完成的。execve对应的系统调用是sys_execve,在其内部会解析可执行文件格式。对应的内核代码,就是,在search_binary_handler中寻找符合文件格式对应的解析模块。
对于ELF文件,retval = fmt->load_binary(bprm)实际上执行的就是load_elf_binary,其内部就是按照ELF文件格式来加载ELF文件的。这里,我们也可以看到Linux是可以支持多种可执行文件格式的,所有的格式处里信息用一个结构体存储在一个链表中,其中的load_binary是一个函数指针,对应于该中格式的可执行文件的加载方式;要想支持一种新的可执行文件,只需要向链表中注册一个新的format结构体就可以了,此种设计类似观察者模式,具有很好的扩展性。
二、实验过程
打开实验楼中的虚拟机,在shell中依次运行以下命令,获取本次实验的代码,并编译运行
cd LinuxKernel
rm menu -rf
git clone https://github.com/mengning/menu.git
cd menu
mv test_exec.c test.c
make rootfs
效果如下:
![](http://img.blog.csdn.net/20150420135838639)
关闭QEMU窗口,在shell窗口中,cd LinuxKernel回退到LinuxKernel目录,使用下面的命令启动内核并在CPU运行代码前停下以便调试:
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S
接下来,我们就可以水平分割一个新的shell窗口出来,依次使用下面的命令启动gdb调试
gdb
(gdb) file linux-3.18.6/vmlinux
(gdb) target remote:1234
并在系统调用sys_execve的入口处设置断点
(gdb) b sys_execve
继续运行程序,在QEMU窗口中输入exec,系统就会停在上面设置的断点处,如图:
![](http://img.blog.csdn.net/20150420141052402)
接下来我们可以单步跟踪sys_execve的内核代码,也可以通过设置以下断点
b load_elf_binary
b start_thread
来完整地跟踪进程的创建和启动代码!
三、总结
Linux系统可以通过execve API启动一个新进程,该API又呼叫sys_execve系统调用,负责将新的程序代码和数据替换到新的进程中,打开可执行 文件,载入依赖的库文件,
申请新的内存空间,最后执行 start_thread(regs, elf_entry, bprm->p) ,设置 new_ip, new_sp ,完成新进程的代码和数据替换,然后返回,接下来就是执行新的进程代码了。
贺邦 《Linux内核分析》MOOC课程:http://mooc.study.163.com/course/USTC-1000029000
第七讲 Linux内核如何装载和启动一个可执行程序
一、理论知识
Linux中,可以从c源代码生产一个可执行程序,这其中要经过预处理、编译和链接的过程。可以参考以下图来理解这个过程:
![](http://images2015.cnblogs.com/blog/744507/201604/744507-20160404202218718-1459926619.png)
其中,目标文件中至少有编译后的机器指令代码、数据,也还包括了链接时所须要的一些信息,比如符号表、调试信息、字符串等。这Linux中,可执行文件的格式现在主要是ELF格式(对应于Windows中PE格式)。ELF的格式如下:
![](http://images2015.cnblogs.com/blog/744595/201604/744595-20160404215148250-1816542619.png)
链接,是收集、组织程序所需的不同代码和数据的过程,以便程序能被装入内存并被执行。链接过程分为两步:1.空间与地址分配;2.符号解析与重定位。
在Linux中,一个程序的执行是做为一个新的进程,使用execve系统调用完成的。execve对应的系统调用是sys_execve,在其内部会解析可执行文件格式。对应的内核代码,就是,在search_binary_handler中寻找符合文件格式对应的解析模块。
对于ELF文件,retval = fmt->load_binary(bprm)实际上执行的就是load_elf_binary,其内部就是按照ELF文件格式来加载ELF文件的。这里,我们也可以看到Linux是可以支持多种可执行文件格式的,所有的格式处里信息用一个结构体存储在一个链表中,其中的load_binary是一个函数指针,对应于该中格式的可执行文件的加载方式;要想支持一种新的可执行文件,只需要向链表中注册一个新的format结构体就可以了,此种设计类似观察者模式,具有很好的扩展性。
二、实验过程
打开实验楼中的虚拟机,在shell中依次运行以下命令,获取本次实验的代码,并编译运行
cd LinuxKernel
rm menu -rf
git clone https://github.com/mengning/menu.git
cd menu
mv test_exec.c test.c
make rootfs
效果如下:
关闭QEMU窗口,在shell窗口中,cd LinuxKernel回退到LinuxKernel目录,使用下面的命令启动内核并在CPU运行代码前停下以便调试:
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S
接下来,我们就可以水平分割一个新的shell窗口出来,依次使用下面的命令启动gdb调试
gdb
(gdb) file linux-3.18.6/vmlinux
(gdb) target remote:1234
并在系统调用sys_execve的入口处设置断点
(gdb) b sys_execve
继续运行程序,在QEMU窗口中输入exec,系统就会停在上面设置的断点处,如图:
接下来我们可以单步跟踪sys_execve的内核代码,也可以通过设置以下断点
b load_elf_binary
b start_thread
来完整地跟踪进程的创建和启动代码!
三、总结
Linux系统可以通过execve API启动一个新进程,该API又呼叫sys_execve系统调用,负责将新的程序代码和数据替换到新的进程中,打开可执行 文件,载入依赖的库文件,
申请新的内存空间,最后执行 start_thread(regs, elf_entry, bprm->p) ,设置 new_ip, new_sp ,完成新进程的代码和数据替换,然后返回,接下来就是执行新的进程代码了。
相关文章推荐
- 阿凡达学Linux-----Putty秘钥登录
- linux的tar命令
- centOs拨号上网
- 《Linux内核设计与实现》第4章读书笔记:进程调度
- 在Linux中使用线程
- 使用ssh密钥的方式连接linux服务器的注意事项
- Linux开发点点滴滴
- linux笔记 自学之路
- Linux IO 多路复用是什么意思?
- Centos存储管理
- 小米路由器mini实现锐捷认证.
- Ubuntu 13.04 开机找回用户密码
- Linux内核分析第七周学习笔记——Linux内核如何装载和启动一个可执行程序
- vmvare 安装centos,把原来的eth0和eth1找回来
- Linux C语言 UDP
- linux下组管理命令详解
- 【CentOS7-Python系列】之一【Python升级】
- 在Linux下的进程间通信之匿名管道
- LINUX内核分析第七周学习总结:可执行程序的装载
- 在linux下查看.caj文档