您的位置：首页 > 运维架构 > Linux

Linux系统调用与ptrace分析

2011-01-26 14:30 288 查看

[align=center]Linux系统调用与ptrace分析[/align]

概述
1．Linux的系统结构
在Linux系统结构中，最核心的是计算机硬件，它提供对Linux软件的支持，靠近硬件的内层是Linux内核程序（即操作系统）。内核直接和硬件打交道是程序和硬件之间的接口或界面。它对一切外层程序提供公共服务，把外部程序同硬件隔离开。内核程序大致可分为文件系统管理，进程管理，内存管理等几部分。进程管理又分为低级进程管理和高级进程管理。低级进程管理主要包括：进程调度分配，控制占用处理器的程序和基本的进程通信。高级进程管理主要包括：进程的创建，终止，进程间通信，进程在内存和外存之间的转储，信号机构和进程间跟踪控制等。内核程序的外层是实用程序，内核提供对实用程序的支持，两层之间的界面是系统调用。内核外的实用程序通过系统调用来和内核打交道。实现的过程是通过一种特殊的指令（陷入指令）进入内核，然后转入相应的系统调用处理程序。这也是本文将主要讨论的问题。

2．80386体系结构
80386的体系结构承认两类事件。

1.异常（exceptions）
2.中断（interrupts）
他们两都会引起“上下文转换”同时建立一个过程或任务，中断可以随时随地发生（包括在执行程序时）所以用来响应硬件信号。而异常则由指令内部错误引起。
每一个异常或中断都有一个唯一的标识符，在linux中被称为向量。
指令内部异常和NMI（不可屏蔽中断）的中断向量的范围从0—31。32-255的任何向量都可以用做
1.可屏蔽中断
2.编程（调试）异常
至于可屏蔽中断则取决于该系统的硬件配置。外部中断控制器在中断响应周期把中断向量放到总线上。

3．Linux系统调用流程概述
Linux系统调用的流程非常简单，它由0x80号中断进入系统调用入口，通过使用系统调用表保存系统调用服务函数的入口地址来实现,本文首先分析一般Linux系统调用的流程，然后再分析Linux系统调用sys_ptrace（）.

一. Linux系统调用的流程分析
1.1 设定0x80号中断
系统启动后，先进行初始化，其中一部分重要的工作在start_kernel()函数（main.c中定义）中进行，在该函数中先做必要的初始化工作（setup_arch（）与paging_init（）），各种trap入口就在该函数中通过调用trap_init()（traps.c）被设置，其中与系统调用有关的是：set_system_gate(0x80,&system_call);
“set_system_gate()”是一宏，它在“system.h”中被定义：

#define set_system_gate(n,addr) \
_set_gate(&idt
,15,3,addr)
……中断描述表结构（head.s）
其中“_set_gate()”也是在该文件中定义的宏：

#define _set_gate(gate_addr,type,dpl,addr) \
__asm__ __volatile__ ("movw %%dx,%%ax\n\t" \
"movw %2,%%dx\n\t" \
"movl %%eax,%0\n\t" \
"movl %%edx,%1" \
:"=m" (*((long *) (gate_addr))), \
"=m" (*(1+(long *) (gate_addr))) \
:"i" ((short) (0x8000+(dpl<<13)+(type<<8))), \
"d" ((char *) (addr)),"a" (KERNEL_CS << 16) \
:"ax","dx")

调用该宏，将使addr地址值置入gate_addr中的地址值所指向的内存单元中，以上过程，使中断向量描述表中的第128项（16进制第80项）保存了0x80号中断的中断服务程序，即system_call。

而中断描述表结构则定义在head.s中.
1.2 系统调用的数据结构
系统调用所用到的数据结构也非常简单，主要有两种，系统调用表和寄存器帧结构。
“entry.S”中定义了系统调用表，该表保存了Linux基于Intel x86系列体系结构的计算机的166个系统调用入口地址（其中3个保留，Linux开辟的系统调用表可容纳256项），其中每项都被说明成 long型。
ENTRY(sys_call_table)
.long SYMBOL_NAME(sys_setup) /* 0 */
.long SYMBOL_NAME(sys_exit)
.long SYMBOL_NAME(sys_fork)
…………
.long SYMBOL_NAME(sys_setitimer) /* 104 */
…………
.long SYMBOL_NAME(sys_select) /* 142*/
…………
.long 0,0
.long SYMBOL_NAME(sys_vm86) /* 166 */
.space (NR_syscalls-166)*4
NR_syscalls是在“sys.h”文件中定义的宏，表示x86微机上最多可容纳的系统调用个数。
#define NR_syscalls 256
在文件“ptrace.h”中定义了一种寄存器帧结构：pt_regs，该帧结构与系统调用时压入堆栈的寄存器的顺序保持一致，用来在系统调用时传递参数。
struct pt_regs {
long ebx;
long ecx;
long edx;
long esi;
long edi;
long ebp;
long eax;
int xds;
int xes;
long orig_eax;
long eip;
int xcs;
long eflags;
long esp;
int xss;
};

这样，如果pt_regs结构体的首地址（设为regs）是该帧的帧顶（栈顶），在entry.s中压入堆栈的一帧将和pt_regs结构体中的字段对应。
1.3 系统调用的入口
在头文件“unistd.h”中，定义了一系列的与系统调用有关的宏，包括系统调用序号，如：
#define __NR_exit 1
还定义了设置系统调用入口的宏，_syscallX(type,name, type1,arg1,type2,arg2……)，其中X表示系统调用的参数个数，Linux定义的各种系统调用的参数个数不超过5个，因此，在该文件中，共定义了6个宏，“_syscallX”宏，分别对应X个参数，下面以X=2即两个参数为例，解释该宏：
#define _syscall2(type,name,type1,arg1,type2,arg2) \
type name(type1 arg1,type2 arg2) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2))); \
if (__res >= 0) \
return (type) __res; \
errno = -__res; \
return -1; \
}
该宏的第一个参数是一类类型参数，它指明系统调用返回值的类型，第二个参数指明系统调用的名称。参数列表中若还有参数，则第2i个参数是系统调用函数的第i个参数的类型，第2i+1个参数是系统调用函数的第i个参数
该宏的主体部分是一内联汇编，在内联汇编中只有一条扩展汇编指令，即“int $0x80”，该语句两个冒号后的语句设置输入和输出寄存器。
第一个冒号后的语句指明返回参数（即__res）使用eax寄存器。
第二个冒号后面指定接受输入的寄存器,“"0" (__NR_##name),”将参数name与“__NR_”串接起来，形成的标志符存入eax寄存器，作为区别系统调用类型的唯一参数，例如设置name为“ptrace”，那么，gcc编译器将把“__NR_”与之串接，被视为标志符“__NR_ptrace”，由于在文件“include/asm-i386/unistd.h”中已定义其为26，那么，传给eax的值将为26。
后面的语句将参数arg1,arg2分别传给寄存器ebx和ecx，在“_syscallX”宏中，有如下约定:
arg1值存入寄存器ebx；
arg2值存入寄存器ecx；
arg3值存入寄存器edx；
arg4值存入寄存器esi；
arg5值存入寄存器edi；
在该宏的最后，判断返回值“__res”是否合法，若为负数，表明在系统调用中出错，将其绝对值作为出错号赋给全局变量“errno”，并返回-1，否则返回“__res”。
该宏的唯一一条汇编指令“int $0x80”使程序流程转入“system_call”。
1.4 转入system_call
system_call是在汇编语言文件“entry.S”中定义的一入口，在Linux中，所有的系统调用都是通过中断“int &0x80”语句来实现的，因而，system_call是所有系统调用的入口。下面解释关于它的一些重要指令，以清晰它的流程：
1．首先，pushl %eax,保存原来的eax寄存器，然后调用宏“SAVE_ALL”将现有通用寄存器保存，寄存器的保存不但避免影响原来的寄存器数据，而且提供了一种传递参数的方法。正如在2.2节所指出的，这样保存的一帧寄存器，与该过程所要传递的pt_regs结构相对应。在该宏中，还使ds和es指向内核的数据段，使fs指向用户的数据段。
#define SAVE_ALL \
cld; \
push %gs; \
push %fs; \
push %es; \
push %ds; \
pushl %eax; \
pushl %ebp; \
pushl %edi; \
pushl %esi; \
pushl %edx; \
pushl %ecx; \
pushl %ebx; \
movl $(KERNEL_DS),%edx; \
mov %dx,%ds; \
mov %dx,%es; \
movl $(USER_DS),%edx; \
mov %dx,%fs;

2．语句“cmpl $(NR_syscalls),%eax”比较NR_syscalls与eax的大小，如果eax大于或等于NR_syscalls，表明指定的系统调用函数错误，“jae ret_from_sys_call”使系统调用直接返回。
[align=left]3 . 流程进入ret_from_sys_call，该过程内处理一些系统调用返回前应该处理的事情，如检[/align]
[align=left] 测bottom half缓冲区，判断CPU是否需要重新调度等.[/align]
先注意全局变量intr_count，它虽然不是信号量，但也部分的具有了信号量的作用，表
示已有进程进入bottom_half,它在系统处理bottom_half时增1，则其为非零。
语句“cmpl $0,SYMBOL_NAME(intr_count)”就是进行上述判断，若非零，处理
bottom half 缓冲区。（“jne handle_bottom_half”）。
下面两条语句判断CPU是否需要重新调度：
cmpl $0,SYMBOL_NAME(need_resched)
jne reschedule
其中，need_resched是一全程量，它置位，表示CPU需要重新调度，程序转向过程reschedule，进而，转向schedule（）函数，在该函数中，将其重新置零。
注意，handle_bottom_half和reschedule并不是必需的，只不过在系统运行过程中，随时都有可能出现需要处理bottom half缓冲区或重新调度CPU，放在系统调用返回前，有利于它们被及时处理。但这也说明，Linux 不是一个硬实时的操作系统，它可能会产生延误。
4. 如果eax小于NR_syscalls，system_call过程接下去执行语句：
movl SYMBOL_NAME(sys_call_table)(,%eax,4),%eax
该语句以 sys_call_table为基地址，eax寄存器中的内容（即系统调用的序号）乘以4为偏移量（因为long型为4字节），即得到所需调用的系统调用函数的入口地址，将其存入寄存器eax。
testl %eax,%eax
接着判断寄存器eax值是否为0，若是，表明出错，直接返回,je ret_from_sys_call。
[align=left] #ifdef __SMP__ [/align]
[align=left] GET_PROCESSOR_OFFSET(%edx)[/align]
[align=left] movl SYMBOL_NAME(current_set)(,%edx),%ebx[/align]
[align=left]#else[/align]
[align=left]movl SYMBOL_NAME(current_set),%ebx[/align]
[align=left] 以上语句首先判断是否为多处理器结构，若是，得到当前处理器的偏移值，当前的进[/align]
[align=left] 程控制块的指针为current_set[smp_processor_id()]，否则，current_set[0]即为当前进程[/align]
[align=left] 控制块的指针，这样，ebx寄存器指向当前进程。[/align]
[align=left] movl %db6,%edx[/align]
[align=left] movl %edx,dbgreg6(%ebx)[/align]
[align=left] 以上两条语句用来保存当前调试信息，在进程控制块task_struct结构中，第8项是[/align]
[align=left] debugreg[8]，用来指示硬件调试信息。在entry.S中,定义了一系列宏作为偏移量，用[/align]
[align=left] 来得到当前进程的信息，它们是：[/align]
[align=left]state = 0[/align]
[align=left]counter = 4[/align]
[align=left]priority = 8[/align]
[align=left]signal = 12[/align]
[align=left]blocked = 16[/align]
[align=left]flags = 20[/align]
[align=left]dbgreg6 = 52[/align]
[align=left]dbgreg7 = 56[/align]
[align=left]exec_domain = 60[/align]
[align=left]这样，在当前进程的task_struct结构中，保存了当前的调试信息。[/align]
[align=left]5.语句“testb $0x20,flags(%ebx)”检测当前进程是否正跟踪系统调用，如果不是的话，直[/align]
[align=left] 接调用所选系统调用函数，相关语句为： call *%eax [/align]
[align=left] 如判断当前进程正处于跟踪系统调用状态（current->flags&PF_TRACESYS==0），调用函[/align]
[align=left] 数体“syscall_trace()”（在ptrace.c中定义），使当前进程状态转为TASK_STOPPED，即[/align]
[align=left] 转入睡眠状态。[/align]
[align=left]asmlinkage void syscall_trace(void)[/align]
[align=left]{[/align]
[align=left] if ((current->flags & (PF_PTRACED|PF_TRACESYS))[/align]
[align=left] != (PF_PTRACED|PF_TRACESYS))[/align]
[align=left] return;[/align]
[align=left] current->exit_code = SIGTRAP;[/align]
[align=left] current->state = TASK_STOPPED;[/align]
[align=left] notify_parent(current, SIGCHLD);[/align]
[align=left] schedule();[/align]
[align=left] if (current->exit_code) {[/align]
[align=left] send_sig(current->exit_code, current, 1);[/align]
[align=left] current->exit_code = 0;[/align]
[align=left] }[/align]
[align=left]}[/align]
[align=left]然后从压入寄存器的堆栈中重新找到原来的eax值，再重新设置系统调用函数的偏移量，调用实现相应系统调用的函数，语句为： [/align]
[align=left]call SYMBOL_NAME(syscall_trace) movl ORIG_EAX(%esp),%eax [/align]
[align=left]call *SYMBOL_NAME(sys_call_table)(,%eax,4)[/align]
做完以上工作后，将返回值保存在eax寄存器中。
movl %eax,EAX(%esp)
最后进入ret_from_sys_call,作一些处理工作。

二. 系统调用实例分析：ptrace系统调用
2.1 跟踪及ptrace（）简述
Linux提供的跟踪功能，即父进程对子进程的跟踪，使得父进程可以对自己的子进程进行监督与控制。具体包括读写子进程用户空间的程序，数据，或user结构中的变量，向它们发送软中断，以及命令它们自我终止等。系统提供了两种系统调用waitpid()和ptrace(),一实现跟踪功能。这种父子进程间的关联可由子进程发ptrace(0)请求,也可由父进程发attach请求来实现.
本文第二部分先利用第一部分的知识阐述ptrace系统调用的设置，然后再简单解释ptrace系统调用的流程。
2.2 预备知识
1．标识”错误“的宏，定义在linux\include\asm_i386\errno.h
ptrace()中涉及下面几个宏：
#define EPERM 1 /* 操作不被允许 */
#define ESRCH 3 /* 不存在这样的进程 */
#define EIO 5 /* I/O错误 */
2．下面是一些用来帮助标识具体跟踪命令或状态的宏：
（定义在linux\include\linux\ptrace.h中）
#define PTRACE_TRACEME 0
/* 说明是子进程调用该程序，请求父进程跟踪 */
#define PTRACE_PEEKTEXT 1
/* 在指定的位置读一个字 */
#define PTRACE_PEEKDATA 2
#define PTRACE_PEEKUSR 3
/* 在USER结构指定的位置读一个字 */
#define PTRACE_POKETEXT 4
/* 在指定的位置写一个字 */
#define PTRACE_POKEDATA 5
#define PTRACE_POKEUSR 6
/* 在USER结构指定的位置写一个字 */
#define PTRACE_CONT 7
/* 子进程接受信号后，RESTART */
#define PTRACE_KILL 8
/* 终止子进程 */
#define PTRACE_SINGLESTEP 9
/* 置TRAP标志 */
#define PTRACE_ATTACH 0x10
#define PTRACE_DETACH 0x11

#define PTRACE_SYSCALL 24
（定义在linux\include\asm_i386\ptrace.h中）
#define PTRACE_GETREGS 12
/* 在子进程中获得所有的GP寄存器内容 */
#define PTRACE_SETREGS 13
/* 设置子进程中所有的的GP寄存器 */
#define PTRACE_GETFPREGS 14
/* Get the child FPU state. */
#define PTRACE_SETFPREGS 15
/* Set the child FPU state. */
3．其他（待解释）
#define PAGE_SHIFT 12
#define PAGE_SIZE (1UL << PAGE_SHIFT)
#define PAGE_MASK (~(PAGE_SIZE-1))
#define VM_GROWSDOWN 0x0100
#define _NSIG 64
2.3 ptrace系统调用的设置
系统调用的设置均在文件“include/asm-i386/unistd.h”中进行.ptrace系统调用的对应函数带4个参数，因此该系统调用的设置应使用的宏应为：
_syscall4(int,ptrace,long,request,long,pid,long,addr,long,data) (文件“include/asm-i386/unistd.h”中)，
#define _syscall4(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4) \
type name (type1 arg1, type2 arg2, type3 arg3, type4 arg4) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2)), \
"d" ((long)(arg3)),"S" ((long)(arg4))); \
__syscall_return(type,__res); \
}
这样，在调用ptrace时，系统将调用宏指令_syscall4，进而，调用0x80号中断，寄存器eax中的值为__NR_ptrace, request值存入寄存器ebx；pid值存入寄存器ecx；addr值存入寄存器edx；data值存入寄存器esi；调用中断“int $0x80”以后，在汇编过程“system_call”中，将通过eax中的值__NR_ptrace（即26）与4的乘积作为相对于系统调用表（sys_call_table）偏移量，找到入口：
.long SYMBOL_NAME(sys_ptrace)
于是，系统流程转向函数sys_ptrace（）。sys_ptrace（）是在文件“arch/i386/kernel/ptrace.c”中定义的，程序如下：
下面一节介绍该函数的大概流程。
2.4 ptrace（）的流程
ptrace（）函数一开始就“作最坏的打算”，将可能返回的值 ret初始值置为-EPERM，它意味着，操作被拒绝。然后，才进入主流程。
首先，函数根据request参数判断是否是子进程发出的要求，如果request为1，则表示是子进程要求父进程进行跟踪，再判断是否已被跟踪，如是则返回，此步可用指向当前进程的current的flags字段与PF_PTRACED进行求与，如结果非零表示子进程已被跟踪。如未被跟踪，则将PF_PTRACED与flags求并，ret置为0，最后返回。
if (request ==PTRACE_TRACEME) {
if (current->flags & PF_PTRACED)
goto out;
/* set the ptrace bit in the process flags. */
current->flags |= PF_PTRACED;
ret = 0;
goto out;
}
如request不为1，则表示父进程发给子进程的命令类型。
接下去如果子进程的pid等于1（1号进程是初始进程，是除0号进程外所有进程的祖先），则带出错信息返回。然后函数将从tasklist中找到子进程，先做好最坏的准备，即找不到pid所表示的子进程，将ret置为 -ESRCH，接着调用宏read_lock和read_unlock（定义在spinlock.h中）
#define read_lock(lock) do { } while(0)
#define read_unlock(lock) do { } while(0)
在它们中间调用find_task_by_pid（），根据进程的id号从hash表中找到指向子进程的指针，赋给child指针。如该指针为null,则带前设出错信息返回。
下面将判断是否是当前进程发出命令要求跟踪指定的进程,为此函数有做好最坏的准备,将ret置为-EPERM。
接着函数将准备处理attach的请求,此请求表示当前进程想跟踪指定的进程,以便后面各种命令的实现.若找到的进程就是当前进程,带设好的出错信息返回.而要想绑定一个进程,必须向它发送信号(signal),又因为除了内核和超级用户,不是每一个进程都能向别的进程发送信号,而且一般的进程只能向同用户和同组的进程发送信号,所以如果当前进程不满足这些条件,或者子进程不能进行进程交换,并且当前进程所属用户也不是超级用户的话,那么该操作也将拒绝而返回.如果该进程正在被当前进程所跟踪,操作也将失败.这一系列的判断有下面的语句完成:
if ((!child->dumpable ||
(current->uid != child->euid) ||
(current->uid != child->suid) ||
(current->uid != child->uid) ||
(current->gid != child->egid) ||
(current->gid != child->sgid) ||
(current->gid != child->gid)) && !suser())
goto out;
if (child->flags & PF_PTRACED)
goto out;
接着将current的flags字段与PF_PTRACED求并.如果当前进程是child进程的父进程,则直接调用send_sig()函数,向它发送SIGSTOP信号,使子进程进入TASK_STOPPED状态,等待父进程的命令.父进程则返回准备下一次调用.
send_sig(SIGSTOP, child, 1);
如果当前进程不是child的父进程,而是属于超级用户,则需要修改进程的p_pptr字段,以使当前进程为父进程,为对共享数据进行读写,须先保存必要的信息到flags中然后关中断,以保证数据的一致性和完整性,修改完数据后从flags中恢复信息.此工作有下面几个宏完成,分别定义在spin_lock.h,system.h中.
#define save_flags(x) \
__asm__ __volatile__("pushfl ; popl %0":"=g" (x): /* no input */ :"memory")
#define restore_flags(x) \
__asm__ __volatile__("pushl %0 ; popfl": /* no output */ :"g" (x):"memory")
#define cli() __asm__ __volatile__ ("cli": : :"memory")
#define write_lock_irqsave(lock, flags) \
do { save_flags(flags); cli(); } while (0)
#define write_unlock_irqrestore(lock, flags) \
restore_flags(flags)
在REMOVE_LINKS和SET_LINKS两个宏中间,将child的p_pptr指针指向当前进程.然后就可以像父进程一样直接向child发信号了.其中，REMOVE_LINKS和 SET_LINKS 定义在sched.h中，REMOVE_LINKS宏把进程从上相链表中删除，并把连在其上的父兄进程指针移开。而SET_LINKS宏则重新设置该进程的相关指针。
如果收到的请求不是PTRACE_ATTACH,表示子进程已被当前进程绑定,处于TASK_STOPPED状态,等待父进程接下来的命令,或者父进程将KILL子进程.接着函数有将对子进程作一些判断,于是先将ret置为-ESRCH,做好出错的准备.首先,如果该进程未被跟踪
则出错返回,表明一个进程不能对任意的进程跟踪,子进程须先做请求,或者父进程先要提出跟踪的要求.如果子进程不处于TASK_STOPPED状态,父进程也未发kill命令,出错返回.如果child的父进程不是当前进程,表明此跟踪乃子进程首先申请,但不应由当前进程处理,返回.
下面进入各种命令的具体实现部分,由一个switch...case...组成.共分下面几种情况处理:
1.PTRACE_PEEKTEXT;
2.PTRACE_PEEKDATA;
3.PTRACE_PEEKUSR;
4.PTRACE_POKETEXT:
5.PTRACE_POKEDATA:
6.PTRACE_POKEUSR:
7.PTRACE_SYSCALL:
8.PTRACE_CONT:
9.PTRACE_KILL:
10.PTRACE_SINGLESTEP:
11.PTRACE_DETACH:
12.PTRACE_GETREGS:
13.PTRACE_SETREGS:
14.PTRACE_GETFPREGS:
15.PTRACE_SETFPREGS:
16.default:
由于笔者时间有限,将试着做一些简单的分析.
如果收到的要求是PTRACE_PEEKDATA，即要求从指定的地址读数据。首先定义一个无符号长整型变量tmp,用来存放中间结果。然后如下调用函数：
ret = read_long(child, addr, &tmp);
该函数也定义在ptrace.h中，该函数首先调用find_extend_vma函数（ptrace.h）, 这里需要讲一下vm_area_struct这个结构。当一个进程映像被执行的时候，可执行的进程映像内容须被引入到进程的虚地址空间去，任何与进程映像相联系的函数库也一样。可执行文件实际上并没有引入内存，相反，它仅仅只是被关联到进程的虚地址空间。这样，作为正运行的应用程序访问的程序的一部分，进程映像就通过可执行的映像引入到内存中。这个过程就叫内存映射。每一个进程的虚存由mm_struct数据结构代表，它包括了进程的映像的信息和一个指向一系列vm_area_struct结构的指针。每一个vm_area_struct结构描述一个虚存区的启始地址和结束地址，进程进入内存的权限，和一些相关的操作。
在find_extend_vma函数中调用find_vma函数，从进程的vm_area_struct中找到第一个满足addr<vm_end的虚存区,首先检查cache,然后再在双项链表中找到相应的虚存区.如果找不到则返回 NULL，找到，则返回一个满足条件的vm_area_struct指针。如果该指针为null,
返回null,如果它的vm_start<addr,则返回这个指针，下面的代码待解释：

if (!(vma->vm_flags & VM_GROWSDOWN))
return NULL;
if (vma->vm_end - addr > tsk->rlim[RLIMIT_STACK].rlim_cur)
return NULL;
如果都不是，则将vm_start和vm_offset重新设置，返回。如果返回值为null,则返回 -EIO给ret,这个例程将通过页表从进程区获得一个长整型数。注意：你必须自己检查该长整型是否在页的边界，并且在调用它前它已在task aera中，例程不会替你检查。通过下面的判断可知是否在边界：
if ((addr & ~PAGE_MASK) > PAGE_SIZE-sizeof(long))
如果不是则直接调用get_long（）即可，不然则需用两个long来获得该数。
这个long存在tmp中，如果发现ret>=0,则调用put_user（）宏。该宏允许设备在用户区写数据。注意，这个函数可能导致I/O冲突，如果被访问的内存已被换出，所以此时抢占可能发生。即使临界区已被cli()和sti()保护起来，也不要在临界区中使用这个函数，因为I/O冲突将破坏cli()/sti()对的完整性。如果你想到达用户空间内存，需在进入临界区前把它拷到内核区内存中。（ret为什么会大于零呢？）
如果请求是PTRACE_KILL，则首先判断子进程是否已为僵死状态，如是则直接退出。如否则调用一个内联函数wake_up_process（），置进程状态为运行态，然后将SIGKILL赋给child->exit_code，作为子进程强行退出时的出错代码。然后调用get_stack_long 和put_stack_long确保禁止单步跟踪，返回。（其中，对tss.esp0不了解，tss是一个thread_struct结构，也是task_struct中的一个字段）
如果请求是PTRACE_DETACH，则将断开父子进程的关联。首先做好最坏准备，置ret为-EIO。因为参数data将作为子进程强行退出时的出错代码，故如果大于64则出错返回，然后置flags的相关位，使子进程不被跟踪，接着唤醒子进程，将data赋给child->exit_ccode,安全的修改child的p_pptr指针使其指向起原始父进程，p_opptr.在通过调用get_stack_long和put_stack_long,确保单步中断被禁止。最后返回。
三. 总结
本实验报告组要有两部分组成,先分析了系统调用的陷入与返回过程,然后结合ptrace系统调用具体的分析了其中的流程.在分析过程中也遇到了不少的困难,比如,刚开始对那些内联的汇编语句不能理解,通过与同学的互相讨论,在结合Brennan UnderWood “Brennan's Guide to Inline Assembly”,终于能看明白这些陌生的格式.在具体分析ptrace这个系统调用时,更是碰到了麻烦,再看了一本关于UNIX的相应的流程之后,对这个程序才有了些眉目.在UNIX SYSTEM V中,只有子进程能发ptrace(0)命令,要求父进程进行跟踪,而父进程则消极等待,在linux中,不仅支持了上面的功能,还允许父进程或超级用户主动提出要求,无疑大大方便了进程的监督与控制.然而由于时间和本人能力的关系,不能对其中所有的命令一一分析下来,即使分析过的,也还存在不少疑问,这也在分析过程中提过.但我仍感觉受益非浅,通过这学期操作系统课的学习,尤其是对linux系统的分析工作,我对计算机的认识又深了一层,
以前总认为能编出好的程序就足够了,可现在却觉得这还远远不够,因为任何程序的执行都依托于操作系统.我想利用寒假的时间对linux进行进一步研究, 也深深希望得到您的指点.

四. 附录
1．参考资料
（1）Linux kernel 2.1.99
（2）李善平《LINUX进程管理》
（3）David A Rusling “The Linux Kernel”
（4）Brennan UnderWood “Brennan's Guide to Inline Assembly”

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： linux 职场休闲

相关文章推荐

新的分享

章节导航