你的变量究竟存储在什么地方?
2013-04-03 14:42
483 查看
你的变量究竟存储在什么地方?
作者:杨小华
我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。
如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。
在计算机系统中,目标文件通常有三种形式:
1. 可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2. 可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行
3. 共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库
一个典型的可重定位目标文件如下图所示:
高地址
0
图 1典型的ELF可重定位目标文件(数字代表索引)
夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:
对于static类型的变量,gcc编译器在.data和.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。
下面我们以实际的例子来分析变量的存储:
根据以上题目和理论知识,我们可以推断出:
我们将从汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码:
通过以上汇编代码可以发现,z和b在.data段,main和swap在.text段,a和c在.bss段,x,y,temp在stack中,printf函数所打印的字符串在.rodata中。
下面我们在通过符号表来解释变量的存储。
每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:
1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。
2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。
3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。
该程序所对应的符号表如图所示:
图 2符号表
首先,我们解释上图中各字段的含义:
对于变量b和z,Ndx索引为3,我们观察图1,不难发现索引3对应的是.data段。变量c对应的索引为4(.bss段),变量a对应的索引是COM,最终当该程序被链接时,它将做为一个.bss目标分配。我们从反汇编代码中,对于变量a和c都是.comm(反汇编代码中以“.”开头的行,是指导汇编器和链接器运行的命令):
注意:a所对应的Bind为GLOBAL,即为全局变量,虽然变量c也在.bss段中,但Bind却是LOCAL,则为本地变量。.data段中的变量b和c也是类似的情况。swap和main都在索引1所对应的.text段中。由于printf是在库中所定义的,所以索引为UND。
符号表中不包含对应于本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。
相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。
作者:杨小华
我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。
如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。
在计算机系统中,目标文件通常有三种形式:
1. 可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2. 可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行
3. 共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库
一个典型的可重定位目标文件如下图所示:
高地址
[align=center]节头部表[/align] |
[align=center].strtab[/align] |
[align=center].line[/align] |
[align=center].debug[/align] |
[align=center].rel.data[/align] |
[align=center].rel.text[/align] |
[align=center].symtab[/align] |
[align=center].bss[/align] |
[align=center] .data (3)[/align] |
[align=center].rodata[/align] |
[align=center] .text (1)[/align] |
[align=center]ELF头[/align] |
图 1典型的ELF可重定位目标文件(数字代表索引)
夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:
[align=center]节[/align] | [align=center]含义[/align] |
.text | 已编译程序的机器代码 |
.rodata | 只读数据,如pintf和switch语句中的字符串和常量值 |
.data | 已初始化的全局变量 |
.bss | 未初始化的全局变量 |
.symtab | 符号表,存放在程序中被定义和引用的函数和全局变量的信息 |
.rel.text | 当链接器吧这个目标文件和其他文件结合时,.text节中的信息需修改 |
.rel.data | 被模块定义和引用的任何全局变量的信息 |
.debug | 一个调试符号表。 |
.line | 原始C程序的行号和.text节中机器指令之间的映射 |
.strtab | 一个字符串表,其内容包含.systab和.debug节中的符号表 |
下面我们以实际的例子来分析变量的存储:
#include<stdio.h> #include<string.h> #include<stdlib.h> int z = 9; int a; static int b =10; static int c; void swap(int* x,int* y) { int temp; temp=*x; *x=*y; *y=temp; } int main() { int x=4,y=5; swap(&x,&y); printf(“x=%d,y=%d,z=%d,w=%d/n”,x,y,z,b); return 0; } |
变量 | 存储区域 |
[align=center]a[/align] | .bss |
[align=center]b[/align] | .data |
[align=center]c[/align] | .bss |
[align=center]x[/align] | stack |
[align=center]y[/align] | stack |
[align=center]temp[/align] | stack |
[align=center]z[/align] | .data |
[align=center]swap[/align] | .text |
[align=center]main[/align] | .text |
[align=center]x=……[/align] | .rodata |
.file "var.c" .globl z .data #数据段 .align 4 .type z, @object .size z, 4 z: .long 9 .align 4 .type b, @object .size b, 4 b: .long 10 .text #代码段 .globl swap .type swap, @function swap: pushl %ebp movl %esp, %ebp subl $4, %esp movl 8(%ebp), %eax movl (%eax), %eax movl %eax, -4(%ebp) movl 8(%ebp), %edx movl 12(%ebp), %eax movl (%eax), %eax movl %eax, (%edx) movl 12(%ebp), %edx movl -4(%ebp), %eax movl %eax, (%edx) leave ret .size swap, .-swap .section .rodata #只读段 .LC0: .string "x=%d,y=%d,z=%d,w=%d/n" .text #代码段 .globl main .type main, @function main: pushl %ebp movl %esp, %ebp subl $40, %esp andl $-16, %esp movl $0, %eax subl %eax, %esp movl $4, -4(%ebp) movl $5, -8(%ebp) leal -8(%ebp), %eax movl %eax, 4(%esp) leal -4(%ebp), %eax movl %eax, (%esp) call swap movl b, %eax movl %eax, 16(%esp) movl z, %eax movl %eax, 12(%esp) movl -8(%ebp), %eax movl %eax, 8(%esp) movl -4(%ebp), %eax movl %eax, 4(%esp) movl $.LC0, (%esp) call printf movl $0, %eax leave ret .size main, .-main .comm a,4,4 .local c .comm c,4,4 .section .note.GNU-stack,"",@progbits .ident "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)" |
下面我们在通过符号表来解释变量的存储。
每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:
1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。
2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。
3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。
该程序所对应的符号表如图所示:
图 2符号表
首先,我们解释上图中各字段的含义:
字段名 | 含义 |
Num | 序号 |
Value | 符号地址。 可重定位目标文件:距定义目标文件的节的起始位置的偏移 可执行目标文件:一个绝对运行的地址 |
Size | 目标的大小 |
Type | 要么是数据,要么是函数,或各个节的表目 |
Bind | 符号是全局的还是本地的 |
Vis | 目前还没有查到资料,待以后改正 |
Ndx | 通过索引来表示每个节 ABS:不该被重定位的符号 UND:代表未定义的符号(在其他地方定义) COM:未初始化的数据目标 |
Name | 指向符号的名字 |
…… .comm a,4,4 .local c .comm c,4,4 …… |
符号表中不包含对应于本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。
相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。
相关文章推荐
- 你的变量究竟存储在什么地方 && 全局内存 分类: VC++ 2014-06-20 10:36 375人阅读 评论(0) 收藏
- 你的变量究竟存储在什么地方 && 全局内存
- 你的变量究竟存储在什么地方 && 全局内存
- 你的变量究竟存储在什么地方 && 全局内存
- 你的变量究竟存储在什么地方 && 全局内存
- 你的变量究竟存储在什么地方?
- 你的变量究竟存储在什么地方?
- 你的变量究竟存储在什么地方?
- 你的变量究竟存储在什么地方?
- 你的变量究竟存储在什么地方 [转]
- 你的变量究竟存储在什么地方 && 全局内存【转】
- 你的变量究竟存储在什么地方?
- 引用 你的变量究竟存储在什么地方 && 全局内存
- 程序的局部变量 全局变量 动态申请数据分别存储在什么地方?
- 程序的局部变量 全局变量 动态申请数据分别存储在什么地方
- 你究竟需要什么样地存储? 推荐
- 对象存储在什么地方(java编程思想)
- NSUserDefaults数据存储在什么地方?
- 文件应该存储在手机的什么地方?
- Java对象存储到什么地方