您的位置:首页 > 其它

指针与引用(反汇编)

2015-01-30 09:59 127 查看
一、指针

由于指针保存的数据都是地址,所以无论什么类型的指针都占4字节内存空间。

①各类型指针访问同一地址

每种数据类型在内存中所占的内存空间不同,指针中只保存了存放数据的首地址,而没有指明在哪里结束。这时需要根据对应的类型来寻找解释数据的结束地址。

先看看C++代码

int main()
{
int num=0x12345678;
int *pn=#
char *pc=(char *)#
short *psn=(short *)#
long long *pln=(long long *)#

cout<<hex<<static_cast<int>(*pn)<<endl;
cout<<hex<<static_cast<int>(*pc)<<endl;
cout<<hex<<static_cast<short>(*psn)<<endl;
cout<<hex<<static_cast<long long>(*pln)<<endl;

system("pause");
return 0;
}


运行结果:


再看反汇编

int num=0x12345678;
011E13EE  mov         dword ptr [num],12345678h
int *pn=#
011E13F5  lea         eax,[num]  //取的都是num的地址
011E13F8  mov         dword ptr [pn],eax
char *pc=(char *)#
011E13FB  lea         eax,[num]
011E13FE  mov         dword ptr [pc],eax
short *psn=(short *)#
011E1401  lea         eax,[num]
011E1404  mov         dword ptr [psn],eax
long long *pln=(long long *)#
011E1407  lea         eax,[num]
011E140A  mov         dword ptr [pln],eax
cout<<hex<<static_cast<int>(*pn)<<endl;
011E140D  mov         esi,esp
011E140F  mov         eax,dword ptr [__imp_std::endl (11E82B0h)]
011E1414  push        eax
011E1415  mov         edi,esp
011E1417  mov         ecx,dword ptr [pn]  //将指针pn中存放的变量num的地址放入ecx
011E141A  mov         edx,dword ptr [ecx]  //从变量num的地址中,以4字节方式读取数据,存入edx中
011E141C  push        edx
......//输出省略
cout<<hex<<static_cast<int>(*pc)<<endl;
011E1455  mov         esi,esp
011E1457  mov         eax,dword ptr [__imp_std::endl (11E82B0h)]
011E145C  push        eax
011E145D  mov         ecx,dword ptr [pc]
011E1460  movsx       edx,byte ptr [ecx]  //从变量num的地址中,以1字节方式读取数据(int的第一个字节),存入edx中
011E1463  mov         edi,esp
011E1465  push        edx
......//输出省略
cout<<hex<<static_cast<short>(*psn)<<endl;
011E149E  mov         esi,esp
011E14A0  mov         eax,dword ptr [__imp_std::endl (11E82B0h)]
011E14A5  push        eax
011E14A6  mov         edi,esp
011E14A8  mov         ecx,dword ptr [psn]
011E14AB  movzx       edx,word ptr [ecx]  //从变量num的地址中,以2字节方式读取数据(int的低2字节),存入edx中
011E14AE  push        edx
......//输出省略
cout<<hex<<static_cast<long long>(*pln)<<endl;
011E14E7  mov         esi,esp
011E14E9  mov         eax,dword ptr [__imp_std::endl (11E82B0h)]
011E14EE  push        eax
011E14EF  mov         edi,esp
011E14F1  mov         ecx,dword ptr [pln]  //这里存放的尽管依然是num的地址,但是num被强制转换为long long型,所以后面读取的是8字节的数据,但寄存器只能存放4字节数据,
                         //所以分两次读取。int4字节扩展到long long8字节,高4字节中的值是未知的
011E14F4  mov         edx,dword ptr [ecx+4]  //从num地址+4的地址中,以4字节方式读取数据(long long型的高4字节),放入edx中
011E14F7  push        edx
011E14F8  mov         eax,dword ptr [ecx]  //从num地址中,以4字节方式读取数据(long long型的低4字节),放入eax中
011E14FA  push        eax
......//输出省略


②各类型指针的寻址方式

指针的取内容操作分为两个步骤:先取指针中保存的地址,然后针对这个地址进行取内容,也就是一个间接寻址的过程,这也是识别指针的重要依据。

C++中,所有指针类型只支持加减法,其他运算对于指针而言没有意义。

指针加减用于地址偏移。指针加减1后,指针内保存的地址值并不一定加减1,具体的值取决于指针类型。

两指针相加没有意义,相减是计算两个地址之间的元素个数,结果为有符号整数,进行减法操作的两个指针必须是同类型指针相减。

C++代码

int main()
{
char num[8]={0x41,0x42,0x43,0x44,0x45,0x46,0x47,0x48};
int *pnum=(int *)num;
short *psnum=(short *)num;
char *pcnum=num;
long long *plnum=(long long *)num;

pnum+=1;
psnum+=1;
pcnum+=1;
plnum+=1;

cout<<hex<<static_cast<int>(*pnum)<<endl;
cout<<hex<<static_cast<short>(*psnum)<<endl;
cout<<hex<<static_cast<char>(*pcnum)<<endl;
cout<<hex<<static_cast<long long>(*plnum)<<endl;

system("pause");
return 0;
}


运行结果:

高高低低原则的结果

反汇编:

char num[8]={0x41,0x42,0x43,0x44,0x45,0x46,0x47,0x48};
004014D8  mov         byte ptr [ebp-10h],41h  //为数组元素赋初值。EBP-10H,即是数组首元素的地址,又是数组地址
004014DC  mov         byte ptr [ebp-0Fh],42h
004014E0  mov         byte ptr [ebp-0Eh],43h
004014E4  mov         byte ptr [ebp-0Dh],44h
004014E8  mov         byte ptr [ebp-0Ch],45h
004014EC  mov         byte ptr [ebp-0Bh],46h
004014F0  mov         byte ptr [ebp-0Ah],47h
004014F4  mov         byte ptr [ebp-9],48h
int *pnum=(int *)num;
004014F8  lea         eax,[ebp-10h]  //赋值都是数组首地址
004014FB  mov         dword ptr [ebp-1Ch],eax
short *psnum=(short *)num;
004014FE  lea         eax,[ebp-10h]
00401501  mov         dword ptr [ebp-28h],eax
char *pcnum=num;
00401504  lea         eax,[ebp-10h]
00401507  mov         dword ptr [ebp-34h],eax
long long *plnum=(long long *)num;
0040150A  lea         eax,[ebp-10h]
0040150D  mov         dword ptr [ebp-40h],eax

pnum+=1;
00401510  mov         eax,dword ptr [ebp-1Ch]  //将指针pnum内存放的地址放入eax(num的地址),然后num的地址+4(int),再放入pnum指针,此时指向索引为4的元素的地址
00401513  add         eax,4
00401516  mov         dword ptr [ebp-1Ch],eax
psnum+=1;
00401519  mov         eax,dword ptr [ebp-28h]  //将指针psnum内存放的地址放入eax(num的地址),然后num的地址+2(short),再放入psnum指针,此时指向索引为2元素的地址
0040151C  add         eax,2
0040151F  mov         dword ptr [ebp-28h],eax
pcnum+=1;
00401522  mov         eax,dword ptr [ebp-34h]  //将指针pcnum内存放的地址放入eax(num的地址),然后num的地址+1(char),再放入pcnum指针,此时指向索引为1的元素的地址
00401525  add         eax,1
00401528  mov         dword ptr [ebp-34h],eax
plnum+=1;
0040152B  mov         eax,dword ptr [ebp-40h]  //将指针plnum内存放的地址放入eax(num的地址),然后num的地址+8(long),再放入pcnum指针,此时指向最后一个元素的后面的地址
0040152E  add         eax,8
00401531  mov         dword ptr [ebp-40h],eax

cout<<hex<<static_cast<int>(*pnum)<<endl;
00401534  mov         esi,esp
00401536  mov         eax,dword ptr [__imp_std::endl (40A324h)]
0040153B  push        eax
0040153C  mov         edi,esp
0040153E  mov         ecx,dword ptr [ebp-1Ch]
00401541  mov         edx,dword ptr [ecx]  //读取的是第5个元素地址开始的4个字节
00401543  push        edx
......//省略输出
cout<<hex<<static_cast<short>(*psnum)<<endl;
0040157C  mov         esi,esp
0040157E  mov         eax,dword ptr [__imp_std::endl (40A324h)]
00401583  push        eax
00401584  mov         edi,esp
00401586  mov         ecx,dword ptr [ebp-28h]
00401589  movzx       edx,word ptr [ecx]  //读取的是第3个元素地址开始的2个字节
0040158C  push        edx
......//省略输出
cout<<hex<<static_cast<char>(*pcnum)<<endl;
004015C5  mov         esi,esp
004015C7  mov         eax,dword ptr [__imp_std::endl (40A324h)]
004015CC  push        eax
004015CD  mov         ecx,dword ptr [ebp-34h]
004015D0  movzx       edx,byte ptr [ecx]  //读取的是第2个元素地址开始的1个字节
004015D3  push        edx
......//省略输出
cout<<hex<<static_cast<long long>(*plnum)<<endl;
00401606  mov         esi,esp
00401608  mov         eax,dword ptr [__imp_std::endl (40A324h)]
0040160D  push        eax
0040160E  mov         edi,esp
00401610  mov         ecx,dword ptr [ebp-40h]
00401613  mov         edx,dword ptr [ecx+4]  //读取的是第8个元素后面的地址开始的8个字节,是未知的值。
00401616  push        edx
00401617  mov         eax,dword ptr [ecx]
00401619  push        eax
......//省略输出


......

二、引用

引用类型是变量的别名。C++为了简化指针操作,对指针操作进行了封装,产生了引用类型。实际上引用类型就是指针类型,只不过它用于存放地址的内存空间对使用者而言是隐藏的,通过编译器实现寻址,而指针需要手动寻址,其存储方式也是和指针一样,都是使用内存空间存放地址值。反汇编下,没有引用这种类型。

看一下引用类型作为函数参数,和指针完全一样。

C++代码

void add(int &b)
{
b++;
}
int main()
{
int a=1;
add(a);
cout<<a<<endl;

system("pause");
return 0;
}


运行结果:2

反汇编

int a=1;
00EF140E  mov         dword ptr [a],1
add(a);
00EF1415  lea         eax,[a]  //将变量a的地址放入eax
00EF1418  push        eax  //把a的地址放入堆栈,传递给add
00EF1419  call        add (0EF1154h)  //调用add函数
00EF141E  add         esp,4
......省略输出


add函数

b++;
00EF13CE  mov         eax,dword ptr [b]  //这里的b实际上是指向堆栈中变量a的地址,将b中存放的地址也就是变量a的地址放入eax,debug下,为了调试直观,直接用b表示了。
00EF13D1  mov         ecx,dword ptr [eax]  //将eax也就是变量a地址中的内容放入ecx,然后ecx+1,再放入变量a的地址中
00EF13D3  add         ecx,1
00EF13D6  mov         edx,dword ptr [b]  //将堆栈中变量a的地址放入edx
00EF13D9  mov         dword ptr [edx],ecx  //将ecx++后的值放入变量a的地址中。


.............

好好学习,天天向上!!!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: