您的位置：首页 > 编程语言 > C语言/C++

C++应用程序性能优化笔记（一）——数据的存储区域

2011-10-27 22:41 225 查看

5种程序内存区：全局/静态数据区、常量数据区、代码区、栈、堆

全局/静态数据区存储全局变量、全局静态变量、局部静态变量。类的静态成员变量也存储在这个区域，且只有一份拷贝，所有对象共享。可以自己编程写个有静态成员变量的类，然后看看不同对象中这个变量的内存地址，是一样的。

常量数据区存储常量字符串，字符串常量存储的区域不可修改。printf()函数的格式串也是存储于这个区域。常量存储区是4字节对齐的。

全局/静态数据区和常量数据区是在程序编译阶段已分配好，整个程序运行过程中始终存在的。

代码区存储程序代码

栈存储自动变量或局部变量，函数参数等

堆是由用户程序控制的存储区，存储动态产生的数据，通过new或malloc获得的内存是堆得内存，堆上分配内存时按16个字节对齐

上面所述的几个区域，对于C++的对象模型同样适用。即，一个对象的存储位置和它声明的类型有关，声明为全局变量，则存储在全局/静态数据区，通过new来创建，则存储在堆区域。

内存对齐

内存对齐，即分配时按对齐字节数来分配，譬如用new申请5个int，占20个字节，但由于堆是按16个字节对齐的，所以这5个int实际占32个字节的内存。这种方式虽然浪费一些内存，但是CPU在对齐方式下运行比较快，所以有益于程序性能。另外，stuct、uninon和class在编译时也会对成员变量进行对齐处理。可以通过#pragma
pack()或者编译器的编译选项来控制它们的成员变量按多少字节对齐，或者关闭对齐。

一个比较有意思的例子来说明各种变量在内存中的位置：

#include <stdio.h>

#include <stdlib.h>

int nGlobal = 100;

int main( void )

{

       char *pLocalString1 = "LocalString1";

       const char *pLocalString2 = "LocalString2";

       static int nLocalStatic = 100;

       int nLocal = 1;

       const int nLocalConst = 20;

       int *pNew = new int [5];

       char *pMalloc = (char *)malloc(1);

       printf( "global variable:0x%x\n", &nGlobal );

       printf( "static variable:0x%x\n", &nLocalStatic );

       printf( "local expression1:0x%x\n", pLocalString1 );

       printf( "local expression2(const):0x%x\n", pLocalString2 );

       printf( "new:0x%x\n", pNew );

       printf( "malloc:0x%x\n", pMalloc );

       printf( "Local pointer(pNew):0x%x\n", &pNew );

       printf( "Local pointer(pLocalString2):0x%x\n", &pLocalString2 );

       printf( "Local pointer(pLocalString1):0x%x\n", &pLocalString1 );

       printf( "Local variable(nLocal):0x%x\n", &nLocal );

       printf( "Local pointer(pMalloc):0x%x\n", &pMalloc );

       printf( "Local const variable(nLocalConst):0x%x\n", &nLocalConst );

       return 0;

}

在我的机子上（XP pro，VC++6.0）运行结果：

global variable:0x425a30

static variable:0x425a34

local expression1:0x4231b4

local expression2(const):0x4231a4

new:0x3807a8

malloc:0x3807f0

Local pointer(pNew):0x12ff6c

Local pointer(pLocalString2):0x12ff78

Local pointer(pLocalString1):0x12ff7c

Local variable(nLocal):0x12ff74

Local pointer(pMalloc):0x12ff68

Local const variable(nLocalConst):0x12ff70

其他内容跟书上说的大同小异，但是变量间内存的位置跟书上不太一样，为了直观看一下，我自己画了一个示意图来显示各个变量存储位置间的关系。让我不解的是，关于堆，书上new得到的内存地址为0x372aa8，malloc得到的内存地址为0x372ac8，二者刚好差32个字节，也符合堆分配的16字节对齐机制。但是为什么我运行起来，两者间间隔72个字节呢？中间这40个字节用做什么了呢？而我机子上的int的的确确是4个字节啊！试了一下，如果pNew改成1~3个int，malloc得到的内存地址为0x3807e0，差56个字节，太奇怪了。内存碎片？

内存泄漏

堆上的内存相较于栈的一个优势是可以动态管理数据，链表就是一个例子。另外，栈的大小有限制（由编译器决定），而堆的大小一般只受限于系统有效的虚拟内存的大小，因此占用内存较多的对象和数据只能分配到堆上。但是堆上的内存容易引起内存泄漏。上面的程序中，main结束后，pNew和pMalloc会被自动释放，而它们指向的内存是堆上的，不会被自动释放，因此就造成内存泄漏。写程序中要养成好习惯，对内存回收要特别敏感。malloc要用free来释放，new要用delete来释放。。

上面讨论了堆和栈在大小、数据管理和内存安全方面的优劣，从效率角度来讲，栈的内存由系统自动分配，有相应的指令进行压栈出栈操作，所以效率比较高。而申请堆上的内存时，系统需要按一定算法寻找合适大小的空闲堆，并修改相应的维护链表，效率比较低。而且栈上分配的内存空间是连续的，不会产生内存碎片。而堆容易造成内存碎片，内存使用效率降低。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 存储性能优化 c++ 编译器 delete class

相关文章推荐

新的分享

章节导航