.COM文件结构及原理
2012-12-24 20:48
211 查看
.COM文件结构及原理
com文件结构比较简单,它包含程序的一个绝对映像,即为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映像从文件直接复制到内存,从而加载com程序,而不做任何改变。
为加载一个com程序,MS-DOS首先试图分配内存,因为com程序必须位于一个64KB的段中,所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)。如果MS-DOS不能为程序、一个PSP、一个起始堆栈分配足够的内存,则分配尝试失败。否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使com程序本身不能大于64KB。在试图运行另一个程序或分配另外的内存之前,大部分com程序释放任何不需要的内存。
分配内存后,MS-DOS在该内存的前256B建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00H,否则置位0FFH。MS-DOS还置AH为00或0FFH,这依赖于第二个FCB是否含有一个有效驱动器标识符。建造PSP后,MS-DOS在PSP后立即开始(偏移100H)加载com文件,它置SS、DS和ES为PSP的段地址,接着创建一个堆栈。为创建这个堆栈,在已分配了至少64KB内存的情况下,MS-DOS置SP为0000H;否则它置寄存器比所分配的自己总数大2的值。最后,将0000H进栈(这是为了保证与在早期MS-DOS版本上设计的程序的兼容性)。
MS-DOS通过把控制传递给偏移100H处的指令而启动程序。程序设计者必须保证COM文件的第一条指令是程序的入口点。
注意:因为程序是在偏移100H处加载,因此所有代码和数据偏移也必须相对于100H。汇编语言程序设计者可通过设置程序的初值为100H而保证这一点(例如通过在源程序的开始使用语句org 100h)。
========================================
以上是网上流传的COM文件的说明。总体来说比较简单,就是分配64K内存,即程序只有一个段,然后头256B字节设置为PSP(Program Segment Prefix,MS-DOS描述加载的程序的一个数据结构,详细解释见wikipedia),然后把整个COM文件加载到256B(100h)后面。设置CPU的段寄存器均为该段的基址,并IP调到100h处开始执行程序。
但是,这里有一个问题,就是栈。
究竟是栈在COM的前面,即 | PSP | STACK | COM | ?
还是栈在COM的后面,即| PSP | COM | STACK | ?
还是栈就是PSP,只不过从PSP的末尾开始使用(栈使用是从高地址到低的),即 | PSP or STACK | COM | ?
还是PSP并不包含在段中,栈下来接着是COM,即 ( PSP ) | STACK | COM | ?
========================================
以下是论坛中,zara的回答:
这个问题,其实很简单,debug 加载个 com 文件,r 命令看看 ds 及 cs 和 ss:sp 就是了,会发现 cs = ds = ss = psp 而 sp=fffe 。所以,stack 是在 com 所在 64KB 段的最后,这也是上面资料第二段开头那句“所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)”的由来,虽然通常堆栈并不需要到 256B 这么大。
======================================
在一个64K的段内存内,是整个COM文件的镜像,先是256B的PSP,然后是代码和数据。因为cs=ds=ss 所以堆栈在最后。即 |PSP|COM|STACK| 的结构。貌似堆栈可以不止256B大小,反正没有限制,覆盖到代码的区域,知道程序正常退出或出错为止。
com文件结构比较简单,它包含程序的一个绝对映像,即为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映像从文件直接复制到内存,从而加载com程序,而不做任何改变。
为加载一个com程序,MS-DOS首先试图分配内存,因为com程序必须位于一个64KB的段中,所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)。如果MS-DOS不能为程序、一个PSP、一个起始堆栈分配足够的内存,则分配尝试失败。否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使com程序本身不能大于64KB。在试图运行另一个程序或分配另外的内存之前,大部分com程序释放任何不需要的内存。
分配内存后,MS-DOS在该内存的前256B建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00H,否则置位0FFH。MS-DOS还置AH为00或0FFH,这依赖于第二个FCB是否含有一个有效驱动器标识符。建造PSP后,MS-DOS在PSP后立即开始(偏移100H)加载com文件,它置SS、DS和ES为PSP的段地址,接着创建一个堆栈。为创建这个堆栈,在已分配了至少64KB内存的情况下,MS-DOS置SP为0000H;否则它置寄存器比所分配的自己总数大2的值。最后,将0000H进栈(这是为了保证与在早期MS-DOS版本上设计的程序的兼容性)。
MS-DOS通过把控制传递给偏移100H处的指令而启动程序。程序设计者必须保证COM文件的第一条指令是程序的入口点。
注意:因为程序是在偏移100H处加载,因此所有代码和数据偏移也必须相对于100H。汇编语言程序设计者可通过设置程序的初值为100H而保证这一点(例如通过在源程序的开始使用语句org 100h)。
========================================
以上是网上流传的COM文件的说明。总体来说比较简单,就是分配64K内存,即程序只有一个段,然后头256B字节设置为PSP(Program Segment Prefix,MS-DOS描述加载的程序的一个数据结构,详细解释见wikipedia),然后把整个COM文件加载到256B(100h)后面。设置CPU的段寄存器均为该段的基址,并IP调到100h处开始执行程序。
但是,这里有一个问题,就是栈。
究竟是栈在COM的前面,即 | PSP | STACK | COM | ?
还是栈在COM的后面,即| PSP | COM | STACK | ?
还是栈就是PSP,只不过从PSP的末尾开始使用(栈使用是从高地址到低的),即 | PSP or STACK | COM | ?
还是PSP并不包含在段中,栈下来接着是COM,即 ( PSP ) | STACK | COM | ?
========================================
以下是论坛中,zara的回答:
这个问题,其实很简单,debug 加载个 com 文件,r 命令看看 ds 及 cs 和 ss:sp 就是了,会发现 cs = ds = ss = psp 而 sp=fffe 。所以,stack 是在 com 所在 64KB 段的最后,这也是上面资料第二段开头那句“所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)”的由来,虽然通常堆栈并不需要到 256B 这么大。
======================================
在一个64K的段内存内,是整个COM文件的镜像,先是256B的PSP,然后是代码和数据。因为cs=ds=ss 所以堆栈在最后。即 |PSP|COM|STACK| 的结构。貌似堆栈可以不止256B大小,反正没有限制,覆盖到代码的区域,知道程序正常退出或出错为止。
相关文章推荐
- 【编译原理之】Bison 源文件结构原理
- 转载:文件结构及原理
- exe文件结构及原理
- 2讲 html运行原理② html文件基本结构 html元素和属性
- com文件结构及原理
- 磁盘结构,原理,MBR,文件系统,分区,swap,加密,raid,配额
- GIF图片的文件储存结构和动画原理
- Android MultiDex实现原理以及Dex文件结构
- jquery 实现原理一:文件目录结构概览
- F2FS文件系统架构与原理分析(四)——F2FS的目录结构与目录哈希
- F2FS文件系统架构与原理分析(四)——F2FS的目录结构与目录哈希
- GIF图片的文件储存结构和动画原理
- QT UI 基础(二)编译原理及文件结构
- Treesaver 原理、文件功能结构
- com/exe文件结构及原理
- 【转】MP3文件原理及结构解析
- 韩顺平_php从入门到精通_视频教程_第2讲_html运行原理②_html文件基本结构_html元素和属性_学习笔记_源代码图解_PPT文档整理
- Manifest与exe.config文件原理与结构的分析
- EXE文件结构及原理
- com/exe文件结构及原理