序
制定一个MS-DOS应用程序计划需要认真分析程序的大小。这种分析可以帮助程序员确定MS-DOS支持的两种程序风格中哪一种最适合该应用程序。.EXE程序结构为大型程序提供了好处,因为所有.EXE文件之前都有额外的512字节(或更多)的文件头。另一方面,以失去这些额外好处为代价,.COM程序结构不会使小型程序负担这些额外文件头字节的开销。因为.COM程序在被EXE2BIN转换之前一开始就是.EXE程序,并且在MS-DOS下应用程序编程的几个方面在使用的程序结构不同的情况下仍然相似,因此对于准备编写只有.COM程序的程序员来说,对.EXE结构的充分了解也是有益的。因此,我们将从讨论.EXE程序的结构和行为开始,然后看一下.COM程序和.EXE程序之间的区别,包括.COM程序结构和内容的限制。
exe程序
.EXE程序相比于.COM程序在应用程序设计方面有几个优势。
选择.EXE格式的考虑因素包括:
- 非常大的程序
- 多个段 覆盖区
- 段和远地址常量 长跳转
- 将程序升级到MS OS/2保护模式的可能性
.EXE格式的主要优势是由文件头提供的。最重要的是,文件头包含了使程序能够进行直接段地址引用的信息—这是程序要超出64KB以上才能满足的要求。
文件头还告诉MS-DOS程序需要多少内存。这些信息可以防止系统分配给程序不需要的内存—这在未来升级程序以有效运行在MS OS/2保护模式下的情况下是很重要的考虑因素。
在详细讨论.EXE程序结构之前,我们将看一下.EXE程序的行为。
截取自早期的微软档案
这张图片展示了一个.EXE程序在内存中的示例,当MS-DOS首次交给程序控制时。该图显示了微软首选的程序段排列方式。
在将控制权转移到.EXE程序之前,MS-DOS会初始化内存的各个区域以及微处理器的几个寄存器。以下讨论解释了在将控制权交给.EXE程序之前可以从MS-DOS期待的内容。
程序段标志psp
程序段标志(或者我也叫他前缀)(PSP)不是任何程序代码的直接结果。相反,这个特殊的256字节(16段)内存页是由MS-DOS在加载所有.EXE和.COM程序到内存时,在它们前面构建的。虽然PSP确实包含对新程序有用的几个字段,但它主要作为CP/M的遗留物存在 - 微软采用了PSP以便更轻松地将在CP/M环境下可用的大量程序移植到MS-DOS环境中。图4-2显示了组成PSP的字段。
PSP:0000H([旧热启动])PSP以8086系列INT 20H指令开始,程序可以使用该指令将控制权传回MS-DOS。PSP在偏移00H处包含此指令,因为在CP/M下,这个地址是WBOOT(热启动/终止),而CP/M程序通常通过跳转到该中断来终止。这种终止方法不应在新程序中使用。请参见下面的终止.EXE程序。
PSP:0002H(分配给程序的最后一个段的地址)MS-DOS在PSP的偏移02H引入了一个字。它包含已分配给程序的内存块后的段地址。这个地址应该仅用于确定分配给程序的内存块的大小或结束位置;它不应被视为程序可以占用的自由内存的指针。在大多数情况下,这个地址不会指向空闲内存,因为任何空闲内存都已经被分配。
这张图片是微软msdos4时期的
除非使用/CPARMAXALLOC开关链接程序,否则程序不会被分配到指定的内存。即使使用了/CPARMAXALLOC,MS-DOS可能会将程序安装到与程序需求一样大的内存块中。行为正常的程序应该只通过提供的MS-DOS功能调用来获取额外的内存。PSP:0005H(MS-DOS功能调用[旧bios中断)偏移05H也是从CP/M中遗传下来的。这个位置包含一个8086系列的远程(段间)调用指令,用于调用MS-DOS的功能请求处理程序。(在CP/M中,这个地址是操作系统中断,用于类似的目的。)这个向量不应该在新程序中用于调用MS-DOS。MS-DOS仅提供这个中断以支持CP/M风格的程序,因此只能通过它支持CP/M风格的功能(00-24H)。
PS13:000AH-0015H(22H、231I和24H中断向量保留)MS-DOS使用偏移OAH到15H来保存三个特定程序的中断的内容。MS-DOS必须保存这些,因为它允许任何程序通过一个MS-DOS功能调用执行另一个程序(称为子进程),当被调用的程序终止时返回控制给原始程序。因为当子程序终止时原始程序会恢复执行,所以MS-DOS必须为原始程序还原这三个中断,以防被调用的程序改变了它们。涉及的三个向量包括程序终止处理程序(中断22H)、Control-C/Control-Break处理程序(中断23H)和关键错误处理程序(中断2411)。MS-DOS将这些的原始执行内容保存在子程序的PSI’中,从偏移0A开始为程序结束处理程序、OM为Control-C/Control-Break处理程序,12H为关键错误处理程序。
PSP:002C1-1(环境段地址)在MS-DOS 2.0及更高版本中,偏移2CH处的字包含了程序所能找到的PSP中最有用的一部分信息——MS-DOS环境的第一个段地址。这个指针使程序能够通过环境搜索任意由用户使用SET命令放置在那里的配置或目录搜索路径字符串.
PSP008011默认的 DTA 位于 PSP 的整个后半部分(128 字节)。MS-DOS 将内存中的这一区域用作程序使用 FCB 风格文件访问函数时的默认记录缓冲区。再次,MS-DOS 是从 CP/M 继承了这个位置。(MS-DOS 提供一个程序可调用以更改 MS-DOS 将用作当前 DTA 的地址的功能。请参阅微软的参考之南《系统调用:中断 211:函数 1ah》。)因为默认 DTA 在程序执行需要它的文件操作之前没有任何作用,所以 MS-DOS 将命令尾置于此供程序检查。命令尾包括用户执行程序时在程序名称之后输入的任何文本。通常,ASCII 空格(20H)是命令尾中的第一个字符,但 MS-DOS 认识的任何分隔符都可以占据此位置。MS-DOS 从偏移量 81H 开始存储命令尾文本,并始终在文本末尾放置一个 ASCII 回车(ODH)。为了提供额外帮助,它在偏移量 80H 处放置了命令尾的长度。这个长度包括最后的 ODH 之外的所有字符。例如,命令行:
c:》DOIT ASS V CAN
然后你再doit对应psp:80h的地方就有
0A 20 41 53 53 20 56 20 43 41 4E 0c
长度 空格 a s s 空格 v 空格 c a n 长度
(去掉最后一个字节的) (总长度,含自身)
- 未完待续