不知道你是否做过这样的小实验:将一个可执行文件的头部写入一些无效的数据,或者将一个根本不是可执行文件的大型文件的扩展名改为”.exe”,然后执行它(警告,请记得先保存好工作文件)。
文件不会如预期般那样执行,你会得到一个提示:”程序太大而无法装入到内存”。
为什么会有这样的提示,为什么操作系统部直接提示程序文件被损坏了?
因为在某种意义上,文件实际上并没有损坏。
一个 Win32 可执行文件包含了一个所谓的 “MZ” 头,接下来是一个 “PE” 头。如果 “PE” 头没有被找到,则操作系统加载器将尝试以 Win16 可执行文件格式来加载它,它由一个 “MZ” 头和一个 “NE” 头组成。
如果在 “MZ” 之后,”PE” 和 “NE” 这两个头都没有找到,则加载器会尝试以 MS-DOS 可重定向执行文件来执行它。如果连 “MZ” 头都没有找到,则加载器会以 MS-DOS 非可重定向执行文件(也叫做 “COM 格式”,因为这种情况是 CP/M.COM 文件的格式)来执行它。
如下图所示:
>> 请移步至 topomel.com 以查看图片 <<
如果你观察一下,你会发现,无论你在图表中走哪条路,你总会得到一些东西。没有一条所谓的 “程序损坏” 的退出路径。
但是 “程序太大而无法放入内存” 从何而来?
如果程序的头部已损坏,则头中的各种字段(例如指定程序所需内存量的字段)通常是无意义的值。加载程序看到一个需要 800KB 常规内存的 MS-DOS 可重定位程序,这就是 “内存不足” 错误提示的来源。
MS-DOS 不可重定位程序不包含有关内存要求的此类信息。加载不可重定位程序的规则只是将程序加载到单个 64KB 内存块中并对其进行设置。因此,没有 “MZ” 头但大小大于 64KB 的程序将不适合单个 64KB 块,从而导致 “内存不足” 的错误。
另外,有些朋友一定会问下面的问题,我来一一解答:
MZ
传奇人物 “Mark Zbikowski” 的首字母缩写。
NE
“New Executable”,那个时候 Windows 还是所谓的 “新人”
PE
“Portable Executable”,因为 Windows NT 的特性之一是它可移植到 x86 以外的架构。
LE
“Linear Executable”,由 OS/2 和 Windows 95 设备驱动程序使用。
总结
如果是开发应用程序,而不是操作系统,在一段数据一开始就被检测到是无效的,我们应该立即停止后续处理,给出错误提示,并崩溃退出。
容忍度:零。
最后
Raymond Chen的《The Old New Thing》是我非常喜欢的博客之一,里面有很多关于Windows的小知识,对于广大Windows平台开发者来说,确实十分有帮助。
本文来自:《Why does a corrupted binary sometimes result in “Program too big to fit in memory”?》