7、操作系统管理硬件
回到 hello 程序的例子。当 shell 加载和运行 hello 程序时,当 hello 程序输出自己的消息时,程序没有直接访问键盘、显示器、磁盘或主存储器。取而代之的是,它们依靠操作系统提供的服务。
可以把操作系统看成是应用程序和硬件之间插入的一层软件,如下图所示:
所有应用程序对硬件的操作尝试都必须通过操作系统。
操作系统有两个基本功能:防止硬件被失控的应用程序滥用;在控制复杂而又通常广泛不同低级硬件设备方面,为应用程序提供简单一致的方法。
操作系统通过下图中显示的几个基本的抽象概念(进程、虚拟存储器和文件)实现这两个功能。文件是对I/O设备的抽象表示,虚拟存储器是对主存和 I/O 设备的抽象表示,进程则是对处理器、主存和 I/O 设备的抽象表示。
7.1 进程
像 hello 这样的程序在现代系统上运行时,操作系统会提供一种假象,好像系统上只有这个程序在运行。程序看上去是独占地使用处理器、主存和 I/O 设备,而处理器看上去就像不间断地一条接一条地执行程序中的指令。该程序的代码和数据就好像是系统存储器中唯一的对象。这些假象是通过进程的概念来实现的,进程是计算机科学中最重要和最成功的概念之一。
进程 是操作系统对运行程序的一种抽象。在一个系统上可同时运行多个进程,而每个进程都好像在独占地使用硬件。我们称之为并发执行,实际上是说一个进程的指令和另一个进程的指令是交错执行的。操作系统实现这种交错执行的机制称为上下文切换(context switching)。
操作系统保存进程运行所需的所有状态信息。这种状态,也就是上下文(context),包括许多信息,比如PC 和 寄存器文件的当前值,以及主存的内容。在任何一个时刻,系统上都只有一个进程正在运行。当操作系统决定从当前进程转移控制权到某个新进程时,它就会进行上下文切换,即保存当前进程的上下文、恢复新进程的上下文,然后将控制权转移到新进程。新进程就会从它上次停止的地方开始。下图展示了 hello 运行的基本场景。
示例场景中有两个同时运行的进程:shell 进程和 hello 进程。最开始,只有shell进程在运行,等待命令行上的输入。当我们让它运行 hello 程序时,shell 通过调用一个专门的函数,即 系统调用,来执行我们的请求,系统调用会将控制权传递给操作系统。操作系统保存shell进程的上下文,创建一个新的 hello 进程及其上下文,然后将控制权传给新的 hello 进程。在 hello 进程终止后,操作系统恢复shell进程的上下文,并将控制权传回给它,它会继续等待下一命令行输入。
7.2 线程
尽管通常我们认为一个进程只有单一的控制流,但是在现代操作系统中,一个进程实际上可以由多个称为线程的执行单元组成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。由于网络服务器中对并行处理的要求,线程成为越来越重要的编程模型,因为多线程之间比多进程之间更容易共享数据。
7.3 虚拟存储器
虚拟存储器是一个抽象概念,它为每个进程提供了一个假象,好像每个进程都在独占地使用主存。每个进程看到的存储器都是一致的,称之为虚拟地址空间。
下图所示的是 Linux 进程的虚拟地址空间(其他Unix系统的设计也与此类似)。
在 Linux 中,最上面的四分之一的地址空间是预留给操作系统中的代码和数据的,这对所有进程都一样。底部的四分之三的地址空间用来存放用户进程定义的代码和数据。请注意,图中的地址是从下往上增大的。
每个进程看到的虚拟地址空间由大量准确定义的区(area)构成,每个区都有专门的功能。先简单看看每个区,从最低的地址爱是,逐步向上研究是非常有益的。
- 程序代码和数据
代码是从同一固定地址开始,紧接着的是和 C 全局变量相对应的数据区。代码和数据区是由可执行目标文件直接初始化的,在示例中就是可执行文件 hello。
- 堆
代码和数据区后紧随着的是运行时堆。代码和数据区是在进程一旦开始运行时就被指定了大小的,与此不同,作为调用像 malloc 和 free 这样的 C 标准库函数的结果,堆可以在运行时动态地扩展和收缩。
- 共享库
在地址空间的中间附近是一块用来存放像 C 标准库和数学库这样 共享库 的代码和数据的区域。
- 栈
位于用户虚拟地址空间顶部的是栈,编译器用它实现函数调用。和堆一样,用户栈在程序执行期间可以动态地扩展和收缩。特别地,每次我们调用一个函数时,栈就会增长。每次我们从函数返回时,栈就会收缩。
- 内核虚拟存储器
内核是操作系统总是驻留在存储器中的部分。地址空间顶部的四分之一部分是为内核预留的。应用程序不允许读写这个区域的内容或直接调用内核代码定义的函数。
虚拟存储器的运作需要硬件和操作系统软件间的精密复杂的互相合作,包括对处理器生成的每个地址的硬件翻译。基本思想是把一个进程虚拟存储器的内容存储在磁盘上,然后用主存作为磁盘的高速缓存。
7.4 文件
文件只不过就是字节序列。每个 I/O 设备,包括磁盘、键盘、显示器,甚至网络,都可以被看成是文件。系统中的所有输入输出都是通过使用称为 Unix I/O 的一小组系统函数调用读写文件来实现的。
文件使得应用程序能够统一地看待系统中可能含有的所有各式各样的 I/O 设备。例如,处理磁盘文件内容的应用程序员可以非常幸福地无需了解具体的磁盘技术。进一步说,同一个程序可以在使用不同磁盘技术的不同系统上运行。
8、利用网络系统和其他系统通信
现代系统经常是通过网络和其他系统连接到一起的。从一个单独的系统来看,网络可被视为又一个 I/O 设备,如下图所示:
当系统从主存拷贝一串字符到网络适配器时,数据流经过网络到达另一台机器,而不是到达本地磁盘驱动器。相似地,系统可以读取从其他机器发送来的数据,并把数据拷贝到自己的主存。
随着像 Internet 这样的全球网络的出现,从一台主机拷贝信息到另外一台主机已经成为计算机系统最重要的用途之一。比如,像电子邮件、即时消息发送、万维网、FTP 和 telnet 这样的应用都是基于通过网络拷贝信息的功能的。
回到 hello 示例,可以使用 telnet 应用在一个远程主机上运行 hello 程序。
假设用本地主机上的 telnet 客户端连接远程主机上的 telnet 服务器。在登录到远程主机并运行shell后,远端的 shell 就在等待接收输入的命令。从这点上看,在远端运行 hello 程序包括如下入所示的五个基本步骤:
当我们在 telnet 客户端键入 “hello” 串并敲下回车键后,客户端软件就会将这个字符串发送到 telnet 的服务器。在 telnet 服务器从网络上接收到这个串后,会把它传递给远端 shell 程序。接下来,远端 shell 运行 hello 程序,并将输出行返回给 telnet 服务器。最后,telnet 服务器通过网络把输出串转发给 telnet 客户端,客户端就将输出串输出到我们的本地终端上。
9、小结
计算机系统是由硬件和系统软件组成的,它们共同协作以运行应用程序。计算机内部的信息被表示为一组组的位,它们依据不同的上下文又有不同的解释方式。程序被其他程序翻译成不同的形式,开始时是 ASCII 文本,然后被编译器和链接器翻译成二级制可执行文件。
处理器读取并解释放在主存里的二进制指令。因为计算机花费了大量的时间在存储器、I/O 设备和 CPU 寄存器之间拷贝数据,所以系统中的存储设备就被按层次排列,CPU 寄存器在顶部,接着是多层的硬件高速缓存存储器、DRAM 主存储器和磁盘存储器。在层次模型中位于更高层的存储设备比低层的存储设备要快,单位比特造价也更高。
操作系统内核是应用程序和硬件之间的媒介。它提供三个基本的抽象概念:文件是对 I/O 设备的抽象概念;虚拟存储器是对主存和磁盘的抽象概念;进程是处理器、主存和I/O设备的抽象概念。
最后,网络提供了计算机系统之间通信的手段。从某个系统的角度来看,网络就是一种 I/O 设备。