并发和并行
在聊进程和线程的概念之前,首先了解一下操作系统相关概念,大部分操作系统(如Windos、Linux)的任务调度是采用时间片轮转的抢占式调度方式,也就是一个任务执行一小段时间后强制暂停去执行下一个任务,每个任务轮流执行。任务执行的一小段时间叫做时间片,任务正在执行时的状态叫运行状态,任务的时间片用完会被强制暂停去执行下一个任务,被暂停的任务就处于就绪状态等待下一个属于它的时间片到来。这样每个任务都能得到执行,由于CPU的执行效率非常高,时间片非常短,在各个任务之间快速切换,给人的感觉就是多个任务在
“同时进行”,这就是我们所说的并发。
当然,这是对于单核CPU来说,现在大多数计算机都是多核的,在核与核之间是并行运行的,相互之间不影响,在任意时刻,可以同时有多个任务同时运行在多核CPU上,但是对于每一个CPU内部,还是以抢占时间片的方式并发执行:
CPU、操作系统、内存、硬盘、程序的概念
-
计算机的核心是CPU,它承担了所有的计算任务。
-
操作系统是计算机的管理者,它负责任务的调度、资源的分配和管理,统领整个计算机硬件。
-
内存用于暂时存放CPU中的运算数据,与硬盘等外部存储器交换的数据。内存存储的数据断电不可保存。它是外存和CPU进行沟通的桥梁。电脑中所有运行的程序都在内存中进行,内存性能的强弱会直接影响电脑整体性能的发挥。只要电脑开始工作,操作系统就会把需要运算的数据,从内存中调到CPU中进行计算。当运算完成,CPU将结果传输出来。内存的好坏决定计算机整体运行的快慢。
-
硬盘是计算机中负责存储数据的设备,断电后依然可以保存。
-
程序是一组由编程语言编写的,用于操作计算机的指令,运行于操作系统之上。
内存之所以快,是因为内存是Random Access Memory,即随机访问存储器。也就是无论数据在内存中的哪个位置,都可以以O(1)的时间复杂度,直接访问,访问速度都是一样的。这就导致了内存的读写非常快,
而这么快是有代价的:内存每一个存储单元都是由一个电容和一个晶体管组成的。电容存储电荷,晶体管控制是否可以从电容读取或写入电荷。电荷的存在与否对应了二进制的0和1。问题在于,电容会自然地漏电,所以它们需要不断地被刷新(重新充电)来保持存储的数据。当断电时,这个刷新过程就会停止,电容很快就会漏光电荷,存储的数据也就随之丢失。
所以内存断电会丢失数据。
而硬盘不支持随机访问,而且读写速度也比内存慢,但是硬盘中的数据可以永久保存。
进程和线程的概念
进程
进程是程序的一次执行过程。
进程是操作系统进行资源分配和调度的一个独立单位。
进程具有的特征:
- 动态性,从程序执行开始到程序结束执行,进程是有声明周期的,在动态变化的。
- 并发性,任何进程都可以和其他进程并发执行。
- 独立性,进程是操作系统资源分配和调度的独立单位。
- 结构性,进程有程序、数据和进程控制块三部分组成。
进程是能拥有资源和独立运行的最小单位,每个进程有各自独立的内存,使得各个进程之间的内存地址相互隔离。
线程
线程是程序执行的最小单位。
任务调度采用的是时间片轮转的抢占式调度方式,线程CPU调度和分派的最小单位。
- 进程是操作系统进行资源分配最小单位。
- 线程是线程CPU调度和运行的最小单位。
一个进程可以拥有多个线程,各个线程共享进程内存空间。
真正去抢占CPU时间片,得到CPU时间片并运行的是线程。
线程的生命周期
以Java为例,Java中线程有六大状态:
public enum State {
NEW,
RUNNABLE,
BLOCKED,
WAITING,
TIMED_WAITING,
TERMINATED
}
wait,join操作都会释放锁,所以结束后不会里面进入Runnable状态,而是去获取锁,如果获取到就马上进入Runnable状态。
sleep操作不会释放锁,所以结束后可以直接进入Runnable状态
进程与线程的区别
- 进程是操作系统分配资源的最小单位。
- 线程是程序执行的最小单位。
一个进程由一个或多个线程组成,线程是一个进程中的代码的不同执行路线。
进程之间相互独立,但同一进程下的各个线程共享程序的内存空间(代码、数据集、堆等)。
真正在CPU执行和切换的是线程。
总之,线程和进程都是一种抽象的概念,线程是一种比进程更小的抽象,线程和进程都可以用于实现并发
为什么要让线程作为CPU调度和分派的最小单位?
调度和切换:线程上下文切换比进程上下文切换快得多。
程序:程序是一组由编程语言编写,计算机能够识别和执行的指令。
当程序由操作系统将其加载到内存并开始执行时,它就成为一个进程。
进程:进程是一个具有一定独立功能的程序在一个数据集合上依次动态执行的过程。
进程的创建、切换与销毁存在较大的时空开销,因此,线程的概念开始出现,线程被设计成为进程的一个执行路径,同一个进程的线程共享进程的资源,系统对线程的调度成本远远小于进程。
程序、进程、线程之间的关系:
进程和线程的区别总结:
- 本质区别:进程是操作系统资源分配的基本单位,而线程是处理器任务调度和执行的基本单位。
- 包含关系: 一个进程至少有一个线程,线程是进程的一部分,所以线程也被称为轻权进程或者轻量级进程。
- 资源开销: 每个进程都有独立的地址空间,进程之间的切换会有较大的开销;线程可以看做轻量级的进程,同一个进程内的线程共享进程的地址空间,每个线程都有自己独立的运行栈和程序计数器,线程之间切换的开销小。
- 影响关系: 一个进程崩溃后,在保护模式下其他进程不会被影响,但是一个线程崩溃可能导致整个进程被操作系统杀掉,所以多进程要比多线程健壮。