技术上来说,线程是操作系统能够操作运行的一组独立的指令运算流程;更具体地来说,它的意义如下。
对于开发者,独立于主程序运行的一个“程序”可以称为一个线程。更进一步来说,如果一个应用包含多个“程序”,这些“程序”能够被操作系统同时/独立的运行,我们会称它为多线程的应用。
这是如何实现的?
在理解线程的概念之前,我们需要先理解UNIX中的进程。一个进程在被系统创建后包含了如资源、程序执行状态等信息,具体如下:
- 自身的关键信息(进程ID,用户ID等)
- 环境变量
- 工作目录
- 程序指令
- CPU状态(寄存器,错误信息等)
- 内存分配情况(堆、栈等)
- 文件描述信息
- 信号行为
- 共享库
- 进程间通信的相关信息(消息队列,管道,信号量,共享内存等)
下图表示一个进程所拥有的的相关资源和信息。
线程是属于进程的一种资源,且使用进程的其他资源,能够被操作系统调度作为独立个体运行。为了完成上述功能,线程只持有一些能够使其正常运行的必要资源,包括
- 栈指针
- 寄存器
- 调度属性(策略、优先级等)
- 挂起和阻塞信号集
- 线程相关的数据
下图是拥有线程的进程所持有的资源示意图。
所以在UNIX系统中一个线程具备如下特点:
- 存在于进程内且使用该进程的资源
- 只要进程存在且系统支持,线程会拥有专属的控制流
- 只复制使其能够独立调度的必要资源,因此比较轻量化
- 可以和其他线程共享进程的资源
由于进程内的线程之间可以共享资源,所以:
- 一个线程对共享系统资源的操作(譬如关闭一个文件)会影响到其他线程
- 指向某个共享数据的两个指针的值会相等
- 多个线程对某个共享内存中的地址同时读/写是有可能发生的,因此需要开发者自己做好同步,避免出现意外结果