进程是资源分配(内存地址、文件 I/O 等)的基本单位,线程是执行调度(处理器资源调度)的基本单位;
Loom 项目若成功为 Java 引入纤程(Fiber),则线程的执行调度单位可能变为纤程;
在 Java 里实现并发基本都是基于线程的;
文章目录
- 1. 线程的实现
- 2. Java 线程调度
- 3. 状态转换
1. 线程的实现
Java 语言提供了不同硬件和操作系统平台下对线程操作的统一处理;每个调用过 start() 且还未结束的 java.lang.Thread 类的实例代表一个线程;
Native 方法
,没有使用或无法使用平台无关的手段来实现,或者为了执行效率使用 Native 方法;
线程实现的三种方式
内核线程
实现(1:1 实现),(Kernel-Level Thread
,KLT),直接由操作系统内核支持的线程;由内核完成线程切换,内核通过调度器(Scheduler)进行线程调度,并将线程任务映射到各个处理器上;(支持多线程的内核称为多线程内核);轻量级进程
(Light Weight Process
,LWP),内核线程的高级接口,通常意义上的线程,每个轻量级进程由一个内核线程支持;
局限性:每个线程操作(创建、析构、同步)都需要进行系统调用
,需要在用户态和内核态之间来回切换,代价较高;消耗一定的内核资源(内核线程的占空间),系统支持轻量级进程的数量是有限的
;
用户线程
实现(1:N 实现),(User Thread
,UT),广义上的用户线程指所有非内核线程的线程;狭义上的用户线程指完全建立在用户空间的线程库上,系统内核不能感知到存在和如何实现的线程;
若程序实现得当,用户线程不需要切换到内核态,操作可以非常快速且低消耗,能支持规模更大的线程数量(如部分高性能数据库中的多线程);
局限性:没有系统内核的支援,所有线程操作(创建、销毁、切换、调度)都需要用户程序自己处理,阻塞处理、线程映射到处理器等问题的处理非常复杂,导致用户线程的视线通常比较复杂;
除了有明确需求(不支持多线程的操作系统下的多线程程序),一般应用程序不倾向使用用户线程,Java、Ruby 等语言都曾经使用并弃用用户线程;但近年来一些以高并发为买点的新语言(Golang、Erlang 等)又普遍支持了用户线程;
混合实现
(N:M 实现),将内核线程与用户线程一起使用的实现方式(UNIX 系列系统如 Solaris、HP-UX 等提供了混合线程模型);
用户线程建立在用户空间,线程的创建、切换、析构等操作廉价,可支持大规模的用户线程并发;
操作系统支持的轻量级进程作为用户线程和内核线程的桥梁,可以使用内核的线程调度及处理器映射,大大降低了整个进程被阻塞的风险;
Java 线程的实现
JDK 1.2 以前的 Classic VM 是基于绿色线程
(Green Threads
)实现的;JDK 1.3 起,商用 JVM 的线程普遍以内核线程
实现;
HotSpot VM 的每一个线程直接映射到一个操作系统原生线程来实现,中间没有额外的间接结构,HotSpot 不会去干涉线程调度(可设置线程优先级给操作系统提供调度建议;何时冻结、何时唤醒线程、给线程分配多少处理器执行时间、把线程安排给哪个处理器核心执行等,都是操作系统全权负责的);
两个例外
- Java ME 的 CLDC HotSpot Implementation(CLDC-HI)同时支持
用户线程
实现和混合模型
;当 Java 线程执行一个阻塞调用时,CLDC-HI 会为之单独开一个内核线程,然后调度执行其他 Java 线程; - Solaris 平台的 HotSpot VM 支持
内核线程
实现(通过 Bound threads 或 Alternate Libthread)和混合模式
(通过 LWP/Thread Based Synchronization),通过-XX:UseLWPSynchronization
(默认)和-XX:+UseBoundThreads
指定;
线程模型只对线程的并发规模和操作成本产生影响,对 Java 程序的编码和运行过程的差异是透明的;
2. Java 线程调度
-
线程调度
,系统为线程分配处理器使用权的过程,主要分为协同式(Cooperative Threads-Scheduling)线程调度和抢占式(Preemptive Threads-Scheduling)线程调度; -
协同式
(Cooperative Threads-Scheduling
)线程调度,线程的执行时间由线程本身控制,由线程主动通知系统切换到另外的线程(Lua 中的协同例程
);- 实现简单;
- 没有线程同步问题,切换操作对线程自己是可知的;
- 线程执行的时间不可控,可能会导致整个系统一直阻塞在一个线程中;
-
抢占式
(Preemptive Threads-Scheduling
)线程调度,每个线程由系统来分配执行时间,线程的切换不由线程本身决定(Java 的 Thread::yield 可以主动让出执行时间,但不能主动获取执行时间);- 不会有一个线程导致整个进程阻塞的问题;
- 即使进程出现问题,也不会影响到整个操作系统;
线程优先级可以给操作系统一些线程调度建议,但并不是一项稳定的调优手段;不同操作系统的不同优先级会变得相同,且系统可能自行改变优先级(根据现场执行频率);
3. 状态转换
Java 语言定义的 6 中线程状态
- 新建(New),创建后尚未启动的线程;
- 运行(Runnable),正在执行的线程、正在等待操作系统为它分配执行时间的线程(包括操作系统线程状态中的 Running 和 Ready);
- 无限期等待(Waiting),等待被其他线程显示唤醒的线程,该线程不会被操作系统分配处理器时间;
- Object::wait(),没有设置 timeout 参数;
- Thread::join(),没有设置 timeout 参数;
- LockSupport::park();
- 限期等待(Timed Waiting),在一定时间后自动由系统唤醒,该线程不会被操作系统分配处理器时间;
- Thread::sleep();
- Object::wait(),设置了 timeout;
- Thread::join(),设置了 timeout;
- LockSupport::parkNanos();
- LockSupport::parkUntil();
- 阻塞(Blocked),线程被阻塞,在等待获得一个排它锁(在另一个县城放弃这个锁时发生);程序在等待进入一个同步区域;
- 结束(Terminated),已终止的线程;线程已经结束执行;
上一篇:「JVM 高效并发」Java 内存模型
PS:感谢每一位志同道合者的阅读,欢迎关注、评论、赞!
参考资料:
- [1]《深入理解 Java 虚拟机》