线程池执行任务的具体流程是怎样的?
ThreadPoolExecutor中提供了两种执行任务的方法:
- void execute(Runnable command)
- Future<?> submit(Runnable task)
实际上submit中最终还是调用的execute()方法,只不过会返回⼀个Future对象,用来获取任务执行结果:
execute(Runnable command)方法执行时会分为三步:
注意:提交⼀个Runnable时,不管当前线程池中的线程是否空闲,只要数量小于核心线程数就会创建新线程。
注意:ThreadPoolExecutor相当于是非公平的,比如队列满了之后提交的Runnable可能会比正在排队的Runnable先执行。
线程池的五种状态是如何流转的?
RUNNING
会接收新任务并且会处理队列中的任务
SHUTDOWN
不会接收新任务并且会处理队列中的任务
STOP
不会接收新任务并且不会处理队列中的任务,并且会中断在处理的任务(注意:⼀个任务能不能被中断得看任务本身)
TIDYING
所有任务都终止了,线程池中也没有线程了,这样线程池的状态就会转为TIDYING,⼀旦达到此状态,就会调用线程池的terminated()
TERMINATED
terminated()执行完之后就会转变为TERMINATED
这五种状态并不能任意转换,只会有以下几种转换情况
- RUNNING -> SHUTDOWN:手动调用shutdown()触发,或者线程池对象GC时会调用finalize()从而调用shutdown()
- (RUNNING or SHUTDOWN) ->STOP:调用shutdownNow()触发,如果先调shutdown()紧着调 shutdownNow(),就会发生SHUTDOWN-> STOP
- SHUTDOWN -> TIDYING:队列为空并且线程池中没有线程时自动转换
- STOP -> TIDYING:线程池中没有线程时自动转换(队列中可能还有任务)
- TIDYING ->TERMINATED:terminated()执行完后就会自动转换
线程池中的线程是如何关闭的?
Thread类提供了⼀个stop(),但是标记了@Deprecated,为什么不推荐用stop()方法来停掉线程呢?
因为stop()方法太粗暴了,⼀旦调用了stop(),就会直接停掉线程,但是调用的时候根本不知道线程刚刚在做什么,任务做到哪⼀步了,这是很危险的。
这⾥强调⼀点,stop()会释放线程占用的synchronized锁(不会自动释放ReentrantLock锁,这也是不建议用stop()的⼀个因素)。
所以,我们建议通过自定义⼀个变量,或者通过中断来停掉⼀个线程
线程池为什么⼀定得是阻塞队列?
而线程池中的线程在运行过程中,执行完创建线程时绑定的第⼀个任务后,就会不断的从队列中获取任务并执行,那么如果队列中没有任务了,线程为了不自然消亡,就会阻塞在获取队列任务时,等着队列中有任务过来就会拿到任务从e去执行任务。
通过这种方法能最终确保,线程池中能保留指定个数的核心线程数
某个线程在从队列获取任务时,会判断是否使用超时阻塞获取,我们可以认为非核心线程会poll(),核心线程会take(),非核心线程超过时间还没获取到任务后面就会自然消亡了。
线程发生异常,会被移出线程池吗?
答案是会的,那有没有可能核心线程数在执行任务时都出错了,导致所有核心线程都被移出了线程池?
在源码中,当执行任务时出现异常时,最终会执行processWorkerExit(),执行完这个方法后,当前线程也就自然消亡了,但是!processWorkerExit()方法中会额外再新增⼀个线程,这样就能维持住固定的核心线程数。
Tomcat是如何自定义线程池的?
Tomcat中用的线程池为org.apache.tomcat.util.threads.ThreadPoolExecutor,注意类名和JUC下的⼀样,但是包名不⼀样。
Tomcat会创建这个线程池:
注入传入的队列为TaskQueue,它的入队逻辑为:
特殊在:
- 入队时,如果线程池的线程个数等于最大线程池数才入队
- 入队时,如果线程池的线程个数小于最大线程池数,会返回false,表示入队失败
这样就控制了,Tomcat的这个线程池,在提交任务时:
- 仍然会先判断线程个数是否小于核心线程数,如果小于则创建线程
- 如果等于核心线程数,会入队,但是线程个数小于最大线程数会入队失败,从而会去创建线程
所以随着任务的提交,会优先创建线程,直到线程个数等于最大线程数才会入队。
当然其中有⼀个比较细的逻辑是:在提交任务时,如果正在处理的任务数小于线程池中的线程个数,那么也会直接入队,而不会去创建线程,也就是上面源码中getSubmittedCount的作用。
线程池的核心线程数、最大线程数该如何设置?我们都知道,线程池中有两个非常重要的参数:
- corePoolSize:核心线程数,表示线程池中的常驻线程的个数
- maximumPoolSize:最大线程数,表示线程池中能开辟的最大线程个数
那这两个参数该如何设置呢?
我们对线程池负责执行的任务分为三种情况:
- CPU密集型任务,比如找出1-1000000中的素数
- IO密集型任务,比如文件IO、⽹络IO
- 混合型任务
CPU密集型任务的特点时,线程在执行任务时会⼀直利用CPU,所以对于这种情况,就尽可能避免发生线程上下文切换。
线程在执行IO型任务时,可能大部分时间都阻塞在IO上,假如现在有10个CPU,如果我们只设置了10个线程来执行IO型任务,那么很有可能这10个线程都阻塞在了IO上,这样这10个CPU就都没活⼲了,所以,对于IO型任务,我们通常会设置线程数为:2*CPU核心数
总结,我们在工作中,对于:
- CPU密集型任务:CPU核心数+1,这样既能充分利用CPU,也不⾄于有太多的上下文切换成本
- IO型任务:建议压测,或者先用公式计算出⼀个理论值(理论值通常都比较小)
- 对于核心业务(访问频率高),可以把核心线程数设置为我们压测出来的结果,最大线程数可以等
于核心线程数,或者大⼀点点,比如我们压测时可能会发现500个线程最佳,但是600个线程时也还行,此时600就可以为最大线程数 - 对于非核心业务(访问频率不高),核心线程数可以比较小,避免操作系统去维护不必要的线程,最大线程数可以设置为我们计算或压测出来的结果