一、进程和线程
进程
程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至CPU,数据加载至内存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载指令、管理内存、管理I0的
当一个程序被运行,从磁盘加载这个程序的代码至内存,这时就开启了一个进程
进程就可以视为程序的一个实例。大部分程序可以同时运行多个实例进程(例如记事本、画图、浏览器等),也有的程序只能启动一个实例进程(例如网易云音乐、360安全卫士等)
线程
一个进程之内可以分为一到多个线程
一个线程就是一个指令流,将指令流中的一条条指令以一定的顺序交给 CPU执行
Java 中,线程作为最小调度单位,进程作为资源分配的最小单位。在windows 中进程是不活动的,只是作为线程的容器
二者对比
进程基本上相互独立的,而线程存在于进程内,是进程的一个子集进程拥有共享的资源,如内存空间等,供其内部的线程共享
进程间通信较为复杂
- 同一台计算机的进程通信称为IPC (Inter-process communication)
- 不同计算机之间的进程通信,需要通过网络,并遵守共同的协议,例如 HTTP
线程通信相对简单,因为它们共享进程内的内存,一个例子是多个线程可以访问同一个共享变量
线程更轻量,线程上下文切换成本一般上要比进程上下文切换低
二、并发和并行
并发
单核 cpu 下,线程实际还是 串行执行 的。操作系统中有一个组件叫做任务调度器,将 cpu 的时间片(windows 下时间片最小约为 15 毫秒分给不同的线程使用,只是由于 pu 在线程间(时间片很短)的切换非常快,人类感觉是 同时运行的 。总结为一句话就是: 微观串行,宏观并行,
一般会将这种 线程轮流使用 cPu 的做法称为并发,concurrent
并行
多核下,每个cpu都可以调度线程,这个时候就是并行
三、单核和多核下多线程
单核cpu即使开启了多线程,还是无法提高效率的,本质还是串行的
单核 cpu 下,多线程不能实际提高程序运行效率,只是为了能够在不同的任务之间切换,不同线程轮流使用cpu,不至于一个线程总占用 cpu,别的线程没法干活
多核cpu可以并行跑多个线程,但能否提高程序运行效率还是要分情况的
有些任务,经过精心设计,将任务拆分,并行执行,当然可以提高程序的运行效率。但不是所有计算任务都能拆分(参考后文的[阿姆达尔定律]),也不是所有任务都需要拆分,任务的目的如果不同,谈拆分和效率没啥意义
I0操作不占用 cpu! 只是我们一般拷贝文件使用的是[阻塞10],这时相当于线程虽然不用cpu,但需要一直等待IO结束,没能充分利用线程。所以才有[非阻塞IO]和[异步O]优化
四、创建和运行线程
法一:直接使用Thread
法二:继承runnable配合Thread
Thread代表线程
runnable代表要执行的任务(线程执行的代码)
jdk8以后还可以用lamda表达式来简化匿名内部类
法一法二小结
法三:FutureTask配合Thread
FutureTask能够接收Callable类型的参数,用来处理返回结果的情况
FutureTask也继承了runnable,所以可以跟runnable一样做任务对象,被thread来调用。还继承了future接口,可以返回参数。先了解就好,后面还会加深
五、查看进程
windows
任务管理器可以查看进程和线程数,也可以用来杀死进程
tasklist 查看进程
taskki11杀死进程
linux
ps -fe 查看所有进程
ps -fT -p<PID>查看某个进程(PID)的所有线程
kill 杀死进程
top 按大写H切换是否显示线程
top -H-p<PID>查看某个进程(PID)的所有线程
Java
jps命令查看所有Java进程
jstack<PID>查看某个Java进程(PID)的所有线程状态
jconsole来查看某个Java 进程中线程的运行情况 (是个图形界面)
六、线程的运行原理
栈与栈帧
比如mian方法运行创建栈帧,main调用a方法创建栈帧2进栈,a调用b,栈帧b进栈,运行完出栈b,然后a出,main栈帧再出,先进后出
如果是多线程是用不同的栈内存,所有栈帧都是不影响的
主要理解:线程之间的栈内存是相互独立的,每个线程又自己的栈内存。
线程的上下文切换
从使用cpu到不使用cpu就是一次上下文切换
垃圾回收也会,垃圾回收会暂停当前运行的所有线程,让垃圾回收线程去回收垃圾
频繁的切换上下文会影响性能,所有线程数不是越多越好,超过cpu核心数,在执行的时候就会切换上下文,在切换的时候,要把当前线程的栈帧顺序什么的,全部都记录起来。
怎么选择合适线程数后面会学,关注我的更新!
七、线程常见方法
1、start和run
start是用来启动线程,run是线程启动之后要执行的方法
在start之前线程是new状态,在start之后是runnable状态
2、Sleep
sleep后,线程状态从runnable编程timed waiting(阻塞)
其他线程可以用interrupt方法打断正在睡眠的线程,这时sleep方法会抛出interruptException
睡眠结束以后打断线程不一定立刻执行
TimeUnit来调用sleep比thread来调用好,因为有时间单位 可读性好
while(true)防止空转浪费cpu,所有可以配合sleep稍微休眠一下
3、yield
调用yield会让其他线程从running进入runnable就绪状态,然后调度其他线程
具体实现还是看任务调度器不一定礼让成功
4、join
如果调用方需要等待其他线程的结果返回,就需要同步,可以用join方法。
比如a线程要b线程执行结束,那a就join b线程,b线程结束后立马执行a
而且join可以带参数,有时效,如果等待超过这个时间就不会等待了。
5、interrupt
打断sleep、wait、join的线程(堵塞线程)
打断阻塞状态的线程,打断后打断标记会为false
打断正常运行的线程
打断完之后会到堵塞状态,然后把打断标记为真
八、主线程和守护线程
默认下java进程需要等待所有线程都运行结束,才结束。
守护线程,只要其他非守护线程运行结束,即使守护线程没运行完,也结束
常见:垃圾回收器就是守护线程
九、线程的状态(重点)
1、操作系统层面
初始状态:语言层面创建了线程对象,还没和操作系统关联
可运行状态:线程已经被创建(与操作系统线程关联),可以由cpu调度执行
运行状态:获取了CPU时间片运行中的状态(当cpu时间片用完又会回到可运行状态,造成线程上下文切换)
堵塞状态:调用堵塞api如bio读写文件,这个时候线程时间不会用到cpu,会导致上下文切换进入堵塞状态,等bio执行完毕,会由操作系统唤醒堵塞线程,转换成可运行状态
终止状态:线程执行完毕,生命周期结束
2、Java的层面
thread内部枚举6种状态
new:线程刚创建,但是没调用start()方法
runnable:调用start()之后,Java api层面的runnable状态覆盖了操作系统层面的可运行状态和运行状态和堵塞状态
timed_waiting:有时限的等待,sleep之后就是这个状态
waiting:join之后等待,就是这个状态
blocked:拿不到锁,陷入这个状态
terminated:线程执行完毕,生命周期结束