一. 并发和并行
操作系统扫盲:
1. 对于单核cpu而言(不管单核单线程也好,单核多线程也罢),同一时间只能干一件事!!为了看起像可以“同时干多件事”,windows操作系统把cpu的时间划分为长短基本相同的时间区间,即“时间片”,通过操作系统的管理,把这些时间片依次轮流分配给各个应用使用。
2. 操作系统时间片的使用规则:某个作业在cpu分配给它的时间片结束时,整个任务并没完成,那么该作业只能被暂停下来,等待下一轮循环再继续做。由于cpu处理速度非常快,所以只要时间片间隔划分得当,当一个用户作业从用完分配给它的时间片到获得下一个时间片,中间有些许“停顿”,用户是觉察不出来的。
3. 所以在单核cpu中,我们看似可以“同时干很多事”,其实是通过时间片切换技术,并发完成的。 比如在单核cpu下,我们依旧可以一边听歌,一边打游戏,这都是时间片切换技术,让我们觉得是是同时在进行。
1. 并发的概念
在操作系统中,是指一个时间段中有几个程序都处于已启动运行 至 运行完毕 之间,且这几个程序都是在同一个处理机上运行。(concurrency)
类别前面提到的时间片分时调度,听歌和打游戏两件事在同一个时间段在同一台电脑上完成了从开始到结束的动作,那么我们就可以说听歌和打游戏是并发的。
2. 并行的概念
指多CPU核心的时候,一个cpu核心在执行一个任务的同时,其他cpu核心可以执行其它任务,多个任务之间互相不抢占cpu资源能同时进行,这种方式称之为并行(Parallel)。
PS: 决定并行的因素不是cpu的数量,而是cpu的核心数量,比如一个cpu多个核也可以并行,单核cpu不存在并行的一说。
单核多线程的cpu同一时间点还是能只能干一件事,只不过比单核单线程效率要高,所以单核多线程也不存在并行一说。
举例:两个人分别在自己的电脑上听歌、打游戏,这两个人之间就是并行的;但是单个人听歌和打游戏就是并发的。
3. 二者对比
并发是指在一段时间内宏观上多个程序"同时"运行,并行指的是同一个时刻,多个任务确实真的在同时运行。
(1). 并发是指多个事情,在同一个时间段内同时发生了;并行是指多个事情,在同一时间点上同时发生了。
(2). 并发的多个任务之间是互相抢占资源的,并行的多个任务之间是不互相抢占资源的。
(3). 并发不是并行。并行是让不同的代码片段同时在不同的物理处理器(或不同核心)上执行,并行的关键是同时做很多事情,而并发是指同时管理很多事情,这些事情可能只做了一半就被暂停去做别的事情了。在很多情况下,并发的效果比并行好,因为操作系统和硬件的总资源一般很少,但能支持系统同时做很多事情。
(4). 并发指宏观上看起来两个程序在同时运行,比如说在单核cpu上的多任务。但是从微观上看两个程序的指令是交织着运行的,你的指令之间穿插着我的指令,我的指令之间穿插着你的,在单个周期内只运行了一个指令。这种并发并不能提高计算机的性能,只能提高效率。
并行指严格物理意义上的同时运行,比如多核cpu,两个程序分别运行在两个核上,两者之间互不影响,单个周期内每个程序都运行了自己的指令,也就是运行了两条指令。这样说来并行的确提高了计算机的效率。所以现在的cpu都是往多核方面发展。
(5). 并行的事件或活动一定是并发的,但反之并发的事件或活动未必是并行的。并行性是并发性的特例,而并发性是并行性的扩展。(谨慎理解)
C/C++Linux服务器开发高级架构师/C++后台开发架构师免费学习地址
【文章福利】另外还整理一些C++后台开发架构师 相关学习资料,面试题,教学视频,以及学习路线图,免费分享有需要的可以点击领取
4. 图文案例
(1). 咖啡机和排队问题
(2). 地鼠搬东西问题
5. 一个场景
在出入库系统中,比如出入库接口,如果没有加锁,或者其它措施,在高并发的情况下会引起数据错误。这里的前提是高并发(这里是宏观意义上的高并发),大量的http请求进入出入库接口,导致查询出来的数据出错。
二. 异步、多线程、并行
1. 案例场景
作为一个北漂,准备结束北漂生涯,谋划如何搬家。其余家当都变买了,就剩下有一辆小轿车,和一辆摩托车需要带回家。
(1). 阻塞式编程
先开其中一辆回去,再回来开另一辆车回去。
(2). 传统异步式编程
摩托车办理快递,我开汽车回去。注意,快递公司派件(回调)时我不一定已经开车到家,如果必须本人签收,就比较麻烦了。----此种通过回调进行异步编程的方式,没法编写符合思维顺序的代码。
(3). 基于多线程的异步编程
我获得了瞬间移动的超能力(cpu计算速度提升),以毫秒级的速度在汽车与摩托车之间切换驾驶。汽车(主线程)上有车载电话,可以使用处理其它事情。----期间频繁的上下文切换,会造成额外的损耗,造成反应能力比较差,只能开到60迈。
(4). 并行编程
我获得了分身的超能力(多核cpu的出现),两个我同时开两辆车回家。----充分发挥了cpu的能力,没有额外切换上下文的损耗,精力充沛,在120的时速狂飙。
2. 异步 和 多线程
异步是让调用方法的主线程不需要等待完成,从而可以让主线程去其他事,异步通常是相对于同步而言的,异步和多线程并不是同等关系,异步是最终的目的,多线程是实现异步的一个手段而已,也就是说实现异步可以采用多线程技术或者交给另外的进程来处理。
这两个概念拿来对比也有点不合适,因为他们不是一个概念,多线程的目的还是为了实现异步,多线程应该是一种实现异步的手段,异步应该去跟同步比较才对。
三. 其它
1. 响应和吞吐
(1). 响应:表示应答的快慢。响应就像几乎装载不了东西,但速度飞快的赛车。
(2). 吞吐:表示处理数量的多少。吞吐就像速度很慢但能装载大量货物的卡车。
如:1个人搬运一次货物需要10s,2个人搬运一次货物仍需要10s。 时间就是响应,工作量就是吞吐。
2. 负载测试和压力测试
(1). 负载测试:为了获得系统正常工作时所能承受的最大负载,容量测试。模拟实际软件系统所承受的负载条件的系统负荷,通过不断增加模拟用户的数量,来观察不同负载下系统的响应和吞吐,系统所占用的资源。
(2). 压力测试:可以知道什么极限情况下系统会崩溃、系统是否具有自我恢复性,更多的是为了确定系统的稳定性。压力测试是在强负载下的测试,通过查看系统在峰值使用情况下的操作行为。压力测试是在极端情况下运行时测试应用稳定性,长时间运行。
3. 线程和进程
(1). 线程:是程序执行流的最小单位,是系统独立调度和分配cpu(独立运行)的基本单位。
(2). 进程:是资源分配的基本单位,一个进程包括至少一个线程。 所以 进程 >= 线程。
(3). 对比:
A. 线程与资源分配无关,它属于某一个进程,并与进程内的其他线程一起共享进程资源,进程内线程间的通信比进程间的通信更快,因为共享变量啊。
B. 每个进程都有自己的一套独立资源(数据),供期内所有的线程共享。
(4). 再次说明:
线程和进程的区别主要在于它们是不同的操作系统资源管理方式。进程有独立的地址空间,一个进程崩溃后,在保护模式的影响下不会对其他进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个线程死掉就等同于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。但对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。
线程是CPU独立运行和独立调度的基本单位(可以理解为一个进程中执行的代码片段)。
进程是资源分配的基本单位(进程是一块包含了某些资源的内存区域)。
进程和线程都是由操作系统所体会的程序运行的基本单元,系统利用该基本单元实现系统对应用的并发性。进程是线程的容器,真正完成代码执行的线程,而进程则作为线程的执行环境。一个程序至少包含一个进程,一个进程至少包含一个线程,一个进程中的所有线程共享当前进程所拥有的资源。
4. 同步和异步
同步和异步关注的是消息通信机制。
(1). 同步:调用某个方法的时候,需要等待拿到返回结果才能往后执行,就叫做同步。
(2). 异步: 调用发发出调用指令后就可以继续往后执行,不需要等待拿到返回结果,异步基本上都是通过回调来通知调用者。
PS:ajax就是典型的异步例子,当然可以把ajax改成同步的,这里改成同步的是指 客户端拿到服务器地址返回的data后,则可以继续往后执行代码,而不是要等待执行完回调中的业务哦。
5. 阻塞和非阻塞
所谓的阻塞和非阻塞是用来描述行为的,在没有任何特征的前提下,是没法判断一个函数是阻塞还是非阻塞的。
(1). 阻塞:在该动作或方法没有返回前,则不能进入下一行代码,则为阻塞。但如果你指的阻塞是程序级别或进程级别的,那么判断阻塞的标准将会被你的这个背景知识锁扩大; 扩大为:某一个线程,在某函数没有返回之前,不能执行下一步,则该函数为阻塞,但是该阻塞,其实应当是线程级别的阻塞,而非完全阻塞函数。
PS:阻塞式函数:其中一个线程调用的时候,别的线程都不能调用,叫做阻塞式函数。(函数中有lock锁)
(2). IO阻塞:根据不同的操作系统而言,windows下某人只允许一个写操作,如果文件句柄打开,则第三方无法删除与使用。
(3). 缓存阻塞:标准的针对业务的场景,为了达到即时一致性目的,也就是让Redis成为1写(master) N读(slave)的模式,类似MySql中单Master N slave的模式。
(4). 非阻塞:和阻塞相反,异步其实就是不阻塞当前线程,可以让代码继续执行下去。
原文链接:第三十一节:扫盲并发和并行、同步和异步、进程和线程、阻塞和非阻塞、响应和吞吐等 - Yaopengfei - 博客园