写在前面
2007年,Go语言诞生于Google公司,2009年开源,2012年推出1.0版本,曾两次获得TIOBE年度语言。2012年起,全球大量的开源项目开始使用Go语言开发,目前Go语言已成为云计算领域事实上的标准语言,特别是在容器领域,诞生了一大批优秀的开源软件,如Docker,Kubernetes等。2017年区块链技术在国内大热,区块链两个大的技术平台以以太坊(Ethereum)和超级账本(Hyperledger)子项目Fabric都是基于Go语言构建的。Go语言的应用领域逐渐扩大,目前的区块链、云计算、中间件和服务器编程领域显现出明显的优势。Go语言最先在云计算盛行,随后大量的互联网初创企业将Go语言作为后台主要开发语言。目前,无论互联网公司的独角兽,还是BAT,都已将Go语言作为其技术栈的重要组成部分。市场对Go语言编程人才的需求量也在持续上升。所以今天聊聊Go语言的核心,并发。
什么是并发和并行
当前环境下,CPU的工艺制程已经实现了7nm商用。可以预测单颗CPU的性能已经很难有指数级的提升,未来多核是主要的发展方向。硬件对软件的影响显而易见,软件的并发和并行也是未来的发展方向。并发和并行是两个不同的概念,应用程序具备好的并发结构,操作系统才能更好地利用硬件并行执行,同时避免阻塞等待,合理的进行调度,提高CPU利用率。
- 并行意味着程序在任何时刻都是同时运行的,并行就是在任一粒度的时间内部具备同时执行的能力,具有瞬时性,在于执行。
- 并发意味着程序在单位时间内是同时运行的,并发实在规定时间内多个请求都能得到执行和处理,具有过程性,在于结构。
GoRoutine
操作系统本身可以进行线程和进程的调度,本身具备并发能力,但进程切换代价过于高昂,进程切换需要保存现场,耗费较多的时间。Go语言的并发思想就是让应用程序在用户层再构建一级调度,将并发的粒度进一步降低,以更大限度地提高程序运行的效率呢。
Go语言的并发执行体称为goroutine,routine的意思就是例程,所以goroutine叫go例程更合理,我还是习惯直接叫goroutine。
Go语言调度模型
CPU执行指令的速度是非常快的,大部分简单的指令执行仅需三分之一纳秒,即1s可以执行30亿条简单指令,这个速度已经非常快了,CPU慢在对外部数据的读/写上,外部I/O的速度慢和阻塞是导致CPU使用效率不高的最大原因。在真实的系统中,CPU从来不是瓶颈,而是大部分的时间都被浪费了,所以我们需要增加CPU的有效吞吐量,尽可能让每个CPU核心都有事情做,尽可能提高每个CPU做事的效率。
应用程序的并发模型是多样的,其中最高效的还是协程,Go的并发执行模型就是一种变种的协程模型。
MPG模型
Go语言天生支持并发,MPG模型是go语言的并发模型。
- G - Goroutine: Go运行时对goroutine的抽象描述,存放兵法执行的代码入口地址、上下文、运行环境、运行栈等执行相关的元信息。
- M - Machine:OS内核线程,是操作系统层面调度和执行的实体,负责执行。
- P - Processor:M运行G时所需要的资源,对资源的一种抽象和管理,P不是一段代码实体,而是一个管理的数据结构, P主要降低M管理调度G的复杂性,增加一个间接的控制层数据结构。
Goroutine特点
- 有独立的栈空间,共享程序堆空间
- 调度由用户控制,不能保证多个goroutine的执行顺序
- goroutine是一个轻量级的用户态的轻量级线程
- goroutine从主线程开启的,是轻量级的线程,是逻辑态,对资源消耗相对小
- goroutine可以轻松开启上万个线程。其他编程语言的并发机制是一般基于线程的,开启过多的线程,资源耗费大,这里更加可以体现出Go语言在并发上的优势了
Goroutine使用
普通函数启动goroutine
代码中使用time模块阻塞了主进程,等待所有goroutine执行完毕后再结束程序,但是这样我们并不知道goroutine何时执行完毕,即对时间的把控没有一个参考,在go语言中,sync提供多个Goroutine同步机制,主要通过WaitGroup实现。
package main
import (
"fmt"
"time"
)
// 计算1-100的和
func calc() {
total := 0
for i := 0; i <= 100; i++ {
total += i
}
fmt.Printf("%v", total)
}
func main() {
go calc()
// 阻塞主进程
time.Sleep(time.Second)
}
WaitGroup
sync包提供了多个Goroutine同步机制,主要通过WaitGroup实现。下面代码开启5个Goroutine,
package main
import (
"fmt"
"sync"
)
var wg sync.WaitGroup
// 计算1-100的和
func calc() {
// wg.Done()方法等价于 wg.Add(-1)
defer wg.Done()
total := 0
for i := 0; i <= 100; i++ {
total += i
}
fmt.Printf("%v\n", total)
}
func main() {
for i := 0; i < 5; i++ {
// 每启动一个Goroutine,同时给wg加1
wg.Add(1)
go calc()
}
// 等待所有Goroutine运行完成
wg.Wait()
}
Chan
chan是Go语言的一个关键字,是channel的简写,goroutine是Go语言里面的并发执行体,chan是goroutine之间通信和同步的重要组件。然而在Go语言提倡通过通信来共享内存。
通道分为无缓冲通道和有缓冲通道,无缓冲通道的len和cap都为0。无缓冲通道既可以用于通信,也可以用于两个Goroutine之间同步,有缓冲通道主要用于通信。
使用无缓冲通道实现Goroutine之间同步等待:
package main
import "fmt"
// 计算1-100的和
func calc(c chan bool) {
total := 0
for i := 0; i <= 100; i++ {
total += i
}
fmt.Printf("%v", total)
c <- true
}
func main() {
// 声明一个bool类型的无缓冲通道用来同步等待
c := make(chan bool)
go calc(c)
// 同步等待
<-c
}
总结
Goroutine的工作方式,就是多个协程在多个线程上切换,既可以用到多核,又可以减少切换开销。不需要研发过度参与,提高代码效率,在研发过程中继续探寻吧。。。