【Golang 面试 - 基础题】每日 5 题（八）

✍个人博客：Pandaconda-CSDN博客
📣专栏地址：http://t.csdnimg.cn/UWz06

📚专栏简介：在这个专栏中，我将会分享 Golang 面试中常见的面试题给大家~
❤️如果有收获的话，欢迎点赞👍收藏📁，您的支持就是我创作的最大动力💪

36. Go Ma p 遍历为什么是无序的？

使用 range 多次遍历 map 时输出的 key 和 value 的顺序可能不同。这是 Go 语言的设计者们有意为之，旨在提示开发者们，Go 底层实现并不保证 map 遍历顺序稳定，请大家不要依赖 range 遍历结果顺序。

主要原因有 2 点：

map 在遍历时，并不是从固定的 0 号 bucket 开始遍历的，每次遍历，都会从一个随机值序号的 bucket，再从其中随机的 cell 开始遍历。
map 遍历时，是按序遍历 bucket，同时按需遍历 bucket 中和其 overflow bucket 中的 cell。但是 map 在扩容后，会发生 key 的搬迁，这造成原来落在一个 bucket 中的 key，搬迁后，有可能会落到其他 bucket 中了，从这个角度看，遍历 map 的结果就不可能是按照原来的顺序了。

map 本身是无序的，且遍历时顺序还会被随机化，如果想顺序遍历 map，需要对 map key 先排序，再按照 key 的顺序遍历 map。

func TestMapRange(t *testing.T) {
    m := map[int]string{1: "a", 2: "b", 3: "c"}
    t.Log("first range:")
    for i, v := range m {
        t.Logf("m[%v]=%v ", i, v)
    }
    t.Log("second range:")
    for i, v := range m {
        t.Logf("m[%v]=%v ", i, v)
    }

    // 实现有序遍历
    var sl []int
    // 把 key 单独取出放到切片
    for k := range m {
        sl = append(sl, k)
    }
    // 排序切片
    sort.Ints(sl)
    // 以切片中的 key 顺序遍历 map 就是有序的了
    for _, k := range sl {
        t.Log(k, m[k])
    }
}

37. G o Map 为什么是非线程安全的？

map 默认是并发不安全的，同时对 map 进行并发读写时，程序会 panic，原因如下：

Go 官方在经过了长时间的讨论后，认为 Go map 更应适配典型使用场景（不需要从多个 goroutine 中进行安全访问），而不是为了小部分情况（并发访问），导致大部分程序付出加锁代价（性能），决定了不支持。

场景: 2 个协程同时读和写，以下程序会出现致命错误：fatal error: concurrent map writes

package main

import (
    "fmt"
    "time"
)

func main() {
    s := make(map[int]int)
    for i := 0; i < 100; i++ {
        go func(i int) {
            s[i] = i
        }(i)
    }
    for i := 0; i < 100; i++ {
        go func(i int) {
            fmt.Printf("map第%d个元素值是%d", i, s[i])
        }(i)
    }
    time.Sleep(1 * time.Second)
}

如果想实现 map 线程安全，有两种方式：

1. 使用读写锁 map + sync.RWMutex

package main

import (
    "fmt"
    "sync"
    "time"
)

func main() {
    var lock sync.RWMutex
    s := make(map[int]int)
    for i := 0; i < 100; i++ {
        go func(i int) {
            lock.Lock()
            s[i] = i
            lock.Unlock()
        }(i)
    }
    for i := 0; i < 100; i++ {
        go func(i int) {
            lock.RLock()
            fmt.Printf("map第%d个元素值是%d
", i, s[i])
            lock.RUnlock()
        }(i)
    }
    time.Sleep(1 * time.Second)
}

2. 使用 Go 提供的 sync.Map

package main

import (
    "fmt"
    "sync"
    "time"
)

func main() {
    var m sync.Map
    for i := 0; i < 100; i++ {
        go func(i int) {
            m.Store(i, i)
        }(i)
    }
    for i := 0; i < 100; i++ {
        go func(i int) {
            v, ok := m.Load(i)
            fmt.Printf("Load: %v, %v
", v, ok)
        }(i)
    }
    time.Sleep(1 * time.Second)
}

38. G o map 和 sync.Map 谁的性能好，为什么？

Go 语言的 sync.Map 支持并发读写，采取 “空间换时间” 的机制，冗余了两个数据结构，分别是：read 和 dirty。

type Map struct {
   mu Mutex
   read atomic.Value // readOnly
   dirty map[interface{}]*entry
   misses int
}

对比原始 map：

和原始 map + RWLock 的实现并发的方式相比，减少了加锁对性能的影响。它做了一些优化：可以无锁访问 read map，而且会优先操作 read map，倘若只操作 read map 就可以满足要求，那就不用去操作 write map (dirty)，所以在某些特定场景中它发生锁竞争的频率会远远小于 map + RWLock 的实现方式。

优点：

适合读多写少的场景。

缺点：

写多的场景，会导致 read map 缓存失效，需要加锁，冲突变多，性能急剧下降。

39. 介绍一下 Channel

在 Go 语言中，Channel（通道）是用于多个 Goroutine 之间进行通信的一种机制，通过它们可以安全地传递数据。

Channel 是一种类型，可以使用内置的 make() 函数来创建它们。创建 Channel 时，需要指定它们可以传输的数据类型。

使用 Channel 时，可以在 Goroutine 之间传递数据，通过它们可以进行同步和异步的操作。在使用 Channel 时，需要注意以下几点：

Channel 是引用类型，可以像 Slice 和 Map 一样传递给函数。
默认情况下，Channel 是无缓冲的，只有当有 Goroutine 准备好接收数据时，发送操作才会成功。如果发送操作没有被接收，发送的 Goroutine 将会阻塞。
通过 make() 函数创建带缓冲的 Channel 时，可以指定缓冲区的大小。在缓冲区没有被填满之前，发送操作不会阻塞。
Channel 支持多路复用，可以使用 select 语句在多个 Channel 上进行选择和等待。
Channel 可以用于控制 Goroutine 的执行，例如通过关闭 Channel 来通知 Goroutine 退出。

使用 Channel 可以帮助解决并发编程中的一些常见问题，例如避免竞态条件、协调不同 Goroutine 之间的操作等。

40. Go channel 的底层实现原理？

概念：

Go 中的 channel 是一个队列，遵循先进先出的原则，负责协程之间的通信（Go 语言提倡不要通过共享内存来通信，而要通过通信来实现内存共享，CSP (Communicating Sequential Process) 并发模型，就是通过 goroutine 和 channel 来实现的）

使用场景：

停止信号监听
定时任务
生产方和消费方解耦
控制并发数

底层数据结构：

通过 var 声明或者 make 函数创建的 channel 变量是一个存储在函数栈帧上的指针，占用 8 个字节，指向堆上的 hchan 结构体。

源码包中 src/runtime/chan.go 定义了 hchan 的数据结构：

hchan 结构体：

type hchan struct {
 closed   uint32   // channel是否关闭的标志
 elemtype *_type   // channel中的元素类型
 // channel分为无缓冲和有缓冲两种。
 // 对于有缓冲的channel存储数据，使用了 ring buffer（环形缓冲区) 来缓存写入的数据，本质是循环数组
 // 为啥是循环数组？普通数组不行吗，普通数组容量固定更适合指定的空间，弹出元素时，普通数组需要全部都前移
 // 当下标超过数组容量后会回到第一个位置，所以需要有两个字段记录当前读和写的下标位置
 buf      unsafe.Pointer // 指向底层循环数组的指针（环形缓冲区）
 qcount   uint           // 循环数组中的元素数量
 dataqsiz uint           // 循环数组的长度
 elemsize uint16                 // 元素的大小
 sendx    uint           // 下一次写下标的位置
 recvx    uint           // 下一次读下标的位置

 // 尝试读取channel或向channel写入数据而被阻塞的goroutine
 recvq    waitq  // 读等待队列
 sendq    waitq  // 写等待队列
 lock mutex //互斥锁，保证读写channel时不存在并发竞争问题
}

等待队列：

双向链表，包含一个头结点和一个尾结点。

每个节点是一个 sudog 结构体变量，记录哪个协程在等待，等待的是哪个 channel，等待发送/接收的数据在哪里。

type waitq struct {
   first *sudog
   last  *sudog
}
type sudog struct {
    g *g
    next *sudog
    prev *sudog
    elem unsafe.Pointer
    c        *hchan
    ...
}

操作：

创建

使用 make(chan T, cap) 来创建 channel，make 语法会在编译时，转换为 makechan64 和 makechan。

func makechan64(t *chantype, size int64) *hchan {
    if int64(int(size)) != size {
        panic(plainError("makechan: size out of range"))
    }
    return makechan(t, int(size))
}

创建 channel 有两种，一种是带缓冲的 channel，一种是不带缓冲的 channel。

// 带缓冲
ch := make(chan int, 3)
// 不带缓冲
ch := make(chan int)

创建时会做一些检查:

元素大小不能超过 64K。
元素的对齐大小不能超过 maxAlign 也就是 8 字节。
计算出来的内存是否超过限制。

创建时的策略:

如果是无缓冲的 channel，会直接给 hchan 分配内存。
如果是有缓冲的 channel，并且元素不包含指针，那么会为 hchan 和底层数组分配一段连续的地址。
如果是有缓冲的 channel，并且元素包含指针，那么会为 hchan 和底层数组分别分配地址。

发送

发送操作，编译时转换为 runtime.chansend 函数。

func chansend(c *hchan, ep unsafe.Pointer, block bool, callerpc uintptr) bool

阻塞式：

调用 chansend 函数，并且 block = true。

ch <- 10

非阻塞式：

调用 chansend 函数，并且 block = false。

select {
    case ch <- 10:
    ...
  default
}

向 channel 中发送数据时大概分为两大块：检查和数据发送，数据发送流程如下：

如果 channel 的读等待队列存在接收者 goroutine
- 将数据直接发送给第一个等待的 goroutine， 唤醒接收的 goroutine。
如果 channel 的读等待队列不存在接收者 goroutine
- 如果循环数组 buf 未满，那么将会把数据发送到循环数组 buf 的队尾。
- 如果循环数组 buf 已满，这个时候就会走阻塞发送的流程，将当前 goroutine 加入写等待队列，并挂起等待唤醒。

接收

发送操作，编译时转换为runtime.chanrecv函数。

func chanrecv(c *hchan, ep unsafe.Pointer, block bool) (selected, received bool)

阻塞式：

调用 chanrecv 函数，并且 block = true。

<ch
v := <ch
v, ok := <ch
// 当channel关闭时，for循环会自动退出，无需主动监测channel是否关闭，可以防止读取已经关闭的channel,造成读到数据为通道所存储的数据类型的零值
for i := range ch {
    fmt.Println(i)
}

非阻塞式：

调用 chanrecv 函数，并且 block = false。

select {
    case <-ch:
    ...
  default
}

向 channel 中接收数据时大概分为两大块，检查和数据发送，而数据接收流程如下：

如果 channel 的写等待队列存在发送者 goroutine
- 如果是无缓冲 channel，直接从第一个发送者 goroutine 那里把数据拷贝给接收变量，唤醒发送的 goroutine。
- 如果是有缓冲 channel（已满），将循环数组 buf 的队首元素拷贝给接收变量，将第一个发送者 goroutine 的数据拷贝到 buf 循环数组队尾，唤醒发送的 goroutine。
如果 channel 的写等待队列不存在发送者 goroutine
- 如果循环数组 buf 非空，将循环数组 buf 的队首元素拷贝给接收变量。
- 如果循环数组 buf 为空，这个时候就会走阻塞接收的流程，将当前 goroutine 加入读等待队列，并挂起等待唤醒。

关闭

关闭操作，调用 close 函数，编译时转换为 runtime.closechan 函数。

close(ch)
func closechan(c *hchan)

案例分析：

package main
import (
    "fmt"
    "time"
    "unsafe"
)
func main() {
  // ch是长度为4的带缓冲的channel
  // 初始hchan结构体重的buf为空，sendx和recvx均为0
    ch := make(chan string, 4)
    fmt.Println(ch, unsafe.Sizeof(ch))
    go sendTask(ch)
    go receiveTask(ch)
    time.Sleep(1 * time.Second)
}
// G1是发送者
// 当G1向ch里发送数据时，首先会对buf加锁，然后将task存储的数据copy到buf中，然后sendx++，然后释放对buf的锁
func sendTask(ch chan string) {
    taskList := []string{"this", "is", "a", "demo"}
    for _, task := range taskList {
        ch <- task //发送任务到channel
    }
}
// G2是接收者
// 当G2消费ch的时候，会首先对buf加锁，然后将buf中的数据copy到task变量对应的内存里，然后recvx++,并释放锁
func receiveTask(ch chan string) {
    for {
        task := <-ch                  //接收任务
        fmt.Println("received", task) //处理任务
    }
}

总结 hchan 结构体的主要组成部分有四个：