-
多核处理器(SMP)系统中, 每一个处理器都有一个本地高速缓存。内存系统必须保证高速缓存的一致性。当不同处理器上的线程修改驻留再同一高速缓存中的变量时就会发生假共享(false sharing),结果导致高速缓存无效,并强制更新,进而影响系统性能。
什么是假共享(false sharing)
假共享是 SMP 系统上的一种常见性能问题。在SMP系统中,每个处理器均有一个高速缓存。 当不同处理器上的线程修改驻留在同一高速缓存行(Cache Block,或Cache Line)中的变量时就会发生假共享。 这种现象之所以被称为假共享,是因为每个线程并非真正共享相同变量的访问权。 访问同一变量或真正共享要求编程式同步结构,以确保有序的数据访问。
线程 0 和线程 1 会用到不同变量,它们在内存中彼此相邻,并驻留在同一高速缓存块(Cache Block,或Cache Line)。 高速缓存行被加载到 CPU 0 和 CPU 1 的高速缓存中(灰色箭头)。 尽管这些线程修改的是不同变量(红色和蓝色箭头),高速缓存行(Cache Block,或Cache Line)仍会无效,并强制内存更新以维持高速缓存的一致性,这会降低应用性能
避免False Sharing
简单来说,就是用空间换时间,主动给struct填充一些字段,使它避免任意两个成员同时出现在同一个CacheLine中。
golang示例
- 未作优化的struct
type noPad struct { a uint64 b uint64 c uint64 } func (np *noPad)Increase() { // 原语:原子操作自增1,目的是避免自增操作被干扰 atomic.AddUint64(&np.a, 1) atomic.AddUint64(&np.b, 1) atomic.AddUint64(&np.c, 1) } ----------------------------- cpu: AMD Ryzen 7 5800H with Radeon Graphics BenchmarkNoPad_Increase BenchmarkNoPad_Increase-16 37386787 32.68 ns/op PASS
- 在struct中使用匿名数组填充Cache Line,避免两个成员同时出现在同一个CacheLine中
type Pad7 struct { a uint64 _ [7]uint64 b uint64 _ [7]uint64 c uint64 _ [7]uint64 } func (p *Pad7)Increase() { atomic.AddUint64(&p.a, 1) atomic.AddUint64(&p.b, 1) atomic.AddUint64(&p.c, 1) } --------------------------- cpu: AMD Ryzen 7 5800H with Radeon Graphics BenchmarkPad7_Increase BenchmarkPad7_Increase-16 65326725 18.37 ns/op PASS
- 可以看到,对struct优化过的程序执行速度是未优化过的三倍还多,这个差距简直离谱。
像上面案例中的Pad7,就是通过填充匿名数组,使得任意两个具名成员分别处在不同的CacheLine上。
需要注意的是,这种机械处理方式仅仅针对特定的平台,比如CacheLine为64Byte的平台,要是跨平台,这样的处理很可能就是纯粹的浪费Cache。而且在当今的处理器中Cache的命中率已经非常高了,与其花大量的精力去解决False Sharing问题,不如优先专注于业务
-
javascript:😉