由于多核cpu缓存的存在,以及gcc编译优化,cpu指令层面的优化,导致程序的执行顺序可能跟你写的顺序不完全一致(reorder)。
但是在多线程编程中如何确保各个线程能正确的读取到各个变量呢(而不是cache中老旧的值)?
atomic acquire/release 这时就派上用场了,例如如下代码(ref preshing.com ):
如果 `Ready` 为 atomic 变量,那 Thread1 中的 write-release(flush cache) 操作和 Thread2 中的 read-acquire(reload cache) 操作可以形成一个内存同步。也就是编译器会在图中所示 atomic_thread_fence 出加上 memory barrier, 这样就确保了: 如果 Thread2 发现变量 `Read==1`,那么一定可以确保变量 r2==42
或者直接使用:
Thread1: Thread2:
Ready.store(1, memory_order_release) Ready.load(momory_order_acquire)