1、问题原因
根本原因是cache和dma的目的地址存在重叠。
如果DMA的目的地址与Cache所缓存的内存地址访问有重叠(如上图所示) , 经过DMA操作, 与Cache缓存对应的内存中的数据已经被修改, 而CPU本身并不知道, 它仍然认为Cache中的数据就是内存中的数据, 那在以后访问Cache映射的内存时, 它仍然使用陈旧的Cache数据。 这样就会发生Cache与内存之间数据“不一致性”的错误。
2、解决问题的方法
2.1、使用不带cahce的内存申请函数去申请DMA
如用函数dma_alloc_coherent();申请的内存是uncached的。
2.2、手动同步cache
如调用函数dma_cache_sync();
有时给DMA用的内存是其他模块已经分配好的,例如协议栈发包时,最终要把skb的地址和长度交给DMA,除了将skb地址转换为物理地址外,还要将CPU cache写回(因为cache里可能是新的,内存里是旧的)。
2.3、流式DMA映射(DMA Streaming Mapping)
相关接口为 dma_map_sg(), dma_unmap_sg(),dma_map_single(),dma_unmap_single()。
一致性缓存的方式是内核专门申请好一块内存给DMA用。而有时驱动并没这样做,而是让DMA引擎直接在上层传下来的内存里做事情。例如从协议栈里发下来的一个包,想通过网卡发送出去。但是协议栈并不知道这个包要往哪里走,因此分配内存的时候并没有特殊对待,这个包所在的内存通常都是可以cache的。这时,内存在给DMA使用之前,就要调用一次dma_map_sg()或dma_map_single(),取决于你的DMA引擎是否支持聚集散列(DMA scatter-gather),支持就用dma_map_sg(),不支持就用dma_map_single()。由于协议栈下来的包的数据有可能还在cache里面,调用dma_map_single()后,CPU就会做一次cache的flush,将cache的数据刷到内存,这样DMA去读内存就读到新的数据了。DMA用完之后要调用对应的unmap接口。unmap相关的接口里面其实有将cache置无效的操作(可以通过查看dma_unmap_sg()的函数实现来知道)。
还要注意,这几个接口都是一次性的,每次操作数据都要调用一次map和unmap。并且在map期间,CPU不能去操作这段内存,因此如果CPU去写,就又不一致了。同样的,dma_map_sg()和dma_map_single()的后端实现也都是和硬件特性相关。
2.4、cache coherent
上面说的是常规DMA,有些SoC可以用硬件做CPU和外设的cache coherence,例如在SoC中集成了叫做“Cache Coherent interconnect”的硬件,它可以做到让DMA踏到CPU的cache或者帮忙做cache的刷新。这样的话,dma_alloc_coherent()申请的内存就没必要是非cache的了。
2.5、CMA
CMA, ( Contiguous Memory Allocator) 。 通过这套机制, 我们可以做到不预留内存, 这些内存平时是可用的, 只有当需要的时候才被分配给Camera、 HDMI等设备。CMA对上呈现的接口是标准的DMA, 也是一致性缓冲区API。
3、总结
在DMA操作中cache和主存的数据不一致性的问题很常见,产生的根本原因是cache所访问的地址和dma的目的地址存在重叠,可以使用多种方法来避免这样的问题。
4、后续
上面只是理论依据,需要自己写代码实践验证才能真正地弄懂它。笔者已经通过实际的代码例程去验证理论,请看这篇文章:
Linux 流式DMA映射(DMA Streaming Mapping)-CSDN博客
参考资料
《Linux设备驱动开发详解-基于最新的Linux4.0内核》---宋宝华编著