DMA学习

一、DMA简介

DMA是一种无需CPU的参与就可以让外设与系统内存之间进行双向数据传输的硬件机制。使用DMA可以使系统CPU从实际的I/O数据传输过程中摆脱出来，从而大大提高系统的吞吐率。

DMA方式的数据传输由DMA控制器（DMAC）控制，在传输期间，CPU可以并发执行其他任务。当DMA结束后，DMAC通过中断通知CPU数据传输已经结束，然后由CPU执行相应的中断服务程序后进行处理。

二、DMA工作流程

准备阶段：CPU会对DMA控制器和IO接口进行初始化，初始化内容如下：

1、DMA控制器初始化：配置DMA内存缓冲区的首地址、配置DMA的传输方向、配置DMA交换量。

2、接口的初始化：I/O设备的寻址信息

传输请求：

1、设备接口->DMA控制器：设备接口向DMA控制器发送“DMA请求”，即请求使用DMA进行数据传输。

2、DMA控制器->CPU：DMA控制器向CPU申请“总线占用”，DMA控制器和CPU只有一个能占用总线。

3、CPU->DMA控制器：CPU批准使用总线，此时CPU会让出一个或多个总线周期用于数据传输。在DMA数据传输期间，CPU停止访问内存，无法执行需要占用总线的指令。

4、DMA控制器->设备接口：DMA批准设备请求，此时DMA控制器将掌握总线控制权。如果是单字节传送，一个总线周期后，DMA归还总线控制权；如果是块传送，连续占用若干个总线周期后，DMA才会归还总线控制权。

数据传送：数据传送期间，DMA控制器会向总线发送读 /写命令、向I/O接口发响应信号。真正的数据交互是内存和设备接口，DMA控制器只是负责控制整个数据传送流程。

善后处理：在初始化时，CPU便指定了DMA的交换量，而且DMA控制器内部有一个计数器，只有DMA控制器直到传送是否结束。当传送结束时，DMA控制器向CPU发送一个传输完成的终端，CPU重新接管总线的控制权。

三、DMA与Cache的一致性

Cache和DMA是两个事物，Cache是一种用于提高数据访问速度的技术，利用程序的空间局部性和时间局部性原理，通过将数据存储在快速访问的存储介质中来减少相对较慢的存储介质的访问次数，从而提高数据的访问速率。而DMA可以用作内存与外设之间传输数据的方式，这种传输方式下，数据并不需要经过CPU的中转。

当DMA针对内存的目的地址与Cache缓存的对象没有重叠区域时，DMA和Cache之间将相安无事。但如果DMA的目的内存地址和Cache缓存的内存地址之间有重叠区域，经过DMA的操作，Cache缓存对应的内存的数据已经被修改，而CPU本身并不知道，它仍然认为Cache中的数据就是内存中的数据，以后访问Cache映射的内存时，它仍然使用陈旧的Cache数据。这样就发生了Cache与内存之间数据“不一致性”错误。所谓Cache数据与内存数据不一致性，是指在采用Cache的系统中，同样一个数据可能既存在于Cache中，也存在于主存中，Cache与主存中的数据一样则具有一致性，数据若不一样则具有不一致性。

四、Linux下的DMA编程

简单来说让DMA正常工作分为以下六个步骤：1、使用request_dma()初始化申请DMA。2、配置channel。3、进行DMA传输。4、若使能了对应中断，进行DMA传输后的中断处理。5、释放DMA缓冲区。6、free_dma()释放DMA。

第一步：申请DMA通道。在Linux内核中，这一步骤涉及设置DMA通道的能力，并请求一个符合这些能力的通道。通过dma_cap_zero、dma_cap_set、dma_request_channel三个函数完成。
dma_cap_mask_t mask;
dma_cap_zero(mask);
dma_cap_set(DMA_MEMCPY, mask);
tmc_dma_chan = dma_request_channel(mask,NULL,NULL);
if(!tmc_dma_chan)
{
    printk("dma_request_channel error\n");
    return -1;
}
在这段代码中，首先定义了一个dma_cap_mask_t类型的变量mask来存储DMA通道能力的掩码。然后使用dma_cap_zero函数清零掩码，接着使用dma_cap_set函数设置需要的DMA能力。最后，我们调用dma_request_channel函数来请求一个DMA通道，并检查返回值以确保请求成功。

第二步：配置DMA通道。一旦成功申请到DMA通道，接下来的步骤是对通道进行配置，以匹配外设或内存缓冲区的特定需求。这包括设置源地址和目标地址、定义数据传输的宽度以及传输方向。
struct dma_slave_config conf;
char *dma_test_src_buf;
char *dma_test_dst_buf;
dma_test_src_buf = kmalloc(1005,GFP_KERNEL);
dma_test_dst_buf = kmalloc(1005,GFP_KERNEL);
src_addr = dma_map_single(tmc_dma_chan->device->dev, dma_test_src_buf, len, DMA_FROM_DEVICE);
dst_addr = dma_map_single(tmc_dma_chan->device->dev, dma_test_dst_buf, len, DMA_TO_DEVICE);
conf.src_addr = src_addr;
conf.src_addr_width = DMA_SLAVE_BUSWIDTH_8_BYTES;
conf.dst_addr = dst_addr;
conf.dst_addr_width = DMA_SLAVE_BUSWIDTH_4_BYTES;
if (dmaengine_slave_config(tmc_dma_chan, &conf)) {
	printk("failed to configure dma channel\n");
	return -1;
}
在这段代码中，我们为conf设置了源地址src_addr和目标地址dst_addr，这些地址通常是外设寄存器或内存缓冲区的物理地址。此外，我们还定义了在源地址和目标地址上进行数据传输时的数据宽度。最后使用dmaengine_slave_config函数将这些配置应用到之前申请的DMA通道上。如果配置失败，函数将返回非0值，并打印错误信息。

第三步：进行DMA传输。在DMA通道配置完成后，下一步是准备并执行DMA的传输。这涉及到创建一个DMA传输描述符，提交该描述符，以及触发DMA引擎来执行传输。

1、准备DMA传输描述符：使用dmaengine_prep_dma_memcpy函数创建一个DMA传输描述符。这个函数会根据提供的源地址、目标地址、传输长度等信息来配置传输。

2、提交DMA传输描述符：通过dmaengine_submit函数将传输描述符提交给DMA引擎。这一步不会立即启动传输，而是将传输描述符放入DMA通道的待处理队列中。

3、触发DMA传输：调用dma_async_issue_pending函数来启动DMA通道上所有挂起的传输。如果通道处于空闲状态，这个调用会启动传输描述符中定义的DMA传输。
struct dma_async_tx_descriptor *desc;
desc = dmaengine_prep_dma_memcpy(tmc_dma_chan, dst_addr, src_addr, len, 0);
dmaengine_submit(desc);
dma_async_issue_pending(tmc_dma_chan);

第四步： DMA中断处理。在linux中，使用DMA传输时，可以配置中断回调函数来处理完成后的事件。只需要额外定义一个中断回调函数，并在传输描述符中相应字段定义即可。
void irq_tasklet_func(struct tasklet_struct *unused)
{
    dma_release_channel(tmc_dma_chan);
    kfree(dma_test_src_buf);
    kfree(dma_test_dst_buf);
    printk("release resources");
}
DECLARE_TASKLET(irq_tasklet,irq_tasklet_func);
void dma_transfer_complete(void *arg)
{
    // 处理传输完成的逻辑
    printk(KERN_INFO "DMA transfer completed\n");
    tasklet_schedule(&irq_tasklet);
}
{
    /* 其他代码 */
    desc->callback = dma_transfer_complete;
    desc->callback_param = NULL;
    /* 其他代码 */
}
其中的tasklet_schedule是Linux内核中断下半部的一种实现机制。中断上下半部具体内容可查阅：linux开发板引脚中断编程-CSDN博客。由此我们就把与中断相关的相对无关紧要的资源释放函数交给了tasklet机制去处理，从而使得内核可以迅速完成这个中断的关键工作（例如设置寄存器等）。而释放资源等其他工作就交给tasklet去处理。

第五步、第六步：释放DMA缓冲区和释放DMA通道。在DMA传输完成后，为了释放分配的资源并避免内存泄漏，需要释放之前申请的DMA缓冲区和DMA通道。这是设备驱动程序中资源管理的重要组成部分。

释放DMA缓冲区：在linux内核中，如果使用kmalloc或dma_alloc_coherent分配的内存，传输完成后应使用kfree或相应的函数释放内存。

释放DMA通道：使用dma_release_channel函数释放之前申请的DMA通道，使其可以被其他驱动程序或应用程序重用。
int dht11_release(struct inode *node, struct file *filp)
{
    dma_release_channel(tmc_dma_chan);
    kfree(dma_test_src_buf);
    kfree(dma_test_dst_buf);
    return 0;
};
在本文中，关闭设备时才对dma通道及相关缓冲区资源进行释放。

以上代码实现的功能逻辑是，在内存开辟两块空间，分别叫做dma_test_src_buf和dma_test_dst_buf。分别当作数据源地址和目标地址。同时给源地址赋值“abcdef......”。随后申请DMA通道并进行配置。设置源地址、目标地址和传输数据长度。提交DMA传输描述符，并开启DMA传输。最后就可以观察到通过DMA传输后，字符串数据被成功传输到目标地址。