一、讲解
mlx4_register_interface函数是Mellanox InfiniBand驱动程序的一部分,这个函数的作用是注册一个新的接口(intf)到InfiniBand设备。这允许不同的子系统,如以太网或存储,能够在同一个硬件设备上注册它们各自需要的接口,在硬件资源上建立抽象层。这段代码是从网络驱动的源代码中取出来的,具体的操作流程是这样的:
1. 参数检查: 该函数首先检查传入的接口(intf)是否有`add`和`remove`方法。这两个方法是必须的,因为它们被驱动用来添加和移除设备。如果其中一个方法缺失,函数返回`-EINVAL`,表示一个无效的参数错误。
2. 互斥锁保护: 函数使用了互斥锁`intf_mutex`来确保在修改接口列表(intf_list)时不会有并发问题。
3. 更新接口列表: 函数将`intf`加入到全局的接口列表,使用`list_add_tail`函数把接口添加到列表的尾部。
4. 遍历设备列表: 接下来使用`list_for_each_entry`来遍历当前已注册的设备列表`dev_list`。
5. 多功能设备检查: 在遍历时,对于每个设备`priv`,它会检查是否是一个多功能(multifunction)设备,并且是否接口标志(intf->flags)包含了绑定(BONDING)的属性。如果是这样,它会通过日志输出调试信息,并清除接口标志中的绑定属性。
6. 添加设备: 调用`mlx4_add_device`函数来实际将接口添加到设备。这通常涉及调用接口的`add`方法。
7. 解锁: 最后,函数解锁互斥锁`intf_mutex`。
8. 返回值: 如果一切顺利,函数将返回`0`,表示成功。
这个函数没有直接使用特定的PCIe函数,它是驱动程序高级接口注册流程的一部分。但它关联的操作可能间接地与PCIe有关,因为InfiniBand驱动程序底层可能需要与PCIe硬件交互来执行任务,如访问硬件资源、配置硬件等。这通常涉及读取和写入PCIe配置空间、映射内存空间、处理中断等任务,可能使用诸如`pci_read_config_*, pci_write_config_*, pci_enable_device`, pci_set_master, pci_alloc_irq_vectors, pci_iomap, pci_set_drvdata等PCIe底层函数。
最后需要注意的是,这段代码是内核的一部分,并且使用GPL协议发布,所以任何在此代码基础上的开发或修改,都必须遵循GPL协议。
二、中文注释
这段代码是Linux内核代码的一部分,在kernel-4.9\drivers\net\ethernet\mellanox\mlx4\intf.c文件中,与Mellanox技术有关的mlx4网络驱动程序。这个特定的函数`mlx4_register_interface`的目的是注册一个网络接口到mlx4驱动。以下是对每一部分的中文注释:
// 定义 mlx4_register_interface 函数,它需要一个指向 mlx4_interface 结构体的指针作为参数
int mlx4_register_interface(struct mlx4_interface *intf)
{
// 声明一个指向 mlx4_priv 结构体的指针
struct mlx4_priv *priv;
// 如果接口的 add 或 remove 函数指针为空,则返回 -EINVAL(无效的参数错误)
if (!intf->add || !intf->remove)
return -EINVAL;
// 锁定 intf_mutex 保护全局变量在多线程中被安全访问
mutex_lock(&intf_mutex);
// 在全局接口列表 intf_list 的末尾添加新接口
list_add_tail(&intf->list, &intf_list);
// 遍历 dev_list 中的每个条目(即 mlx4_priv 设备列表)
list_for_each_entry(priv, &dev_list, dev_list) {
// 检查是否启用了多功能(multi-function)并且接口的 flags 包含 BONDING 标志
if (mlx4_is_mfunc(&priv->dev) && (intf->flags & MLX4_INTFF_BONDING)) {
// 打印调试信息,表明对于多功能设备,要禁用 HA(高可用)模式
mlx4_dbg(&priv->dev,
"SRIOV, disabling HA mode for intf proto %d\n", intf->protocol);
// 清除 intf 的 BONDING 标志
intf->flags &= ~MLX4_INTFF_BONDING;
}
// 为当前遍历到的设备 priv 添加这个接口
mlx4_add_device(intf, priv);
}
// 解锁保护全局变量 intf_mutex
mutex_unlock(&intf_mutex);
// 返回 0 表示函数成功完成
return 0;
}
// 向内核导出 mlx4_register_interface 符号,使其可以被模块 GPL 兼容地使用
EXPORT_SYMBOL_GPL(mlx4_register_interface);
这个函数的具体流程是:
1. 检查 intf 指定的接口结构是否有必要的 add 和 remove 函数。
2. 锁定 intf_mutex 以保护全局的 intf_list 在多线程环境下的修改。
3. 将 intf 接口添加到 intf_list 链表的末尾。
4. 遍历 dev_list 链表,检查每个设备是否为多功能设备并且是否有配对标志;如有,禁用高可用模式。
5. 对每个设备调用 mlx4_add_device 函数将这个接口添加到设备。
6. 解锁 intf_mutex。
7. 函数返回,表示接口注册成功。
三、mlx4_add_device
// 定义一个名为 mlx4_add_device 的函数,它接收指向 mlx4_interface 结构和 mlx4_priv 结构的指针作为参数。
static void mlx4_add_device(struct mlx4_interface *intf, struct mlx4_priv *priv)
{
struct mlx4_device_context *dev_ctx; // 定义一个指向 mlx4_device_context 结构的指针变量。
// 使用 kmalloc 函数分配内存给 dev_ctx,大小为一个 mlx4_device_context 结构的大小。
// GFP_KERNEL 标志表示正常的内核内存分配方式。
dev_ctx = kmalloc(sizeof(*dev_ctx), GFP_KERNEL);
if (!dev_ctx)
return; // 如果内存分配失败,则直接返回。
// 初始化 dev_ctx 结构体的成员。
dev_ctx->intf = intf; // 赋值接口指针。
dev_ctx->context = intf->add(&priv->dev); // 调用 intf 的 add 方法,并将结果存储在 context 中。
// 检查是否成功获得了 context。
if (dev_ctx->context) {
// 使用 spin_lock_irq 来锁定 priv->ctx_lock,禁止中断,避免 race condition。
spin_lock_irq(&priv->ctx_lock);
// 将 dev_ctx 加入到 priv->ctx_list 链表的尾部。
list_add_tail(&dev_ctx->list, &priv->ctx_list);
// 解锁。
spin_unlock_irq(&priv->ctx_lock);
// 如果 intf 结构体中定义了 activate 回调方法,则调用它。
if (intf->activate)
intf->activate(&priv->dev, dev_ctx->context);
} else // 如果获取 context 失败,则释放之前分配的内存。
kfree(dev_ctx);
}
上述代码通常应该是 Linux 内核的一部分,具体是 Mellanox 网络设备驱动程序的代码。代码的功能是向驱动程序注册一个新的设备,并建立需要的设备上下文。如果在建立上下文(比如分配内存或者初始化结构)时失败了,它会清理所用的资源并退出。如果成功,它会将该设备上下文添加到一个全局的链表中,并且调用激活回调(如果提供了的话)。
这段代码是一个用于Linux网络驱动中,Mellanox设备的一部分。这个函数的主要作用是将一个新的设备添加到特定的接口(interface)。
函数签名解释:
static void mlx4_add_device(struct mlx4_interface *intf, struct mlx4_priv *priv)
- static: 函数的作用域是该文件内部。
- void: 函数没有返回值。
- mlx4_add_device: 函数名称,意味着“添加mlx4设备”。
- struct mlx4_interface *intf: 函数的第一个参数,一个指向`mlx4_interface`结构体的指针。这表示与设备通讯的接口。
- struct mlx4_priv *priv: 函数的第二个参数,一个指向`mlx4_priv`结构体(包含私有数据)的指针。
函数的工作流程解释:
1. kmalloc用于动态分配内存。这里分配了一个`mlx4_device_context`结构体的内存。`GFP_KERNEL`参数是告诉内核这次分配是可以睡眠的,如果当前没有足够的内存,可以等待。
2. 如果`kmalloc`返回NULL,代表内存分配失败,函数直接返回。
3. 分配成功后,开始初始化`dev_ctx`结构体的成员:指向接口的指针`intf`和通过接口提供的`add`函数回调来获得的设备上下文`context`。
4. 如果`context`不是NULL,表示设备已成功添加。
5. 函数通过获得`ctx_lock`自旋锁来保护并发访问`priv`结构体的`ctx_list`列表。
6. 使用`list_add_tail`将`dev_ctx`添加到`priv`的`ctx_list`列表尾部。
7. 释放自旋锁,允许其他代码运行。
8. 如果`intf`结构体提供了一个`activate`函数指针,调用这个函数激活设备。
9. 如果设备上下文没有成功创建,释放之前分配的`dev_ctx`结构体的内存来避免内存泄漏。
总结:这个函数处理将一个新的设备添加到一个网络接口,并在添加成功时可能触发设备的激活过程。如果添加失败,则清理资源以避免内存泄漏。