Linux内核中常用的C语言技巧详解

news2024/11/22 6:56:08

 

e0efd41e355549dda54aaa7900e058e3.png


概要

Linux内核采用的是GCC编译器,GCC编译器除了支持ANSI C,还支持GNU C。在Linux内核中,许多地方都使用了GNU C语言的扩展特性,如typeof、__attribute__、__aligned、__builtin_等,这些都是GNU C语言的特性。

 

typeof

下面是比较两个数大小返回最大值的经典宏写法:

#define max(a,b) ((a) > (b) ? (a) : (b))

如果a传入i++,b传入j++,那么这个比较大小就会出错。例如:

#define max(a,b) ((a)>(b)?(a):(b))

int x = 1, y = 2;
printf("max=%d\n", max(x++, y++));
printf("x = %d, y = %d\n", x, y);

输出结果:max=3,x=2,y=4。这是错误的结果,正常我们希望的是max(1,2),返回max=2。如何修改这个宏呢?

在GNU C语言中,如果知道a和b的类型,可以在宏里面定义一个变量,将a, b赋值给变量,然后再比较。例如:

#define max(a,b) ({   \
    int _a = (a);   \ 
    int _b = (b);   \
    _a > _b ? _a : _b; }) 

如果不知道具体的数据类型,可以使用typeof类转换宏,Linux内核中的例子:

#define max(a, b) ({        \
    typeof(a) _a = (a);      \
    typeof(b) _b = (b);      \
    (void) (&_a == &_b);   \
    _a > _b ? _a : _b; })

typeof(a) _a = (a):定义一个a类型的变量_a,将a赋值给_a

typeof(b) _b = (b):定义一个b类型的变量_b,将b赋值给_b

(void) (&_a == &_b):判断两个数的类型是否相同,如果不相同,会抛出一个警告。因为a和b的类型不一样,其指针类型也会不一样,两个不一样的指针类型进行比较操作,会抛出一个编译警告。

typeof用法举例:

//typeof的参数可以是表达式或类型

//参数是类型
typeof(int *) a,b;//等价于:int *a,*b;

//参数是表达式
int foo();
typeof(foo()) var;//声明了int类型的var变量,因为表达式foo()是int类型的。由于表达式不会被执行,所以不会调用foo函数。

零长数组

零长数组,又叫柔性数组。而它的作用主要就是为了满足需要变长度的结构体,因此有时也习惯性地称为变长数组

用法:在一个结构体的最后, 申明一个长度为0的数组, 就可以使得这个结构体是可变长的

对于编译器来说, 此时长度为0的数组并不占用空间, 因为数组名本身不占空间, 它只是一个偏移量, 数组名这个符号本身代表了一个不可修改的地址常量

结构体中定义零长数组:

<mm/percpu.c>
struct pcpu_chunk {
    struct list_head  list;
    unsigned long    populated[];  /* 变长数组 */
};

数据结构最后一个元素被定义为零长度数组,不占结构体空间。这样,我们可以根据对象大小动态地分配结构的大小。

struct line {
    int length;
    char contents[0];
};

struct line *thisline = malloc(sizeof(struct line) + this_length);
thisline->length = this_length;

如上例所示,struct line数据结构定义了一个int length变量和一个变长数组contents[0],这个struct line数据结构的大小只包含int类型的大小,不包含contents的大小,也就是**sizeof (struct line) = sizeof (int)**。

创建结构体对象时,可根据实际的需要指定这个可变长数组的长度,并分配相应的空间,如上述实例代码分配了this_length 字节的内存,并且可以通过contents[index]来访问第index个地址的数据。

case范围

GNU C语言支持指定一个case的范围作为一个标签,如:

case low ...high:
case 'A' ...'Z':

这里low到high表示一个区间范围,在ASCII字符代码中也非常有用。下面是Linux内核中的代码例子。

<arch/x86/platform/uv/tlb_uv.c>
    
static int local_atoi(const char *name){
    int val = 0;
    for (;; name++) {
        switch (*name) {
            case '0' ...'9':
                val = 10*val+(*name-'0');
                break;
            default:
                return val;
        }
    }
}

另外,还可以用整形数来表示范围,但是这里需要注意在“...”两边有空格,否则编译会出错。

<drivers/usb/gadget/udc/at91_udc.c>

static int at91sam9261_udc_init(struct at91_udc *udc){
    for (i = 0; i < NUM_ENDPOINTS; i++) {
        ep = &udc->ep[i];
        switch (i) {
            case 0:
                ep->maxpacket = 8;
                break;
            case 1 ... 3:
                ep->maxpacket = 64;
                break;
            case 4 ... 5:
                ep->maxpacket = 256;
                break;
        }
    }
}

标号元素

GNU C语言可以通过指定索引或结构体成员名来初始化,不必按照原来的固定顺序进行初始化。

结构体成员的初始化在 Linux 内核中经常使用,如在设备驱动中初始化file_operations数据结构:

<drivers/char/mem.c>
static const struct file_operations zero_fops = {
    .llseek      = zero_lseek,
    .read        = new_sync_read,
    .write       = write_zero,
    .read_iter     = read_iter_zero,
    .aio_write     = aio_write_zero,
    .mmap        = mmap_zero,
};

如上述代码中的zero_fops的成员llseek初始化为zero_lseek函数,read成员初始化为new_sync_read函数,依次类推。当file_operations数据结构的定义发生变化时,这种初始化方法依然能保证已知元素的正确性,对于未初始化成员的值为0或者NULL

可变参数宏

在GNU C语言中,宏可以接受可变数目的参数,主要用在输出函数里。例如:

<include/linux/printk.h>
#define pr_debug(fmt, ...) \
dynamic_pr_debug(fmt, ##__VA_ARGS__)

“...”代表一个可以变化的参数表,“__VA_ARGS__”是编译器保留字段,预处理时把参数传递给宏。当宏的调用展开时,实际参数就传递给dynamic_pr_debug函数了。

函数属性

GNU C语言允许声明函数属性(Function Attribute)变量属性(Variable Attribute)类型属性(Type Attribute),以便编译器进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为:

__attribute__ ((attribute-list))

attribute-list的定义有很多,如noreturnformat以及const等。此外,还可以定义一些和处理器体系结构相关的函数属性,如ARM体系结构中可以定义interruptisr等属性。

下面是Linux内核中使用format属性的一个例子。

<drivers/staging/lustru/include/linux/libcfs/>
int libcfs_debug_msg(struct libcfs_debug_msg_data *msgdata,const char *format1, ...)__attribute__ ((format (printf, 2, 3)));

libcfs_debug_msg()函数里声明了一个format函数属性,它会告诉编译器按照printf的参数表的格式规则对该函数参数进行检查数字2表示第二个参数为格式化字符串,数字3表示参数“...”里的第一个参数在函数参数总数中排在第几个

noreturn属性告诉编译器,该函数从不返回值,这可以消除一些不必要的警告信息。例如以下函数,函数不会返回:

void __attribute__((noreturn)) die(void);

const 属性会让编译器只调用该函数一次,以后再调用时只需要返回第一次结果即可,从而提高效率。

static inline u32 __attribute_const__ read_cpuid_cachetype(void){
    return read_cpuid(CTR_EL0);
}

Linux还有一些其他的函数属性,被定义在compiler-gcc.h文件中。

#define __pure           __attribute__((pure))
#define __aligned(x)        __attribute__((aligned(x)))
#define __printf(a, b)      __attribute__((format(printf, a, b)))
#define __scanf(a, b)       __attribute__((format(scanf, a, b)))
#define noinline          __attribute__((noinline))
#define __attribute_const__   __attribute__((__const__))
#define __maybe_unused      __attribute__((unused))
#define __always_unused      __attribute__((unused))

变量属性和类型属性

变量属性可以对变量或结构体成员进行属性设置。类型属性常见的属性有alignmentpackedsections等。

alignment属性规定变量或者结构体成员的最小对齐格式,以字节为单位。

struct qib_user_info {
    __u32 spu_userversion;
    __u64 spu_base_info;
} __aligned(8);

在这个例子中,编译器以8字节对齐的方式来分配qib_user_info这个数据结构。

packed属性可以使变量或者结构体成员使用最小的对齐方式,对变量是以字节对齐,对域是以位对齐

struct test{
 char a;
    int x[2] __attribute__ ((packed));
};

x成员使用了packed属性,它会存储在变量a后面,所以这个结构体一共占用9字节

内建函数

内建函数以“_builtin_”作为函数名前缀。下面介绍Linux内核常用的一些内建函数。

__builtin_constant_p(x):判断x是否在编译时就可以被确定为常量。如果x为常量,该函数返回1,否则返回0。

__builtin_expect(exp, c)

#define __swab16(x)        \
(__builtin_constant_p((__u16)(x)) ?  \
___constant_swab16(x) :      \
__fswab16(x))__builtin_expect(exp, c)

__builtin_expect(exp, c):这里的意思是exp==c的概率很大,用来引导GCC编译器进行条件分支预测。开发人员知道最可能执行哪个分支,并将最有可能执行的分支告诉编译器,让编译器优化指令序列,使指令尽可能地顺序执行,从而提高CPU预取指令的正确率

Linux内核中经常见到likely()unlikely()函数,本质也是__builtin_expect()

#define LIKELY(x) __builtin_expect(!!(x), 1) //x很可能为真
#define UNLIKELY(x) __builtin_expect(!!(x), 0) //x很可能为假

__builtin_prefetch(const void *addr, int rw, int locality)主动进行数据预取,在使用地址addr的值之前就把其值加载到cache中,减少读取的延迟,从而提高性能

该函数可以接受3个参数:

  • 第一个参数addr表示要预取数据的地址;

  • 第二个参数rw表示读写属性,1表示可写,0表示只读;

  • 第三个参数locality表示数据在cache中的时间局部性,其中0表示读取完addr的之后不用保留在cache中,而1~3表示时间局部性逐渐增强。如下面的prefetch()prefetchw()函数的实现。

<include/linux/prefetch.h>
#define prefetch(x) __builtin_prefetch(x)
#define prefetchw(x) __builtin_prefetch(x,1)

下面是使用prefetch()函数进行优化的一个例子。

<mm/page_alloc.c>
void __init __free_pages_bootmem(struct page *page, unsigned int order){
    unsigned int nr_pages = 1 << order;
    struct page *p = page;
    unsigned int loop;
    prefetchw(p);
    for (loop = 0; loop < (nr_pages - 1); loop++, p++) {
        prefetchw(p + 1);
        __ClearPageReserved(p);
        set_page_count(p, 0);
    }
    …
}

在处理struct page数据之前,通过prefetchw()预取到cache中,从而提升性能

asmlinkage

在标准C语言中,函数的形参在实际传入参数时会涉及参数存放问题。

对于x86架构,函数参数局部变量被一起分配到函数的局部堆栈里。x86中对asmlinkage的定义:

<arch/x86/include/asm/linkage.h>
#define asmlinkage CPP_ASMLINKAGE __attribute__((regparm(0)))

attribute((regparm(0))):告诉编译器该函数不需要通过任何寄存器来传递参数,只通过堆栈来传递

对于ARM来说,函数参数的传递有一套ATPCS标准,即通过寄存器来传递。ARM中的R0~R4寄存器存放传入参数,当参数超过5个时,多余的参数被存放在局部堆栈中。所以,ARM平台没有定义asmlinkage

<include/linux/linkage.h>
#define asmlinkage CPP_ASMLINKAGE
#define asmlinkage CPP_ASMLINKAGE

UL

在Linux内核代码中,我们经常会看到一些数字的定义使用了UL后缀修饰。

数字常量会被隐形定义为int类型,两个int类型相加的结果可能会发生溢出。

因此使用UL强制把int类型数据转换为unsigned long类型,这是为了保证运算过程不会因为int的位数不同而导致溢出。

  • 1 :表示有符号整型数字1

  • UL:表示无符号长整型数字1

 

今天的分享就到这里,欢迎点赞收藏转发,感谢🙏

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/703601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python中,数组 nums[:] 和nums有何区别?

leetcode中有一道题。题目为&#xff1a; 给你一个数组 nums 和一个值 val&#xff0c;你需要 原地 移除所有数值等于 val 的元素&#xff0c;并返回移除后数组的新长度。不要使用额外的数组空间&#xff0c;你必须仅使用 O(1) 额外空间并 原地 修改输入数组。元素的顺序可以改…

对于超过最大宽度的文字 想要换行怎么解决

对于超过最大宽度的文字,你可以 1、使用CSS中的word-break属性来换行: .rich-text {word-break: break-all; } break-all 属性允许在字符串内的任何地方换行。 2、使用overflow-wrap属性:break-word 也允许在字符串的任何地方换行。 .rich-text {overflow-wrap: break-wo…

Blazor 自定义可重用基础组件之 InputString(InputText)

为避免命名冲突&#xff0c;将InputText改名为InputString&#xff0c;其实内部类型就是string。 <div class"d-flex"><label class"control-label w-auto mt-2"><b>Lable</b></label><div style"width:InputWidth…

数智化时代,国企人力资源创新突破与高质量发展

二十大以来&#xff0c;在全面建设社会主义现代化背景下&#xff0c;以更大的力度、更切实的措施推动国资国企改革&#xff0c;推动世界一流企业由“培育”转入“加快建设”阶段。历经三年行动&#xff0c;国有企业改革已经取得了令人瞩目的成就。 今年以来&#xff0c;国务院国…

JAVA麻将胡牌算法深度解析

目录 麻将的基本概念 麻将牌的构成 麻将的碰&#xff0c;杠&#xff0c;吃&#xff0c;听&#xff0c;胡 麻将胡牌条件 胡牌算法简介 选将拆分法 算法数据结构 构建数据结构 数据结构使用 牌花色的获取 获取某一花色的牌值 获取某一张牌相邻牌 算法代码实现 基础代…

word另存为pdf失败的原因及处理方法

我们知道&#xff0c;Word可以通过另存为方式直接保存为PDF&#xff0c;其原理其实跟打印机打印差不多&#xff0c;PDF就是一台虚拟的打印机&#xff0c;但有些同学反映word另存为pdf失败&#xff0c;可能的原因是什么呢&#xff1f;又该如何处理呢&#xff1f; word另存为pdf…

【Java|多线程与高并发】CAS以及ABA问题

文章目录 1. 什么是CAS2. ABA问题3. ABA问题的解决 1. 什么是CAS CAS&#xff08;Compare and Swap,“比较和交换”&#xff09;是一种并发编程中常用的原子操作&#xff0c;用于解决多线程环境下的数据竞争和并发访问问题。 CAS操作包含三个操作数&#xff1a;内存位置&#x…

【Git】 Git初相识

文章目录 1. Git的必要性1.1 提出问题1.2 解决问题1.3 注意事项 2. Git的安装2.1 kali下的安装2.3 Windows下的安装 3. Git的配置 1. Git的必要性 1.1 提出问题 在我们的学习或者工作中&#xff0c;经常会遇到一些比较难搞的上司或者老师&#xff0c;让我们交上去的文档改了又…

英伟达开发板学习系列---通过主机名称进行远程登录

1.前言 我们使用Jetson nx 的时候经常需要使用远程工具&#xff0c;而默认的网络配置IP地址采用动态分配&#xff0c;会造成IP地址不确定的问题&#xff0c;故我们可以设置hostname 唯一名字&#xff0c;通过hostname 进行远程连接。 2.通过主机名称进行登录 1.修改主机名称…

使用docker搭建mysql集群

一、技术架构 1、架构图 2、解说 mysql_1、mysql_2、mysql_3是一组主从模式,同理mysql_4、mysql_5、mysql_6也是一组主从模式从上面的图可以看出mysql_1和mysql_4是主节点,可以进行增删改查操作,但是子几点只能查询操作如果mysql_1节点出现问题了&#xff0c;有mysql_4节点组…

Python:使用prometheus-client提交数据到实现prometheus+ grafana数据监控

相关资料 prometheus文档&#xff1a;https://prometheus.io/grafana文档&#xff1a;https://grafana.com/grafana github: https://github.com/grafana/grafanaPyhton客户端https://pypi.org/project/prometheus-client/ 目录 1、使用Python提供数据源2、启动 prometheus3、…

eDNA暴露人类活动轨迹!你的DNA信息可能随时随地在泄露!

环境DNA&#xff08;environmental DNA, eDNA&#xff09;领域发展迅速&#xff0c;但人类eDNA的应用仍未得到充分利用和重视。eDNA分析的广泛应用将为病原体监测、生物多样性监测、濒危和入侵物种检测以及群体遗传学带来许多公认的好处。 佛罗里达大学野生动物疾病基因组学教…

【pytorch函数笔记】torch.sum()、torch.unsqueeze()

1.torch.sum torch.sum(imgs, dim0) # 按列求和 torch.sum(imgs, dim1) # 按行求和 imgs torch.Tensor([i for i in zip( range(10), range(10))]) print(imgs) s1torch.sum(imgs, dim0) # 按列求和 s2torch.sum(imgs, dim1) # 按行求和 print(s1) print(s2) 2.torch.uns…

在前端开发中使用 Python

推荐给需要鼓捣前端应用又不熟悉 JS 的 Pythoner 简介 在使用 Python 进行数据分析的时候&#xff0c;经常需要创建一些动态、交互式的可视化作品。一般会用到如 Plotly、Pyecharts、Bokeh 等库&#xff0c;这些库都是基于前端技术创建可视化作品。所以在自定义可视化的时候&a…

Python3,有了此库,不需要再为导包顺序而烦恼了,小刀拉屁股,涨知识了。

usort详解 1、引言2、代码实战2.1 usort 安装2.2 代码示例 3、总结 1、引言 小鱼&#xff1a;小屌丝&#xff0c;这段代码是你的写的不&#xff1f; 小屌丝&#xff1a;是我写的啊&#xff0c;咋 鱼哥 小鱼&#xff1a;你看你的导包顺序&#xff0c;挺乱的 小屌丝&#xff1a;…

一些共享资料

大家好&#xff0c;才是真的好。 我们好久没有分享资料了&#xff0c;上次分享还是上次——我也忘记了多久。 本次Engage2023开完之后&#xff0c;从会议上也流出了很多各类技术和主题方面的PPT、PDF资料等&#xff0c;我搜索了一些Domino技术话题有关的共享在这里。 主题涉…

算法----二叉树的最近公共祖先

题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个节点 p、q&#xff0c;最近公共祖先表示为一个节点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff08;一个节点也可以是它…

轻量服务器外网访问不了的原因分析

​  轻量服务器外网访问不了原因的分析。很多用户在选择轻量服务器的时候都没考虑&#xff0c;直接就购买了&#xff0c;导致在使用的时候遇见了很多问题&#xff0c;下面我们就简单的聊聊关于轻量服务器外网无法访问的原因。 这里我们按照标题的意思可以解读为两种情况&…

2023最新互联网公司时长排行榜出炉

今天给大家分享一个对于选择公司来说另一个非常重要的参考指标&#xff1a;“互联网时长”。 我们在选择一个公司的时候&#xff0c;除了需要关注总收入package 以外&#xff0c;还需要考虑这家公司的加班时长是否人性化。 我们的工作时长是周工作小时数。法定工作时间是40小…

这8种Python加速运行技巧真棒

关注“Python专栏”微信公众号&#xff0c;回复暗号【面试大全】&#xff0c;立即领取面试题简历模板。 Python 是一种脚本语言&#xff0c;相比 C/C 这样的编译语言&#xff0c;在效率和性能方面存在一些不足。但是&#xff0c;有很多时候&#xff0c;Python 的效率并没有想象…