从Linux内核中学习高级C语言宏技巧

news2025/1/11 1:55:09

Linux内核可谓是集C语言大成者,从中我们可以学到非常多的技巧,本文来学习一下宏技巧,文章有点长,但耐心看完后C语言level直接飙升。

本文出自:大叔的嵌入式小站,一个简单的嵌入式/单片机学习、交流小站

从Linux内核中学习高级C语言宏技巧

1.用do{}while(0)把宏包起来

#define init_hashtable_nodes(p, b)  do {      \  int _i;              \  hash_init((p)->htable##b);        \  ...略去          \} while (0)

Linux中常见如上定义宏的形式,我们都知道do{}while(0)只执行一次,那么这个有什么意义呢?

我们写一个更简单的宏,来看看

#define fun(x) fun1(x);fun2(x);

则在这样的语句中:

if(a)  fun(a);

被展开为

if(a)  fun1(x);fun2(x);;

fun2(x)将不会执行!有同学会想,加个花括号

#define fun(x) {fun1(x);fun2(x);}

则在这样的语句中

if (a)  fun(a);else  fun3(a);

被展开为

if (a)  {fun1(x);fun2(x);};else  fun3(a);

注意}后还有个;这将会出现语法错误

但是假如我们写成

#define fun(x) do{fun1(x);fun2(x);}while(0)

则完美避免上述问题!

2.获取数组元素个数

写一个获取数组中元素个数的宏怎么写?显然用sizeof

#define ARRAY_SIZE(arr) (sizeof(arr) / sizeof(*arr))

可以用,但这样是存在问题的,先看个例子

#include<stdio.h>int a[3] = {1,3,5};int fun(int c[]){  printf("fun1 a= %d\n",sizeof(c));}int main(void){  printf("a= %d\n",sizeof(a));  fun(a);  return 0;}

输出:

a = 12;b = 8;//32位电脑为4

为什么?因为数组名和指针不是完全一样的,函数参数中的数组名在函数内部会降为指针!sizeof(a),在函数中实际上变成了sizeof(int *)。

上面的宏存在的问题也就清楚了,这是一个非常重大,且容易忽略的bug!

让我们看看,内核中怎么写:

#define ARRAY_SIZE(arr) (sizeof(arr) / sizeof((arr)[0]) + __must_be_array(arr))

(arr)[0]是0长数组,不占用内存,GNU C支持0长数组,在某些编译器下可能会出错。(不过不是因为这个来避开上面的问题)

sizeof(arr) / sizeof((arr)[0]很好理解数组大小除去元素类型大小即是元素个数,真正的精髓在于后面__must_be_array(arr)宏

#define __must_be_array(a)  BUILD_BUG_ON_ZERO(__same_type((a), &(a)[0]))

先看内部的__same_type,它也是个宏

# define __same_type(a, b) __builtin_types_compatible_p(typeof(a), typeof(b))

__builtin_types_compatible_p 是gcc内联函数,在内核源码中找不到定义也无需包含头文件,在代码中也可以直接使用这个函数。(只要是用gcc编译器来编译即可使用,不用管这个,只需知道:

当 a 和 b 是同一种数据类型时,此函数返回 1。

当 a 和 b 是不同的数据类型时,此函数返回 0。

再看外部的(精髓来了

#define BUILD_BUG_ON_ZERO(e) (sizeof(struct { int:-!!(e); }))

上来就是个小技巧:!!(e)是将e转换为0或1,加个-号即将e转换为0或-1。

再用到了位域:

有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态,用一位二进位即可。这时候可以用位域

struct struct_a{  char a:3;  char b:3;  char c;};

a占用3位,b占用3位,如上结构体只占用2字节,位域可以为无位域名,这时它只用来作填充或调整位置,不能使用,如:

struct struct_a{  char a:3;  char  :3;  char c;};

当位数为负数时编译无法通过!

当a为数组时,__same_type((a), &(a)[0]),&(a)[0]是个指针,两者类型不同,返回0,即e为0,-!!(e)为0,sizeof(struct { int:0; })为0,编译通过且不影响最终值。

当a为指针时,__same_type((a), &(a)[0]),两者类型相同,返回1,即e为1,-!!(e)为-1,无法编译。

3.求两个数中最大值的宏MAX

思考这个问题,你会怎么写

3.1一般的同学:

#define MAX(a,b) a > b ? a : b

存在问题,例子如下:

#include<stdio.h>#define MAX(x,y) x > y ? x: yint main(void){  int i = 14;  int j = 3;  printf ("i&0b101 = %d\n",i&0b101);  printf ("j&0b101 = %d\n",j&0b101);  printf("max=%d\n",MAX(i&0b101,j&0b101));  return 0;}

输出:

i&0b101 = 4j&0b101 = 1max=1

明显不对,因为>运算符优先级大于&,所以会先进行比较再进行按位与。

3.2稍好的同学:

#define MAX(a,b) (a) > (b) ? (a) : (b)

存在问题,例子如下:

#define MAX(x,y) (x) > (y) ? (x) : (y)int main(void){  printf("max=%d",3 + MAX(1,2));  return 0;}

输出:

max = 1

同样是优先级问题+优先级大于>。

附优先级表:同一优先级的运算符,运算次序由结合方向所决定。

优先级

运算符

名称或含义

使用形式

结合方向

1

[]

数组元素下标

数组名[常量表达式]

左到右

()

圆括号、函数参数表

(表达式)/函数名(形参表)

.

成员选择(对象)

对象.成员名

->

成员选择(指针)

对象指针->成员名

2

-

负号运算符

-表达式

右到左

~

按位取反运算符

~表达式

++

自增运算符

++变量名/变量名++

--

自减运算符

--变量名/变量名--

*

取值运算符

*指针变量

&

取地址运算符

&变量名

!

逻辑非运算符

!表达式

(类型)

强制类型转换

(数据类型)表达式

sizeof

长度运算符

sizeof(表达式)

3

/

表达式 / 表达式

左到右

*

表达式 * 表达式

%

余数(取模)

整型表达式 % 整型表达式

4

+

表达式 + 表达式

左到右

-

表达式 - 表达式

5

<< 

左移

变量 << 表达式

左到右

>> 

右移

变量 >> 表达式

6

大于

表达式 > 表达式

左到右

>=

大于等于

表达式 >= 表达式

小于

表达式 < 表达式

<=

小于等于

表达式 <= 表达式

7

==

等于

表达式 == 表达式

左到右

!=

不等于

表达式 != 表达式

8

&

按位与

表达式 & 表达式

左到右

9

^

按位异或

表达式 ^ 表达式

左到右

10

|

按位或

表达式 | 表达式

左到右

11

&&

逻辑与

表达式 && 表达式

左到右

12

||

逻辑或

表达式 || 表达式

左到右

13

?:

条件运算符

表达式1? 表达式2: 表达式3

右到左

14

=

赋值运算符

变量 = 表达式

右到左

/=

除后赋值

变量 /= 表达式

*=

乘后赋值

变量 *= 表达式

%=

取模后赋值

变量 %= 表达式

+=

加后赋值

变量 += 表达式

-=

减后赋值

变量 -= 表达式

<<=

左移后赋值

变量 <<= 表达式

>>=

右移后赋值

变量 >>= 表达式

&=

按位与后赋值

变量 &= 表达式

^=

按位异或后赋值

变量 ^= 表达式

|=

按位或后赋值

变量 |= 表达式

15

逗号运算符

表达式, 表达式, …

左到右

3.3良好的同学

#define MAX(a,b) ((a) > (b) ? (a) : (b))

避免了前两个出现的问题,但同样还有问题存在:

#include<stdio.h>#define MAX(x,y) ((x) > (y) ? (x): (y))int main(void){  int i = 2;  int j = 3;  printf("max=%d\n",MAX(i++,j++));  printf("i=%d\n",i);  printf("j=%d\n",j);  return 0;}

期望结果:

max=3,i=3,j=4

实际结果

max=4,i=3,j=5

尽管用括号避免了优先级问题,但这个例子中的j++实际上运行了两次。

3.4Linux内核中的写法

#define MAX(x, y) ({        \  typeof(x) _max1 = (x);      \  typeof(y) _max2 = (y);      \  (void) (&_max1 == &_max2);    \  _max1 > _max2 ? _max1 : _max2; })

下面进行详解。

3.4.1.GNU C中的语句表达式

表达式就是由一系列操作符和操作数构成的式子。 例如三面三个表达式

a+bi=a*2a++

表达式加上一个分号就构成了语句,例如,下面三条语句:

a+b;i=a*2;a++;

A compound statement enclosed in parentheses may appear as an expression in GNU C.

——《Using the GNU Compiler Collection》6.1 Statements and Declarations in Expressions

GNU C允许在表达式中有复合语句,称为语句表达式:

({表达式1;表达式2;表达式3;...})

语句表达式内部可以有局部变量,语句表达式的值为内部最后一个表达式的值。

例子:

int main(){  int y;  y = ({ int a =3; int b = 4;a+b;});  printf("y = %d\n",y);  return 0;}

输出:y = 7。

这个扩展使得宏构造更加安全可靠,我们可以写出这样的程序:

#define max(x, y) ({        \  int _max1 = (x);      \  int _max2 = (y);      \  _max1 > _max2 ? _max1 : _max2; })int main(void){  int i = 2;  int j = 3;  printf("max=%d\n",max(i++,j++));  printf("i=%d\n",i);  printf("j=%d\n",j);  return 0;}

但这个宏还有个缺点,只能比较int型变量,改进一下:

#define max(type,x, y) ({        \  type _max1 = (x);      \  type _max2 = (y);      \  _max1 > _max2 ? _max1 : _max2; })

但这需要传入type,还不够好。

3.4.2 typeof关键字

GNU C 扩展了一个关键字 typeof,用来获取一个变量或表达式的类型。

例子:

int a;typeof(a) b = 1;typeof(int *) a;int f();typeof(f()) i;

于是就有了

#define max(x, y) ({        \  typeof(x) _max1 = (x);      \  typeof(y) _max2 = (y);      \  _max1 > _max2 ? _max1 : _max2; })

3.4.3真正的精髓

对比一下,内核的写法:

#define max(x, y) ({        \  typeof(x) _max1 = (x);      \  typeof(y) _max2 = (y);      \  (void) (&_max1 == &_max2);    \  _max1 > _max2 ? _max1 : _max2; })

发现比我们的还多了一句

(void) (&_max1 == &_max2);

这才是真正的精髓,对于不同类型的指针比较,编译器会给一个警告:

warning:comparison of distinct pointer types lacks a cast

提示两种数据类型不同。

至于加void是因为当两个值比较,比较的结果没有用到,有些编译器可能会给出一个警告,加(void)后,就可以消除这个警告。

4.通过成员获取结构体地址的宏container_of

#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)#define container_of(ptr, type, member) ({      \  const typeof(((type *)0)->member) *__mptr = (ptr);  \  (type *)((char *)__mptr - offsetof(type, member));  \})

4.1作用

我们传给某个函数的参数是某个结构体的成员,但是在函数中要用到此结构体的其它成员变量,这时就需要使用这个宏:container_of(ptr, type, member)

ptr为已知结构体成员的指针,type为结构体名字,member为已知成员名字,例子:

struct struct_a{  int a;  int b;};int fun1 (int *pa){  struct struct_a *ps_a;  ps_a = container_of(pa,struct struct_a,a);  ps_a->b = 8;}int main(void){  float f = 10;  struct struct_a s_a ={2,3};  fun1(&s_a.a);  printf("s_a.b = %d\n",s_a.b);  return 0;}

输出:s_a.b=8。

本例子中通过struct_a结构体中的a成员地址获取到了结构体地址,进而对结构体中的另一成员b进行了赋值。

4.2详解

首先来看:

#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)

这个是获取在结构体TYPE中,MEMBER成员的偏移位置。

定义一个结构体变量时,编译器会按照结构体中各个成员的顺序,在内存中分配一片连续的空间来存储。例子:

#include<stdio.h>struct struct_a{  int a;  int b;  int c;};int main(void){  struct struct_a s_a ={2,3,6};  printf("s_a   addr = %p\n",&s_a);  printf("s_a.a addr = %p\n",&s_a.a);  printf("s_a.b addr = %p\n",&s_a.b);  printf("s_a.c addr = %p\n",&s_a.c);  return 0;}

输出

s_a   addr = 0x7fff2357896cs_a.a addr = 0x7fff2357896cs_a.b addr = 0x7fff23578970s_a.c addr = 0x7fff23578974

结构体的地址也就是第一个成员的地址,每一个成员的地址可以看作是对首地址的偏移,上面例子中,a就是首地址偏移0,b就是首地址偏移4字节,c就是首地址偏移8字节。

我们知道C语言中指针的内容其实就是地址,我们也可以把某个地址强制转换为某种类型的指针,(TYPE *)0)即将地址0,通过强制类型转换,转换为一个指向结构体类型为 TYPE的常量指针。

&((TYPE *)0)->MEMBER自然就是MEMBER成员对首地址的偏移量了。

而(size_t)是内核定义的数据类型,在32位机上就是unsigned int,64位就是unsiged long int,就是强制转换为无符号整型数。

再来看:

#define container_of(ptr, type, member) ({      \  const typeof(((type *)0)->member) *__mptr = (ptr);  \  (type *)((char *)__mptr - offsetof(type, member));  \})

第一句(其实这句才是精华)

const typeof(((type *)0)->member) *__mptr = (ptr);  \

typeof在前面讲过了,获取类型,这句作用是利用赋值来确保你传入的ptr指针和member成员是同一类型,不然就会出现警告。

第二句

 (type *)((char *)__mptr - offsetof(type, member));  \

有了前面的讲解,应该就很容易理解了,成员的地址减去偏移不就是首地址吗,为什么要加个(char *)强制类型转换?

因为offsetof(type, member)的结果是偏移的字节数,而指针运算,(char *)-1是减去一个字节,(int *)-1就是减去四个字节了。

最外面的 (type *),即把这个值强制转换为结构体指针。

5.#与变参宏

5.1#和##

#运算符,可以把宏参数转换为字符串,例子

#include <stdio.h>#define PSQR(x) printf("The square of " #x " is %d.\n",((x)*(x)))int main(void){    int y = 5;     PSQR(y);    PSQR(2 + 4);     return 0;}
输出:
The square of y is 25.The square of 2 + 4 is 36.

##运算符,可以把两个参数组合成一个。例子:

#include <stdio.h>#define PRINT_XN(n) printf("x" #n " = %d\n", x ## n);int main(void){    int x1 = 2;    int x2 = 3;    PRINT_XN(1);        // becomes printf("x1 = %d\n", x1);    PRINT_XN(2);        // becomes printf("x2 = %d\n", x2);    return 0;}
该程序的输出如下:
x1 = 2x2 = 3

5.2变参宏

我们都知道printf接受可变参数,C99后宏定义也可以使用可变参数。C99 标准新增加的一个 __VA_ARGS__ 预定义标识符来表示变参列表,例子:

#define DEBUG(...) printf(__VA_ARGS__)int main(void){  DEBUG("Hello %s\n","World!");  return 0;}

但是这个在使用时,可能还有点问题比如这种写法:

#define DEBUG(fmt,...) printf(fmt,__VA_ARGS__)int main(void){  DEBUG("Hello World!");  return 0;}

展开后

printf("Hello World!",);

多了个逗号,编译无法通过,这时,只要在标识符 __VA_ARGS__ 前面加上宏连接符 ##,当变参列表非空时,## 的作用是连接 fmt,和变参列表宏正常使用;当变参列表为空时,## 会将固定参数 fmt 后面的逗号删除掉,这样宏也就可以正常使用了,即改成这样:

#define DEBUG(fmt,...) printf(fmt,##__VA_ARGS__)

除了这些,其实Linux内核中还有很多宏和函数写得非常精妙。Linux内核越看越有味道,看内核源码,很多时候都会不明所以,但看明白后又醍醐灌顶,又感慨人外有人!

 本文出自:大叔的嵌入式小站,一个简单的嵌入式/单片机学习、交流小站

从Linux内核中学习高级C语言宏技巧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/401110.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器看世界

博主简介 博主是一名大二学生&#xff0c;主攻人工智能研究。感谢让我们在CSDN相遇&#xff0c;博主致力于在这里分享关于人工智能&#xff0c;c&#xff0c;Python&#xff0c;爬虫等方面知识的分享。 如果有需要的小伙伴可以关注博主&#xff0c;博主会继续更新的&#xff0c…

为什么红黑树如此受欢迎

平衡二叉查找树有很多&#xff0c;但是我们一提到平衡二叉查找树&#xff0c;常提及的就是红黑树&#xff0c;它的“出镜率”甚至要高于平衡二叉查找树。 红黑树是一种相对平衡的二叉查找树&#xff0c;不符合严格意义上平衡二叉查找树的定义。 目录 红黑树的插入 红黑树的验…

SAP ABAP WebService

第一步&#xff1a;SE37 创建一个远程函数&#xff08;Remote Function Module&#xff09;注意该函数需要将Remote Enable开启第二步&#xff1a;创建WebService首先&#xff1a;SE37 打开需要关联的函数在菜单 Utilities->More Utilities->Create Web Service->From…

二 Go的基本语法

1. 基本类型 boolstringint、int8、int16、int32、int64uint、uint8、uint16、uint32、uint64、uintptrbyte // uint8 的别名rune // int32 的别名 代表一个 Unicode 码float32、float64complex64、complex128 2. 三种声明变量 2.1 标准格式 var name type 其中&#xff0c;…

MyBatis-Plus联表查询的短板,该如何解决呢

mybatis-plus作为mybatis的增强工具&#xff0c;它的出现极大的简化了开发中的数据库操作&#xff0c;但是长久以来&#xff0c;它的联表查询能力一直被大家所诟病。一旦遇到left join或right join的左右连接&#xff0c;你还是得老老实实的打开xml文件&#xff0c;手写上一大段…

链表及其基本操作

1.单链表&#xff1a;1.1定义/性质&#xff1a;链表是线性表的链式存储方式。单链表通过指针线性遍历&#xff0c;删除/增加节点时间复杂度为O(1&#xff09;,访问节点时间复杂度为O(n)。单链表分为带头结点和不带头结点两种&#xff0c;带头结点是为了方便统一操作&#xff08…

数据结构:链式二叉树初阶

目录 一.链式二叉树的逻辑结构 1.链式二叉树的结点结构体定义 2.链式二叉树逻辑结构 二.链式二叉树的遍历算法 1.前序遍历 2.中序遍历 3.后序遍历 4.层序遍历(二叉树非递归遍历算法) 层序遍历概念: 层序遍历算法实现思路: 层序遍历代码实现: 三.链式二叉树遍历算…

蓝桥杯三月刷题 第六天

文章目录&#x1f4a5;前言&#x1f609;解题报告&#x1f4a5;星期计算&#x1f914;一、思路:&#x1f60e;二、代码&#xff1a;&#x1f4a5;考勤刷卡&#x1f914;一、思路:&#x1f60e;二、代码&#xff1a;&#x1f4a5;卡片&#x1f914;一、思路:&#x1f60e;二、代…

Spring SpringBoot中使用Mybatis-plusDemo1

官网:https://baomidou.com GitHub:GitHub - baomidou/mybatis-plus: An powerful enhanced toolkit of MyBatis for simplify development Gitee:mybatis-plus: mybatis 增强工具包&#xff0c;简化 CRUD 操作。 文档 http://baomidou.com低代码组件库 http://aizuda.com My…

Leetcode.剑指 Offer II 023. 两个链表的第一个重合节点

题目链接 Leetcode.剑指 Offer II 023. 两个链表的第一个重合节点 easy 题目描述 给定两个单链表的头节点 headA和 headB&#xff0c;请找出并返回两个单链表相交的起始节点。如果两个链表没有交点&#xff0c;返回 null。 注意&#xff0c;函数返回结果后&#xff0c;链表必…

Lumion 2023即将上线,低配电脑如何驾驭Lumion

年更选手Lumion的更新速度“从不让人失望”&#xff0c;自从Lumion 12更新完之后&#xff0c;官方意料之中的没了动静。但是就在这几天&#xff0c;官方终于放出了首支Lumion 2023的更新预告&#xff0c;并且宣布将于本月中旬发布&#xff01;Lumion 2023主要变化是支持光线追踪…

【Linux:环境变量的理解】

目录 1 Z(zombie)-僵尸进程 2 孤儿进程 3 环境变量 3.1 基本概念 3.2 测试HOME 3.3 和环境变量相关的命令 3.4 环境变量的组织方式 3.5 环境变量通常是具有全局属性的 在讲环境变量之前&#xff0c;我们先把上次遗留知识点给总结了&#xff08;僵尸进程和孤儿进程&…

fast-api 一款快速将spring的bean发布成接口并生产对应swagger文档调试的轻量级工具

fast-api简介背景开发痛点:分析需求实战fast-api快速上手1. 引入依赖2. FastApiMapping标记service对象3. swagger2/knife4j 在线测试进阶使用开启调试模式支持指定类或包目录发布如何关闭fast-api自定义fast-api的前缀写在最后简介 fast-api 一款快速将spring的bean(service)发…

案例学习6-没有复用思想

背景&#xff1a; 上述两个方法查询同一张表&#xff0c;只是数据结构不同&#xff0c;完全可以合成一份方法&#xff0c;减少代码冗余。 实现效果如下 不传参&#xff0c;查询所有的数据 传入特定参数实现按条件查询&#xff1a; 实现方式&#xff1a; GetMapping(value &q…

Antlr Tool与antlr runtime的版本一致性问题

1. 意外的问题 在学习Antlr4的visitor模式时&#xff0c;使用IDEA的Antlr插件完成了Hello.g4文件的编译&#xff0c;指定的package为com.sunrise.hello 使用visitor模式遍历语法解析树&#xff0c;遍历过程中打印hello语句 public class HelloVisitorImpl extends HelloBaseVi…

Linux进程和任务管理和分析和排查系统故障

♥️作者&#xff1a;小刘在C站 ♥️个人主页&#xff1a;小刘主页 ♥️每天分享云计算网络运维课堂笔记&#xff0c;努力不一定有收获&#xff0c;但一定会有收获加油&#xff01;一起努力&#xff0c;共赴美好人生&#xff01; ♥️夕阳下&#xff0c;是最美的绽放&#xff0…

基于遥感解译与GIS技术生态环境影响评价图件制作

《环境影响评价技术导则 生态影响》&#xff08;HJ 19—2022&#xff09;即将实施&#xff0c;其中生态影响评价图件是生态影响评价报告的必要组成内容&#xff0c;是评价的主要依据和成果的重要表现形式&#xff0c;是指导生态保护措施设计的重要依据。在众多图件中&#xff…

java八股文--java基础

java基础1.什么是面向对象&#xff0c;谈谈对面向对象的理解2.JDK JRE JVM的区别与联系3.和equals4.hashCode与equals5.String StringBuffer StringBuilder的区别6.重载和重写的区别7.接口和抽象类8.List和Set的区别9.ArrayList和LinkedList10.HashMap和HashTable的区别&#x…

详解命令模式本质及其在高复杂调用中的实践案例

作者&#xff1a;范灿华 阿里同城履约物流技术团队 命令模式是一种设计模式&#xff0c;总结了在特定场景下的最佳设计实践。本文将为大家介绍命令模式的模式本质及灵活运用&#xff0c;并通过一个真实的电商履约系统中的库存调用需求为案例&#xff0c;分享其在高复杂调用中的…

【C语言】8道经典指针笔试题(深度解剖)

上一篇我们也介绍了指针的笔试题&#xff0c;这一篇我们趁热打铁继续讲解8道指针更有趣的笔试题&#xff0c;&#xff0c;让大家更加深刻了解指针&#xff0c;从而也拿下【C语言】指针这个难点! 本次解析是在x86&#xff08;32位&#xff09;平台下进行 文章目录所需储备知识笔…