UDP connect 内核源码分析

news2025/4/27 5:29:55

1 从诡异开始

        最近遇到一个线上问题,client 发了一个 udp 请求,服务器回了一个响应,但诡异的是,client 的 log 却看不到对应的处理日志。抓包发现内核发出了一个指示 udp 目的端口不可达的 icmp 报文,类似这样的:

14:33:36.781627 IP 127.0.0.1 > 127.0.0.1: ICMP 127.0.0.1 udp port 58988 unreachable, length 42

        难道 socket 被人关掉了?仔细分析了代码,client 发包默认会 connect 到 server,特殊情况下,会再调用一下 connect 到 0.0.0.0,意为取消掉 connect,这时,就发现取消 connect 之前发的包的回包收不到了。

        connect 原意是期望只能收到某目的地址的回包,取消之后自然是希望所有的回包都能收到,但反而导致了丢包的发生,不搞清楚这个原因,注定要寝食难安

       文中所引用 kernel 代码基于 Linux-2.6.34。

2 connect()

        入口当然是从系统调用开始:

// net/socket.c
SYSCALL_DEFINE3(connect, int, fd, struct sockaddr __user *, uservaddr,
		int, addrlen)
{
    // 通过fd找sock
	sock = sockfd_lookup_light(fd, &err, &fput_needed);

    // 拷贝addr到内核空间
	err = move_addr_to_kernel(uservaddr, addrlen, (struct sockaddr *)&address);
	if (err < 0)
		goto out_put;

    // 调用AF族的connect
	err = sock->ops->connect(sock, (struct sockaddr *)&address, addrlen,
				 sock->file->f_flags);
}

        udp 协议属于 AF_INET 协议族,所以调用走到了这里:

// net/ipv4/af_inet.c
int inet_dgram_connect(struct socket *sock, struct sockaddr * uaddr,
		       int addr_len, int flags)
{
	struct sock *sk = sock->sk;

	if (addr_len < sizeof(uaddr->sa_family))
		return -EINVAL;

    // 取消connect
	if (uaddr->sa_family == AF_UNSPEC)
		return sk->sk_prot->disconnect(sk, flags);

	// connect
	return sk->sk_prot->connect(sk, (struct sockaddr *)uaddr, addr_len);
}

        这里就根据sa_family的值,决定是connect 或者 disconnect,可以接着看udp中对应的实现了:

// net/ipv4/datagram.c
int ip4_datagram_connect(struct sock *sk, struct sockaddr *uaddr, int addr_len)
{
    // 查找从源地址 saddr 到目标地址 usin->sin_addr.s_addr 的路由, 填充 rtable 结构体
	err = ip_route_connect(&rt, usin->sin_addr.s_addr, saddr,
			       RT_CONN_FLAGS(sk), oif,
			       sk->sk_protocol,
			       inet->inet_sport, usin->sin_port, sk, 1);
	if (err) {
		if (err == -ENETUNREACH)
			IP_INC_STATS_BH(sock_net(sk), IPSTATS_MIB_OUTNOROUTES);
		return err;
	}


    // 填充源目的地址
	if (!inet->inet_saddr)
		inet->inet_saddr = rt->rt_src;	/* Update source address */
	if (!inet->inet_rcv_saddr)
		inet->inet_rcv_saddr = rt->rt_src;
	inet->inet_daddr = rt->rt_dst;
	inet->inet_dport = usin->sin_port;
	sk->sk_state = TCP_ESTABLISHED;
	inet->inet_id = jiffies;

	sk_dst_set(sk, &rt->u.dst);
	return(0);
}

        这里原地址有两个,一个是 inet_saddr, 是发包时用的,另一个 inet_rcv_saddr, 则是接收时用的,一般两者是一致的,除了监听 0.0.0.0 这种场景。

       可见,udp connect 后,则是记录了源目的地址,大胆猜测一下,收包的时候会判断地址,不匹配的就不收,这也符合我们对 connect 最初的理解。

ICMP_PORT_UNREACH

        udp 收到一个包的流程比较冗长,我们直接看比较关键的部分:

// net/ipv4/udp.c
int __udp4_lib_rcv(struct sk_buff *skb, struct udp_table *udptable,
		   int proto)
{
	if (proto == IPPROTO_UDP) {
		/* UDP validates ulen. */
		if (ulen < sizeof(*uh) || pskb_trim_rcsum(skb, ulen))
			goto short_packet;
		uh = udp_hdr(skb);
	}

    // 根据源端口和目标端口查找匹配的套接字
	sk = __udp4_lib_lookup_skb(skb, uh->source, uh->dest, udptable);

	if (sk != NULL) {  // 如果找到了,就进入收包函数
		int ret = udp_queue_rcv_skb(sk, skb);
		...
		return 0;
	}

    // 安全检查不通过就悄悄丢弃
	if (!xfrm4_policy_check(NULL, XFRM_POLICY_IN, skb))
		goto drop;

	/* No socket. Drop packet silently, if checksum is wrong */
	if (udp_lib_checksum_complete(skb))
		goto csum_error;

	// 如果没找到对应的sock,并且校验和是ok的,就发送icmp不可达的报文
	icmp_send(skb, ICMP_DEST_UNREACH, ICMP_PORT_UNREACH, 0);

drop:
	UDP_INC_STATS_BH(net, UDP_MIB_INERRORS, proto == IPPROTO_UDPLITE);
	kfree_skb(skb);
	return 0;
}

        咦,icmp 不可达的报文原来就是这里发出的,那什么情况下可能导致找不到对应的 sock 呢?

static struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr,
		__be16 sport, __be32 daddr, __be16 dport,
		int dif, struct udp_table *udptable)
{
	struct sock *sk, *result;
	struct hlist_nulls_node *node;
	unsigned short hnum = ntohs(dport);
    // 首先,使用目的端口号(dport)计算哈希值(slot),以确定在 UDP 哈希表(udptable)中的哪个槽位进行查找
	unsigned int hash2, slot2, slot = udp_hashfn(net, hnum, udptable->mask);
	struct udp_hslot *hslot2, *hslot = &udptable->hash[slot];
	int score, badness;

	rcu_read_lock();
    // 如果目标槽位(hslot)中的元素数量超过 10,则尝试使用更复杂的哈希(hash2)来优化查找过程。
    // 这涉及到根据目的地址和端口号再次计算哈希值,并检查另一个槽位(hslot2)中的元素数量是否更少。
    // 如果是,则优先在那个槽位中查找
	if (hslot->count > 10) {
		hash2 = udp4_portaddr_hash(net, daddr, hnum);
		slot2 = hash2 & udptable->mask;
		hslot2 = &udptable->hash2[slot2];
		if (hslot->count < hslot2->count)
			goto begin;

		result = udp4_lib_lookup2(net, saddr, sport,
					  daddr, hnum, dif,
					  hslot2, slot2);
		if (!result) {
            // 如果在 hslot2 中没有找到匹配的套接字,并且 hslot2 是基于 INADDR_ANY(任意地址)计算的,则再次尝试查找。
			hash2 = udp4_portaddr_hash(net, INADDR_ANY, hnum);
			slot2 = hash2 & udptable->mask;
			hslot2 = &udptable->hash2[slot2];
			if (hslot->count < hslot2->count)
				goto begin;

			result = udp4_lib_lookup2(net, saddr, sport,
						  INADDR_ANY, hnum, dif,
						  hslot2, slot2);
		}
		rcu_read_unlock();
		return result;
	}
begin:
	result = NULL;
	badness = -1;
    // 如果上述优化查找没有成功,或者目标槽位中的元素数量不多于 10,
    // 则直接遍历目标槽位(hslot)中的所有套接字
    // 对于槽位中的每个套接字,使用 compute_score 函数计算一个“分数”,该分数基于套接字地址、端口和可能的其他因素(如套接字状态)
	sk_nulls_for_each_rcu(sk, node, &hslot->head) {
		score = compute_score(sk, net, saddr, hnum, sport,
				      daddr, dport, dif);
		if (score > badness) {
			result = sk;
			badness = score;
		}
	}
	...
	return result;
}

        __udp4_lib_lookup 中逻辑稍多,但简而言之,就是用目的地址、端口号从 udp 的 hash 表中快速查找对应的 sock 结构。因此,正常来讲,udp 查不到 sock 的原因大抵是有人把他从 hash 表中移除了。

        接着浅看一下 compute_score:

static inline int compute_score(struct sock *sk, struct net *net, __be32 saddr,
			 unsigned short hnum,
			 __be16 sport, __be32 daddr, __be16 dport, int dif)
{
	int score = -1;

	if (net_eq(sock_net(sk), net) && udp_sk(sk)->udp_port_hash == hnum &&
			!ipv6_only_sock(sk)) {
		struct inet_sock *inet = inet_sk(sk);

		score = (sk->sk_family == PF_INET ? 1 : 0);
		if (inet->inet_rcv_saddr) {
			if (inet->inet_rcv_saddr != daddr)
				return -1;
			score += 2;
		}
		if (inet->inet_daddr) {
			if (inet->inet_daddr != saddr)
				return -1;
			score += 2;
		}
		if (inet->inet_dport) {
			if (inet->inet_dport != sport)
				return -1;
			score += 2;
		}
		if (sk->sk_bound_dev_if) {
			if (sk->sk_bound_dev_if != dif)
				return -1;
			score += 2;
		}
	}
	return score;
}

        compute_score 中会判断dport 、daddr 以及 rcv_addr,不匹配的就返回 -1 了,这进一步证明了我们上面对 connect 原理的推测是正确的。

3 现出原形

int udp_disconnect(struct sock *sk, int flags)
{
	struct inet_sock *inet = inet_sk(sk);

	sk->sk_state = TCP_CLOSE;
    // 重置connect中设置的地址等信息
	inet->inet_daddr = 0;
	inet->inet_dport = 0;
	sk->sk_bound_dev_if = 0;
    ...

	if (!(sk->sk_userlocks & SOCK_BINDPORT_LOCK)) {
        // unhash
		sk->sk_prot->unhash(sk);
		inet->inet_sport = 0;
	}
	sk_dst_reset(sk);
	return 0;
}

        unhash 这个函数一看就不对劲

void udp_lib_unhash(struct sock *sk)
{
	if (sk_hashed(sk)) {
		struct udp_table *udptable = sk->sk_prot->h.udp_table;
		struct udp_hslot *hslot, *hslot2;

		hslot  = udp_hashslot(udptable, sock_net(sk),
				      udp_sk(sk)->udp_port_hash);
		hslot2 = udp_hashslot2(udptable, udp_sk(sk)->udp_portaddr_hash);

		spin_lock_bh(&hslot->lock);
		if (sk_nulls_del_node_init_rcu(sk)) {
			hslot->count--;
			inet_sk(sk)->inet_num = 0;
			sock_prot_inuse_add(sock_net(sk), sk->sk_prot, -1);

			spin_lock(&hslot2->lock);
			hlist_nulls_del_init_rcu(&udp_sk(sk)->udp_portaddr_node);
			hslot2->count--;
			spin_unlock(&hslot2->lock);
		}
		spin_unlock_bh(&hslot->lock);
	}
}

        果然,一个是基于端口号的 hash,另一个基于 port + addr 的 hash, 都被取消了引用!

4 印证

        原理已经搞明白了,再自己复现一下,印证一番:

        先搞它一个 server,你发啥,我回啥:

const char* g_server_ip = "127.0.0.1";
uint16_t g_server_port = 6666;

int do_server()
{
    int sock = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);
    if (sock < 0) {
        printf("server socket failed: %s\n", strerror(errno));
        return -1;
    }

    uint32_t ip;
    inet_aton(g_server_ip, (struct in_addr *)&ip);

    struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = ip;
    addr.sin_port = htons(g_server_port);

    if (bind(sock, (struct sockaddr *)&addr, (socklen_t)sizeof(addr)) < 0) {
        printf("server bind failed: %s\n", strerror(errno));
        return -1;
    }

    char buf[10240];
    struct sockaddr_in src_addr;
    socklen_t addrlen = sizeof(src_addr);
    while (1) {
        ssize_t ret = recvfrom(sock, buf, sizeof(buf), 0,
                          (struct sockaddr *)&src_addr, &addrlen);
        if (ret < 0) {
            if (errno != EAGAIN) {
                printf("server recv failed: %s\n", strerror(errno));
                break;
            }
            continue;
        } 

        buf[ret] = 0;
        size_t ret_s = sendto(sock, buf, ret, 0,
                              (struct sockaddr *)&src_addr, addrlen);
        printf("resp:%s %d/%d\n", buf, ret_s, ret);
    }

    return 0;
}

        有 server ,必有 client:

void disconnect(int sock)
{
    uint32_t ip;
    inet_aton("0.0.0.0", (struct in_addr *)&ip);

    struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));

    if (connect(sock, (struct sockaddr *)&addr, (socklen_t)sizeof(addr)) < 0) {
        printf("client connect failed: %s\n", strerror(errno));
    }
}

int do_client()
{
    int sock = socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP);
    if (sock < 0) {
        printf("client socket failed: %s\n", strerror(errno));
        return -1;
    }

    uint32_t ip;
    inet_aton(g_server_ip, (struct in_addr *)&ip);

    struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_addr.s_addr = ip;
    addr.sin_port = htons(g_server_port);

    char buf[10240];
    struct sockaddr_in src_addr;
    socklen_t addrlen = sizeof(src_addr);
    int i = 0;
    while (1) {
        int n = snprintf(buf, sizeof(buf), "echo %d", i++);
        size_t ret_s = sendto(sock, buf, n, 0,
                              (struct sockaddr *)&addr, sizeof(addr));
        if (ret_s != n) {
            break;
        }

        udp_connect(sock);

        ssize_t ret = recvfrom(sock, buf, sizeof(buf), 0,
                          (struct sockaddr *)&src_addr, &addrlen);
        if (ret < 0) {
            if (errno != EAGAIN) {
                printf("client recv failed: %s\n", strerror(errno));
                break;
            }
            sleep(1);
            continue;
        } 

        buf[ret] = 0;
        printf("resp:%s %d/%d\n", buf, ret, n);
        sleep(1);
        break;
    }

    return 0;
}

        先发一个请求,然后 disconnect 一下,看看能否收到回包:

# server 收到请求,并回了响应
[root@centos udp_connect]# ./a.out -s
resp:echo 0 6/6
^C

# client 发出了请求,未收到响应,阻塞在了recvfrom处
[root@centos udp_connect]# ./a.out -s
resp:echo 0 6/6
^C

# 抓包发现udp不可达的icmp
[root@centos ~]# tcpdump -i any port 6666 or \( icmp and host 127.0.0.1 \) -nn
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on any, link-type LINUX_SLL (Linux cooked), capture size 262144 bytes
23:28:23.314272 IP 127.0.0.1.50864 > 127.0.0.1.6666: UDP, length 6
23:28:23.314372 IP 127.0.0.1.6666 > 127.0.0.1.50864: UDP, length 6
23:28:23.314381 IP 127.0.0.1 > 127.0.0.1: ICMP 127.0.0.1 udp port 50864 unreachable, length 42
^C
3 packets captured
6 packets received by filter
0 packets dropped by kernel
[root@centos ~]# 

        符合预期

        最后还是附上测试代码:Linux/udp_connect at master · Fireplusplus/Linux · GitHub

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1956372.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【基于PSINS】UKF/SSUKF对比的MATLAB程序

UKF与SSUKF UKF是&#xff1a;无迹卡尔滤波 SSUKF是&#xff1a;简化超球面无迹卡尔曼滤波 UKF 相较于传统的KF算法&#xff0c;UKF能够更好地处理非线性系统&#xff0c;并且具有更高的估计精度。它适用于多种应用场景&#xff0c;如机器人定位导航、目标跟踪、信号处理等。…

机器学习 | 计算分类算法的ROC和AUC曲线以随机森林为例

受试者工作特征&#xff08;ROC&#xff09;曲线和曲线下面积&#xff08;AUC&#xff09;是常用的分类算法评价指标&#xff0c;本文将讨论如何计算随机森林分类器的ROC 和 AUC。 ROC 和 AUC是量化二分类区分阳性和阴性类别能力的度量。ROC曲线是针对不同分类阈值的真阳性率&…

Mac电脑 系统监测工具 System Dashboard Pro【简单操作,小白轻松上手】

Mac分享吧 文章目录 效果一、下载软件二、开始安装1、双击运行软件&#xff0c;将其从左侧拖入右侧文件夹中&#xff0c;等待安装完毕2、应用程序显示软件图标&#xff0c;表示安装成功 三、运行测试安装完成&#xff01;&#xff01;&#xff01; 效果 一、下载软件 下载软件…

opencascade AIS_PlaneTrihedron 源码学习

AIS_PlaneTrihedron 前言 构建一个可选择的2D轴系在3D绘图中。 这个轴系可以放置在3D系统中的任何位置&#xff0c;提供一个用于在平面中绘制曲线和形状的坐标系。 有三种选择模式&#xff1a; 模式0 选择整个平面“trihedron” 模式1 选择平面“trihedron”的原点 模式2 选择…

Nuxt.js 路由管理:useRouter 方法与路由中间件应用

title: Nuxt.js 路由管理&#xff1a;useRouter 方法与路由中间件应用 date: 2024/7/28 updated: 2024/7/28 author: cmdragon excerpt: 摘要&#xff1a;本文介绍了Nuxt 3中useRouter方法及其在路由管理和中间件应用中的功能。内容包括使用useRouter添加、移除路由&#xf…

Cesium高性能渲染海量矢量建筑

0、数据输入为类似Geojson的压缩文件和纹理图片&#xff0c;基于DrawCommand命令绘制&#xff1b; 1、自定义建筑几何&#xff0c;包括顶点、法线、纹理等&#xff1b; 2、自定义纹理贴图&#xff0c;包括按建筑高度贴图、mipmap多级纹理&#xff1b; 3、自定义批处理表&…

我的新书《Android系统多媒体进阶实战》正式发售了!!!

我的新书要正式发售了&#xff0c;把链接贴在下面&#xff0c;感兴趣的朋友可以支持下。 ❶发售平台&#xff1a;当当&#xff0c;京东&#xff0c;抖音北航社平台&#xff0c;小红书&#xff0c;b站 ❷目前当当和京东已开启预售 ❸当当网 https://u.dangdang.com/KIDHJ ❹…

22 B端产品经理与MySQL基本查询、排序(2)

MySQL基本常识 MySQL&#xff1a;一种关系型数据库管理系统。是按照数据结构来组织、存储和管理数据的仓库。 数据库&#xff1a;是一些关联数据表的集合。 数据表&#xff1a;表是数据的矩阵&#xff0c;看起来像电子表格&#xff0c;如下图&#xff1a;user表和admin表。 …

⌈ 传知代码 ⌋ 红外小目标检测

&#x1f49b;前情提要&#x1f49b; 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间&#xff0c;对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取 以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦&#x…

keil5导入程序到stm32的开发板

如图&#xff0c; 1&#xff0c;安装mdk_514.exe 2&#xff0c;安装Keil.STM32F1xx_DFP.1.0.5.pack 3&#xff0c;注册方法&#xff08;仅限学生使用&#xff09;&#xff1a;http://www.openedv.com/thread-69384-1-1.html 点击keil程序的上面魔法棒&#xff0c; 在device中…

类中的function无法正确被matlab所识别,该怎么操作呢?

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…

【Linux】CentOS更换国内阿里云yum源(超详细)

目录 1. 前言2. 打开终端3. 确保虚拟机已经联网4. 备份现有yum配置文件5. 下载阿里云yum源6. 清理缓存7. 重新生成缓存8. 测试安装gcc 1. 前言 有些同学在安装完CentOS操作系统后&#xff0c;在系统内安装比如&#xff1a;gcc等软件的时候出现这种情况&#xff1a;&#xff08…

SpringBoot3如何整合Redis?

SpringBoot应该不用介绍&#xff01;它是Spring当前最火的一个框架&#xff0c;整合Spring Boot 3和Redis可以显著提升应用程序的性能&#xff0c;特别是在处理大量数据和需要快速访问的场景下。 在Spring Boot中&#xff0c;从1.x版本到2.x版本的Redis连接方式发生了变化&…

点脂成金携手北京新颜兴医疗美容医院,共启战略合作新篇章

2024年7月24日上午&#xff0c;点脂成金品牌方与北京新颜兴医疗美容医院在京举行了隆重的签约仪式&#xff0c;宣布达成战略合作关系&#xff0c;共同开启医疗美容领域的设备共享新篇章。 签约仪式在北京纯脂医疗美容门诊部有限公司举行&#xff0c;现场氛围热烈而庄重。点脂成…

使用 WebSocket 实现实时聊天

个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务&#xff09; &#x1f48c;个人邮箱&#xff1a;[2435024119qq.com] &#x1f4f1…

基于opencv的人脸识别(实战)

前言 经过这几天的学习&#xff0c;我已经跃跃欲试了&#xff0c;相信大家也是&#xff0c;所以我决定自己做一个人脸识别程序。我会把自己的思路和想法都在这篇博客内讲清楚&#xff0c;大家可以当个参考&#xff0c;&#x1f31f;仅供学习使用&#x1f31f;。 &#x1f31f…

黑马程序员2024最新SpringCloud微服务开发与实战 个人学习心得、踩坑、与bug记录Day5 全网最快最全

你好,我是Qiuner. 为帮助别人少走弯路和记录自己编程学习过程而写博客 这是我的 github https://github.com/Qiuner ⭐️ gitee https://gitee.com/Qiuner &#x1f339; 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 &#x1f604; (^ ~ ^) 想看更多 那就点个关注吧 我会…

树莓派_Opencv学习笔记23:模版样本匹配

今日继续学习树莓派4B 4G&#xff1a;&#xff08;Raspberry Pi&#xff0c;简称RPi或RasPi&#xff09; 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: ​ Opencv 版本是4.5.1&#xff1a; ​ Python 版本3.7.3&#xff1a; 今日学习Opencv样本…

香烟商品销售网站

1 香烟商品销售网站概述 1.1 课题简介 1.2 设计目的 1.3 系统开发所采用的技术 1.4 系统功能模块 2 数据库设计 2.1 建立的数据库名称 2.2 所使用的表 3 香烟商品销售网站设计与实现 1. 注册登录&#xff1a; 2. 分页查询&#xff1a; 3. 分页条件&#xff08;精确、…

速卖通卖家如何利用自养号测评,让店铺曝光量飙升?

在速卖通这个竞争激烈的跨境电商平台上&#xff0c;店铺曝光率是决定销售成败的关键因素之一。为了在众多商家中脱颖而出&#xff0c;增加速卖通店铺曝光显得尤为重要。速卖通怎么增加店铺曝光&#xff1f; 速卖通怎么增加店铺曝光? 1、优化产品列表 速卖通的产品列表是买家…