互联网架构变迁:从 TCP/IP “呼叫” 到 NDN “内容分发” 的逐浪之旅

news2025/1/12 22:39:33

本文将给出关于互联网架构演进的一个不同视角。回顾一下互联网的核心理论基础产生的背景:
在这里插入图片描述

左边是典型的集中控制通信网络,很容易被摧毁,而右边的网络则没有单点问题,换句话说它很难被全部摧毁,与此同时,分时计算机无法容忍 “占线”,它希望网络也是一个分时系统。如何同时处理多个来源的数据包的交织是一个实际问题,最后,莱昂纳德克莱因洛克通过排队论数学分析,使人们相信了分组交换网的可行性。

理论基础奠定后,时间来到 1970 年代,人们需要将概念工程化,TCP 诞生,但 IP 还没有。再次通过 RFC675 看 TCP 最初的样子,4.2 节展示了 TCP 格式:

8  bits: Internet information
2  bits: Reserved for local PSN use
2  bits: Header format (11 in binary)
4  bits: Protocol version number
8  bits: Header length in octets (32 is the current value)
16 bits: Length of text in octets
32 bits: Packet sequence number
32 bits: Acknowledgment number (i.e. sequence number of next octet expected).
16 bits: Window size (in octets)
16 bits: Control Information
   Listed from high to low order:
   SYN: Request to synchronize sending sequence numbers
   ACK: There is a valid acknowledgment in the 32 bit ACK field
   FIN: Sender will stop SENDing and RECEIVEing on this connection
   DSN: The sender has stopped using sequence numbers and wants to initiate a new sequence number for sending.
   EOS: This packet is the end of a segment and therefore has a checksum in the 16 bit checksum field. If this bit is not set, the 16 bit checksum field is to be ignored. The bit is usually set, but if fragmentation at a GATEWAY occurs, the packets preceding the last one will not have checksums, and the last packet will have the checksum for the entire original fragment (segment) as it was calculated by the sending TCP.
   EOL: This packet contains the last fragment of a letter. The EOS bit will always be set in this case.
   INT: The sender wants to INTERRUPT on this connection.
   XXX: six (6) unused control bits
   OD: three (3) bits of control dispatch:
     000: Null (the control octet contents should be ignored}
     001: Event Code is present in the control octet. These were defined in section 2.4.3.
     010: Special Functions
     011: Reject (codes as yet undefined)
     1XX: Unused
8  bits: Control Data Octet
      If CD is 000 then this octet is to be ignored.
      If CD is 001, this octet contains event codes defined in section2.4.3
      If CD is 010, this octet contains a special function code as defined below:
      0: RESET all connections between Source and Destination TCPs
      l: RESET the specific connection referenced in this packet
      2: ECHO return packet to sender with the special function code ECHOR (Echo Reply).
      3: QUERY Query status of connection referenced in this packet
      4: STATUS Reply to QUERY with requested status.
      5: ECHOR Echo Reply
      6: TRASH Discard packet without acknowledgment
      >6: Unused
      Note: Special function packets not pertaining to a particular connection [RESET all, ECHO, ECHOR, and TRASH] are normally sent using socket zero as described in section 3.2.
      If CD is 01l, this octet contains an as yet undefined REJECT code.
      If CD is 1XX, this octet is undefined.
# 4  bits: Length of destination network address in 4 bit units (current value is 1)
# 4  bits: Destination network address
      1010-1111 are addresses of ARPANET, UCL, CYCLADES, NPL, CADC, and EPSS respectively.
# 16 bits: Destination TCP address
# 8  bits: Padding
# 4  bits: length of source network address in 4 bit units (current value is 1)
# 4  bits: source network address (as for destination address)
# 16 bits: Source TCP address
# 24 bits: Destination port address
# 24 bits: Source port address
16 bits: Checksum (if EOS bit is set)

看上去和现在的 TCP 一点都不一样,当时 TCP 和后来的 IP 是同一个协议,统称 TCP。第 41 行开始(我做了 # 标记)的字段与寻址有关,早期并没有采用固定 32 位地址,而采用了一种非常变通的方式:

  • 4bits 指示网络地址长度,16bits 寻址该网络内的具体 TCP 实体。

我们知道,“16 bits: Destination TCP address” 标识的 TCP 实体其实就是主机地址,但在当时,一个 TCP 就表示一个主机,因为没别的协议。接下来的 24bit 端口有点意思,我们知道最终它变成了 16bit,用于多路复用和解复用。

在 1980 年 RFC760 和 RFC761 试图分离 IP 并标准化 TCP/IP 时,考虑到当时的实现开销(慢 CPU,小内存),变长地址转向固定 32bit,即 IP 地址,这一切终于在 RFC791 和 RFC793 中最终被标准化,就是 TCP/IPv4。

回顾互联网早期历史时,虽然分时系统已经预见了后来的 PC 以及随之而来的内容分发时代迟早到来,但畅想归畅想,在实践中仍然倾向于换一种方式 “打电话”,这更实际,所以我们看到 1974 年的 TCP 是一条虚电路,建立 TCP 连接带着浓厚的 “呼叫”,“连接” 的味道(细看 SYN,ACK/SYN[是这个顺序,而不是 SYN/ACK],ACK)。

至于 IP,它只是从 TCP 剥离出来的一个极其稳定的平台,极其稳定的原因是它极其简化,它甚至没有任何语义,但在本质上,IP 依旧源自于 “呼叫”,IP 互联的意思是,基于 IP 之上端到端传输层协议的点对点互联,一个 IP 地址与另一个 IP 地址之间的 “通信”。换句话说,IP 不负责 “打电话的方式” 这种复杂的带有逻辑的语义,但 IP 地址似乎就是 “电话号码” 本身。

离开 TCP/IP 转向底层分组交换传输网络,我们发现无论是 X.25,帧中继,还是 ATM,都可归为 “用分组交换的方式打电话”。当我们说 ATM 带有电信的影子时我们在说什么,这个问题很有趣。

分组交换传输网络转发方案分为两大阵营,分别为利用路由器内转发状态(流表)的电信阵营和利用数据包中转发指示(地址)的互联网阵营,前者成员直接或间接传承传统电话电信系统(ITU),典型作品为 ATM,后者则来自相对较新的开放组织(IEEE/IETF),典型作品为以太网,TCP/IP。下面简述它们彼此争论的核心过程和结果。

我们现在知道,ATM 以及其它虚电路传输技术都是分离后 IP(即 RFC760 之后) 的反面,看清 IP 后反着看就看清了它们所有。IP 是无状态,尽力而为(best-effort)的,这意味着路由器不保留任何包或流状态,所有寻址信息都在数据包本身(即 IP 头),路由器仅执行 SPF 逐跳转发。那么反过来,ATM 等网络就是在交换机保存状态,数据包中携带一个短标识,该标识可以理解为交换机中保存状态的索引,即虚电路标识。虚电路网络基于虚电路标识的转发本质上就是 “标签交换”。

虚电路网络采用有状态交换的好处之一就是 QoS 非常容易实现,有句话说得好,IP 从诞生到现在一直在想办法支持 QoS,而 QoS 一直是虚电路网络的核心原则。

IP 除了无状态交换,其数据包的大小是可变长的,这加剧了时延和抖动的不确定性,对于电话系统的设计者或受其影响的网络工作者而言不可接受,那么自然而然的,固定大小的信元交换就成了这类虚电路网络的核心特征。衍生自电话系统的设计,虚电路信元足够短,这样才能支持足够细粒度的信元调度,以确保低时延和低抖动,既然信元足够短,支持相对大的头(比如 IP 头)就显得昂贵,这又反过来催使信元交换网络必须采用有状态交换,每个信元中的地址只是一个简单的表索引,而不是索引匹配的目的地址,所有的信息都在交换机中。

你看,信元交换和有状态网络是相辅相成,相互加强的。相对应的,IP 的无状态交换和变长包也是相辅相成的。

最后,在一种朴素的哲学意义上,任何相对立的事物最终都会出现某种融合,MPLS 就是典型例子,在变长的数据包而不是定长的信元上使用标签交换。另一个更加激进的融合实例是 IP NAT,它本质上也是标签交换,只不过它交换的是 IP 地址本身。

以上我们看到,无论从 TCP/IP 还是底层传输网络来看,“呼叫”,“连接” 是早期互联网的核心,但随着 1980 年代后期到 1990 年代全面进入 PC 时代后以及随着 Web 的发展,“呼叫” 网络逐渐开始变成 “内容” 网络,在这种网络中,一台计算机程序 “呼叫” 另一台计算机程序是非常奇怪的,取而代之更合理的是多台计算机作为客户端从少数服务器上 “获取内容”。这导致了前面的文章 TCP Listen 语义与端口失衡 里提到的源端口和目标端口数量偏斜以及与之相关的一系列问题,我也给出了相应的 work around,但在这里,我用更抽象的描述重述同一件事。

TCP 可分为两类,作为内容服务的 Anycast TCP 以及作为通信连接的 Unicast TCP:

  • 内容 TCP:非对称连接,dport 高 8bit 作为 Anycast 服务进程索引(比如 hash 索引),低 8bit 做 Anycast 地址索引服务类型;
  • 通信 TCP:对称连接,一对一通信,类似呼叫类服务,打电话,远程登录等。

无论哪一种,都并非一定需要 Listen,注意,Listen 是 Socket 的,不是 TCP 的。内容 TCP 请求可以直接定向到服务进程,而通信 TCP 请求可以执行唤起服务进程的操作,类似 Unix 系统中 “振铃” 服务,而 sip + sport 和 dip + dport 可视作主叫和被叫的 “电话号码”,这就很类似 fork + exec 操作,只是为了实现这个操作,Listen + Accept 非常合适而已。

但 work around 总归治标不治本,这是因为 TCP 甚至整个 TCP/IP 协议族本就不适合内容分发,它最初是为全球 IP 互联互通的 “呼叫” 和 “连接” 创立的,但后面的发展表明,类似 Web 这种多对一的 C/S 内容分发应用才是互联网上最流行的,NAT 之所以可行并大规模铺开,反面印证了内容分发模式应用确实是普遍的,否则如果真的都是一对一通信应用,NAT 根本无法部署实施。

映射到现实世界,人们去商超购物,去影院看电影,去饭店吃饭这种出入公共场所的频率远大于去私人家登门拜访的频率,而出入公共场所和出入私人家最本质的区别有两个:

  • 公共场所不需要登记人们是谁或来自哪里,但私人拜访需要;
  • 公共场所不挑地址,比如连锁店去最近的那家即可,但私人拜访必须去固定地址。

映射回互联网络架构,这导致专门用于内容分发的网络被提出,即 NDN(Named Data Networking),这是一种以内容为中心的网络,人们只关心获取的内容,并不关心该内容来自哪里,同时,内容提供者也过度不关心请求者来自哪里。

NDN 是一种非常激进的网络架构,它要求路由器记录每包状态,却不强制每包内含任何地址信息,同时,它建议路由器缓存它能尽力缓存的一切内容,比如被很多人请求频率很高的内容。

包中没有地址如何路由,还记得虚电路如何做的吗,包中有个虚电路标号,索引交换机的状态表即可,对应于 NDN,包里有个 “内容名字”,索引路由器中的状态表即可:
在这里插入图片描述

如果本地没有请求名字对应的内容,路由器如何知道内容在哪里呢?这涉及到 NDN 复杂的技术细节,比如沿途路由器可以自学习机制,学习过路名字/内容对所对应的端口,或者直接泛洪,还有一种可能就是内容提供者主动泛洪或自定义推送,类似商场搞活动时沿途发传单推销,传单上印有店铺地址。

至于路由器如何缓存内容,主要看内容的流行度,重要程度以及一些自定义策略。

NDN 延续了 TCP/IP 成功的沙漏模型,保持了沙漏形状的架构,但用数据名字代替 IP 地址进行数据传输。增加路由器的缓存功能也在情理之中,TCP/IP 的年代存储部件小且昂贵,如今不同了。

NDN 是天然的静态内容分发网络,它和现实世界是高度拟合的,在内容的自然选择下,最流行,最重要,流量最大的内容总会在离人们最近的边缘节点被缓存,这就是一个无需 GSLB 的 CDN 网络。至于动态内容,它天然就是一个扇入系统,自带拥塞属性,类似直播的流量几乎就是现实世界演唱会,大型集会的翻版。

由于 CDN 的高速发展和全面部署,回源被聚拢在 CDN 内容提供商极其粗壮的内网,掩盖了传统 TCP/IP 的大多数问题,使 NDN 网络始终停留在概念,但它的理念无疑是先进的,从 NDN 先进的内容分发理念的意义上说,CDN 只是一个 work around,比如它始终解决不了最后一公里拥塞问题,因为本质上 CDN 仍是一个多对一访问系统,而 NDN 会将内容推向离多个用户更近的多个位置,没了带宽竞争,问题自然消失,交易则是用存储成本自动机交换独享内容带宽。

NDN 是一种完全不同于 TCP/IP 并与之并列的网络架构,它甚至不使用 IP 这个稳定的平台。如果说 TCP/IP 适用于点到点通信,它本质上还是一个通信网络,那么 NDN 就是一个专门的静态内容分发网络,非常适用于 Web。如果 1960~1970 年代网络从理论,概念到工程化的时期,内容分发已经比打电话,远程登录,互传文件更流行了,那么可想而知,如今的互联网架构大概率就是 NDN 或与之类似的,它可能仍叫 TCP/IP,但含义将完全不同。

醉过风,喝过茶,没得英雄名讳,掂量个旧事抵酒价,在座皆算老友,碗底便是天涯,作罢。

浙江温州皮鞋湿,下雨进水不会胖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2275682.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nvim 打造成可用的IDE(2)

上一个 文章写的太长了, 后来再写东西 就一卡一卡的,所以新开一个。 主要是关于 bufferline的。 之前我的界面是这样的。 这个图标很不舒服有。 后来发现是在这里进行配置。 我也不知道,这个配置 我是从哪 抄过来的。 测试结果&#xff1…

drawDB docker部属

docker pull xinsodev/drawdb docker run --name some-drawdb -p 3000:80 -d xinsodev/drawdb浏览器访问:http://192.168.31.135:3000/

Redis--20--大Key问题解析

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 大Key问题1.什么是 Redis 大 Key?在 Redis 中,大 Key 是指单个键值对的数据量非常大,可能包含大量数据。 2. Redis大Key的危害3.…

自动驾驶---E2E架构演进

1 背景 模型最早应用的自动驾驶模块就是感知层面,随着技术的发展,逐渐开始应用到决策规划等其它模块。端到端自动驾驶架构是一种基于深层神经网络模型和方法的自动驾驶技术模式。目前一段式端到端系统只有在英伟达早期所做的demo中实现,再者就…

如何优雅地绘制时序图

说到时序图,相信所有从事嵌入式开发的伙伴都非常熟悉,在各种元器件手册以及处理器说明书中,但凡涉及到通信、接口、交互等内容,都会涉及到时序图。时序图可以非常详细且明确地描述硬件及软件接口中各个信号的时序关系,…

SpringCloud系列教程:微服务的未来(十一)服务注册、服务发现、OpenFeign快速入门

本篇博客将通过实例演示如何在 Spring Cloud 中使用 Nacos 实现服务注册与发现,并使用 OpenFeign 进行服务间调用。你将学到如何搭建一个完整的微服务通信框架,帮助你快速开发可扩展、高效的分布式系统。 目录 前言 服务注册和发现 服务注册 ​编辑 …

WebGIS在应急灾害中对村庄、风景区、机场的影响范围应用-以日喀则市定日县地震为例

目录 前言 一、关于影响范围 1、震中距离5公里 2、震中20公里范围 3、20到80公里范围 二、空间查询知识 1、相关数据介绍 2、空间数据查询 三、前后端数据查询以及web可视化实现 1、后台API实现 2、WebGIS前端实现 四、Web成果展示 1、空间位置分析 2、包含风景区…

使用网页版Jupyter Notebook和VScode打开.ipynb文件

目录 正文 1、网页版Jupyter Notebook查看 2、VScode查看 因为总是忘记查看文件的网址,收藏了但分类众多每次都找不到……当个记录吧(/捂脸哭)! 正文 此处以gitub中的某个仓库为例: https://github.com/INM-6/mu…

景联文科技提供高质量多模态数据处理服务,驱动AI新时代

在当今快速发展的AI时代,多模态数据标注成为推动人工智能技术进步的关键环节。景联文科技作为行业领先的AI数据服务提供商,专注于为客户提供高质量、高精度的多模态数据标注服务,涵盖图像、语音、文本、视频及3D点云等多种类型的数据。通过专…

Python在Excel工作表中创建数据透视表

在数据处理和分析工作中,Excel作为一个广泛使用的工具,提供了强大的功能来管理和解析数据。当面对大量复杂的数据集时,为了更高效地总结、分析和展示数据,创建数据透视表成为一种不可或缺的方法。通过使用Python这样的编程语言与E…

django基于Python的电影推荐系统

Django 基于 Python 的电影推荐系统 一、系统概述 Django 基于 Python 的电影推荐系统是一款利用 Django 框架开发的智能化应用程序,旨在为电影爱好者提供个性化的电影推荐服务。该系统通过收集和分析用户的观影历史、评分数据、电影的属性信息(如类型…

GPT-SoVITS学习01

1.什么是TTS TTS(Text-To-Speech)这是一种文字转语音的语音合成。类似的还有SVC(歌声转换)、SVS(歌声合成)等。 2.配置要求 GPT-SoVITS对电脑配置有较高的要求。 训练:对于Windows电脑&#…

计算机网络 (36)TCP可靠传输的实现

前言 TCP(传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议。TCP通过多种机制实现可靠传输,这些机制主要包括连接管理、序列号和确认应答机制、重传机制、流量控制、拥塞控制等。 一、连接管理 TCP使用三次握手&#xff0…

视频编辑最新SOTA!港中文Adobe等发布统一视频生成传播框架——GenProp

文章链接:https://arxiv.org/pdf/2412.19761 项目链接:https://genprop.github.io 亮点直击 定义了一个新的生成视频传播问题,目标是利用 I2V 模型的生成能力,将视频第一帧的各种变化传播到整个视频中。 精心设计了模型 GenProp&…

make工程管理器与Makefile

目录 一、介绍 1、make工程管理器 2、Makefile 二、Makefile语法规则 1、Makefile语法格式 2、Makefile中特殊处理与伪目标 3、变量、规则与函数 (1)自定义变量使用示例 (2)自动变量使用示例 一、介绍 1、make工程管理器 定义: make是一个命令工具&…

【git】-2 分支管理

目录 一、分支的概念 二、查看、创建、切换分支 1、查看分支-git branch 2、创建分支- git branch 分支名 3、切换分支- git checkout 分支名 三、git指针 -实现分支和版本间的切换 四、普通合并分支 git merge 文件名 五、冲突分支合并 ​​​​​​【git】-初始gi…

3DGabor滤波器实现人脸特征提取

import cv2 import numpy as np# 定义 Gabor 滤波器的参数 kSize 31 # 滤波器核的大小 g_sigma 3.0 # 高斯包络的标准差 g_theta np.pi / 4 # Gabor 函数的方向 g_lambda 10.0 # 正弦波的波长 g_gamma 0.5 # 空间纵横比 g_psi np.pi / 2 # 相位偏移# 生成 Gabor 滤…

接口项目架构流程图-thinkphp6-rabbitmq

一、整个系统流程 第一步:平台在创建好后开启消息队列; 第二步:平台为需要服务的客户开好账号并传输对应的公私钥文件; 第三步:客户通过平台分享的接口连接地址采用开户时的手机号查看; 第四步:…

Vue3初学之组件通信

一起进行学习: 在 Vue 3 中,组件通信是一个非常重要的概念,它决定了如何在父子组件之间、兄弟组件之间以及跨层级组件之间传递数据和事件。以下是 Vue 3 中常见的组件通信方式: 父子组件通信 1.1 父组件向子组件传递数据&#x…

2025年第三届“华数杯”国际大学生数学建模竞赛【A题】Problem A: Can He Swim Faster

问题1:运动员的出色比赛表现通常得益于艰苦且持续的专业训练,这不仅提升了游泳技能,也增强了生理储备。比赛中,科学控制游泳速度是关键,包括保持个人节奏、寻求最佳身体状态节奏和合理分配体力。针对自由泳项目&#x…