PCIE协议-1

news2025/1/15 22:53:21

1. PCIe结构拓扑

一个结构由点对点的链路组成,这些链路将一组组件互相连接 - 图1-2展示了一个结构拓扑示例。该图展示了一个称为层级结构的单一结构实例,由一个根复合体(Root Complex, RC)、多个端点(I/O设备)、一个交换机以及一个PCI Express到PCI/PCI-X桥接器组成,所有这些都通过PCI Express链路互相连接。

1.1 根复合体

  • 根复合体(RC)表示输入/输出(I/O)层级结构的根,它连接了CPU/内存子系统和I/O。如图1-2所示,一个RC可能支持一个或多个PCI Express端口。每个接口定义了一个单独的层级域。每个层级域可能由单个端点组成,或者包含一个或多个交换机组件和端点的子层级结构。
  • 通过RC在层级域之间路由对等事务的能力是可选的,并且取决于具体实现。例如,一个实现可能在根复合体内部整合一个真实或虚拟的交换机,以软件透明的方式启用完整的对等支持。与交换机的规则不同,RC通常被允许在层级域之间路由对等事务时将数据包分割成更小的数据包(如下所述例外),例如,将一个具有256字节有效载荷的单个数据包分割成两个各具有128字节有效载荷的数据包。由此产生的数据包将受到本规范中包含的数据包形成规则的约束(例如,Max_Payload_Size(最大有效载荷大小)、Read Completion Boundary(读完成边界,RCB)等)。组件设计者应注意,将数据包分割成更小的数据包可能会带来负面的性能影响,特别是对于寻址PCI Express到PCI/PCI-X桥接器后面设备的事务。
  • 例外:支持对等路由Vendor_Defined Messages(供应商定义消息)的RC不得将Vendor_Defined Message数据包分割成小于128字节边界的小包,除非在128字节边界处(即,除了最后一个数据包外,所有生成的数据包的长度必须是128字节的整数倍),以保持跨PCI Express到PCI/PCI-X桥接器转发消息的能力。
  • RC必须作为请求者支持生成配置请求。
  • 允许RC作为请求者支持生成I/O请求。
  • 允许RC向选定的根端口生成到地址80h和84h I/O请求,而不考虑该根端口的PCI桥I/O解码配置;建议仅在特别需要时才启用此机制。
  • RC作为完成者不允许支持锁定语义。
  • RC作为请求者允许支持生成锁定请求。

1.2 端点

端点指的是一种可以作为PCI Express事务的请求者或完成者的功能,它可以代表自己,也可以代表一个不同的非PCI Express设备(除了PCI设备或主机CPU之外),例如,一个连接PCI Express的GPU controller或一个PCI Express到USB的host controller。端点被分类为传统型、PCI Express型,或根复合体集成端点(RCiEPs)。

1.2.1 传统端点规则

  • 传统端点必须是一个具有type0配置空间头标的功能。
  • 传统端点作为完成者必须支持配置请求。
  • 传统端点作为完成者可以支持I/O请求。

              ---允许传统端点接收到地址80h和84h的I/O请求,而不考虑该端点的I/O解码配置。

  • 传统端点可以生成I/O请求。
  • 如果设备的支持该需求的传统软件要求,传统端点可以作为完成者支持锁定内存语义。
  • 传统端点不得发出锁定请求。
  • 传统端点可以实现扩展配置空间能力,但软件可能会忽略这些能力。
  • 作为内存事务请求者运行的传统端点不要求能够生成4GB或更大的地址。
  • 如果请求中断资源,传统端点需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现了MSI,传统端点可以支持MSI能力结构的32位或64位消息地址版本。
  • 传统端点支持为请求内存资源的基地址寄存器(BAR)32位寻址。
  • 传统端点必须出现在由根复合体(Root Complex)发起的层级域之一中。

1.2.2 PCI Express端点规则

  • PCI Express端点必须是一个具有type0配置空间头标的功能。
  • PCI Express端点作为完成者必须支持配置请求。
  • PCI Express端点不能依赖操作系统通过基址寄存器(BAR)声明的I/O资源分配。
  • PCI Express端点不得生成I/O请求
  • PCI Express端点作为完成者不得支持锁定请求,也不得作为请求者生成锁定请求。符合PCI Express标准的软件驱动程序和应用程序必须根据该要求编写,以防止在访问PCI Express端点时使用锁定语义。
  • 作为内存事务请求者运行的PCI Express端点要求能够生成大于4GB的地址。
  • 如果请求中断资源,PCI Express端点需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现MSI,PCI Express端点必须支持MSI能力结构的64位消息地址版本。
  • 通过BAR请求内存资源的PCI Express端点必须设置BAR的可预取位,除非该范围包含具有读取副作用的位置,或者该功能在该位置不容忍写合并。
  • 对于设置了可预取位的所有BAR,PCI Express端点必须支持64位寻址。对于所有没有设置可预取位的BAR,允许使用32位寻址。
  • BAR请求的最小内存地址范围是128字节
  • PCI Express端点必须出现在根复合体发起的层级域之一中。

1.2.3 根复合体集成端点规则

  • 根复合体集成端点(RCiEP)是在包含根端口的根复合体的内部逻辑上实现的。
  • RCiEP必须是一个具有类型type0配置空间头标的功能。
  • RCiEP作为完成者必须支持配置请求。
  • RCiEP不得通过基址寄存器(BAR)声明要求I/O资源
  • RCiEP不得生成I/O请求
  • RCiEP不得作为完成者支持锁定请求,也不得作为请求者生成它们。符合PCI Express标准的软件驱动程序和应用程序必须编写,以防止在访问RCiEP时使用锁定语义。
  • 作为内存事务请求者运行的RCiEP需要能够生成等于或大于主机作为完成者能够处理的地址。
  • 如果请求中断资源,RCiEP需要支持MSI(消息信号中断)或MSIX(多消息信号中断),或两者都支持。如果实现了MSI,RCiEP可以支持MSI能力结构的32位或64位消息地址版本。
  • RCiEP可以支持通过基址寄存器请求内存资源的32位寻址。

1.3 Switch

Switch被定义为多个虚拟PCI到PCI桥接设备的逻辑集合,如图1-3所示。所有Switch都遵循以下基本规则:

  • Switch在配置软件中表现为两个或更多的逻辑PCI至PCI桥接。
  • Switch使用PCI桥接机制转发事务;例如,基于地址的路由。
  • 除了本文档中注明的例外情况,一个Switch必须能够在任何一组端口之间转发所有类型的事务层数据包(TLPs)。

  • 锁定请求必须按照第6.5节中的规定得到支持。Switch不必支持下游端口作为锁定请求的发起端口。
  • 每个启用的Switch端口必须遵守本文档中所述的流量控制规范。
  • Switch不允许将一个数据包分割成更小的数据包,例如,一个具有256字节有效载荷的单个数据包不得被分成两个各128字节有效载荷的数据包。
  • 在Switch的入口端口(入站链路)之间进行仲裁时,可以在同一个虚拟通道上发生争用时使用轮询或加权轮询。
  • 端点(由type0配置空间头标表示)在Switch的内部总线上,作为虚拟PCI至PCI桥接的对等体,必须不出现在配置软件中,这些虚拟桥接代表Switch的下游端口。

1.4 根复合体事件收集器

  • 根复合体事件收集器提供支持,用于终止来自RCiEPs(根复合体集成端点)的错误和PME(电源管理事件)消息。
  • 根复合体事件收集器必须遵循所有RCiEP的规则。
  • 根复合体事件收集器不需要解码任何内存或I/O资源。
  • 根复合体事件收集器通过其设备/端口类型值被识别。
  • 根复合体事件收集器具有基类08h、子类07h和编程接口00h。
  • 根复合体事件收集器位于根复合体中的总线上。允许多个根复合体事件收集器位于单个总线上。
  • 根复合体事件收集器通过根复合体事件收集器端点关联扩展功能明确声明支持的RCiEPs。
  • 根复合体事件收集器是可选的。

1.5 PCI Express到PCI/PCI-X桥接器

  • PCI Express到PCI/PCI-X桥接器提供PCI Express结构和PCI/PCI-X层级之间的连接。

2. 发现、配置和操作的硬/软件模型

PCI/PCIe硬件/软件模型包括了架构构建,这些构建对于发现、配置和使用一个功能(Function)是必要的,而不需要特定于功能的知识。关键要素包括:

  • 一个配置模型,它为系统软件提供了一种手段,用以发现系统中可用的硬件功能。
  • 执行基本资源分配的机制,用于可寻址资源,如内存空间和中断。
  • 启用/禁用控制,用于功能对接收请求的响应,以及发起请求。
  • 定义良好的排序和流量控制模型,以支持硬件/软件接口的一致和健壮实现(健壮指的是容错性,稳定性,可靠性,可维护性,可扩展性好)。

PCI Express配置模型支持两种机制:

  • PCI兼容配置机制:PCI兼容机制支持与传统PCI感知操作系统及其相应的总线枚举和配置软件100%的二进制兼容性。

  • PCI Express增强配置机制:提供增强机制是为了增加可用配置空间的大小,并优化访问机制。

每个PCI Express(PCIe)链路都通过一个虚拟的PCI到PCI桥接结构映射,并且与一个逻辑的PCI总线相关联。这个虚拟的PCI到PCI桥接结构可能是PCI Express根复杂端口的一部分,一个Switch上行端口,或者一个Switch下行端口。根端口是一个虚拟的PCI到PCI桥接结构,它从一个PCI Express根复合体开始一个PCI Express层次结构域。设备被映射到配置空间中,以便每个设备都会响应特定的设备编号。

3.PCI Express分层概述

本文档根据三个独立的逻辑层次来指定架构:事务层、数据链路层和物理层。每一层都分为两个部分:一个处理外发(待传输)信息的部分,以及一个处理内入(已接收)信息的部分,如图1-4所示。

这种分层定义的基本目标是促进读者对规范的理解。请注意,这种分层并不意味着特定的PCI Express实现。

PCI Express 使用数据包来在组件之间通信。数据包在事务层和数据链路层中形成,携带信息从发送组件传输到接收组件。随着传输的数据包流经其他层,它们会根据这些层处理数据包所需的额外信息进行扩展。在接收端,会发生相反的过程,数据包从它们的物理层表示形式转换为数据链路层表示形式,最终(对于事务层数据包)转换为可以由接收设备的事务层处理的形式。图 1-5 显示了事务级数据包信息通过各层的概念性流程。 

注意,为了链路管理的目的,两个数据链路层(连接到同一链路)之间支持一种更简单的数据包通信形式。 

3.1 事务层

架构的上层是事务层。事务层的主要职责是组装和拆解事务层数据包(TLPs)。TLPs 用于通信事务,例如读写以及某些类型的事件。事务层还负责管理基于信用的TLPs流量控制。

每个需要响应数据包的请求数据包都实现为分割事务。每个数据包都有一个唯一的标识符,使得响应数据包能够被正确地导向正确的发起者。数据包格式支持根据不同事务类型(内存、I/O、配置和消息)的不同寻址形式。数据包还可能具有诸如无监听(No Snoop)、松散排序(Relaxed Ordering)和基于ID的排序(ID-Based Ordering,IDO)等属性。

事务层支持四种地址空间:它包括三个PCI地址空间(内存、I/O和配置),并增加了消息空间。本规范使用消息空间来支持所有先前的边带信号,例如中断、电源管理请求等,作为带内消息事务。你可以将PCI Express消息事务视为“虚拟线”,因为它们的效果是消除了目前在平台实现中使用的广泛边带信号。

3.2 数据链路层

架构中的中间层是数据链路层,充当事务层和物理层之间的中间媒介。数据链路层的主要职责包括链路管理和数据完整性,包括错误检测和错误校正。

数据链路层的传输端接受事务层组装的TLPs,计算并应用数据保护代码和TLP序列号,并将它们提交给物理层以在链路上传输。 接收数据链路层负责检查接收到的TLPs的完整性,并将它们提交给事务层进行进一步处理。在检测到TLP错误时,这一层负责请求重新传输TLPs,直到信息被正确接收,或确定链路已失败。

数据链路层还生成并消耗用于链路管理功能的包。为了区分事务层(TLP)使用的包,当提到在数据链路层生成和消耗的包时,将使用“数据链路层包(DLLP)”这个术语。

3.3 物理层

物理层包括所有用于接口操作的电路,包括驱动器和输入缓冲器、并行到串行和串行到并行转换、PLL(相位锁定环)和阻抗匹配电路。它还包括与接口初始化和维护相关的逻辑功能。物理层以特定于实现的格式与数据链路层交换信息。这一层负责将从数据链路层接收到的信息转换为适当的串行格式,并以与连接在链路另一端的设备兼容的频率和宽度通过PCI Express链路传输。

PCI Express架构有“钩子”来支持通过速度升级和先进的编码技术来支持未来的性能提升。未来的速率、编码技术或介质可能只影响物理层。

3.4 层功能和服务

3.4.1 事务层服务

在生成和接收事务层数据包(TLPs)的过程中,事务层与其在链路另一端的互补事务层交换流量控制信息。它还负责支持软件和硬件发起的电源管理。

初始化和配置功能要求事务层:

  • 存储由处理器或管理设备生成的链路配置信息
  • 存储由物理层硬件协商生成的链路能力,包括宽度和操作频率

事务层的数据包生成和处理服务要求它:

  • 从设备的核心应用层请求生成TLPs
  • 将接收到的请求TLPs转换为设备核心应用层的请求
  • 将接收到的完成数据包转换为有效载荷或状态信息,可交付给核心应用层
  • 检测不支持的TLPs并调用适当的机制来处理它们
  • 如果支持端到端数据完整性,生成端到端数据完整性CRC(ECRC)并相应更新TLP头标

流量控制服务:

  • 事务层跟踪跨链路的TLPs流控制信用量。
  • 事务信用状态定期使用数据链路层的传输服务传输给远程事务层。
  • 远程流量控制信息用于控制TLP传输。

排序规则:

  • 符合PCI/PCI-X兼容的生产者/消费者排序模型
  • 支持松散排序的扩展
  • 支持基于ID排序的扩展

电源管理服务:

  • 通过系统软件指定的机制进行软件控制的电源管理。
  • 硬件控制的自主电源管理在全速电源状态下最小化功耗。

虚拟通道和流量类别:

  • 提供虚拟通道机制(VC)和流量类别(TC)识别的组合,以支持不同服务和对某些类别应用程序的QoS(服务质量)支持。
  • 虚通道:虚通道提供了一种手段,通过链路的共同物理资源支持多个独立的逻辑数据流。从概念上讲,这涉及将不同的数据流多路复用到单个物理链路上。
  • 流量类别:流量类别是事务层数据包的一个标签,它在通过整个结构时未经修改地端到端传输。在结构内的每个服务点(例如,Switch)上,流量类别标签被用来应用合适的服务策略。每个流量类别标签定义了一个独特的排序域——对于包含不同流量类别标签的数据包,不提供排序保证。

3.4.2 数据链路层服务

数据链路层负责与链路对面的对应方可靠地交换信息。

初始化和电源管理服务:

  • 接受来自事务层的电源状态请求并传达给物理层
  • 向事务层传达 激活/重置/断开连接/电源管理状态

数据保护、错误检查和重试服务:

  • CRC(循环冗余校验)生成
  • 用于数据链路层级重试的传输TLP存储
  • 错误检查
  • TLP确认和重试消息
  • 错误指示用于错误报告和记录

3.4.3 物理层服务

接口初始化、维护控制和状态跟踪:

  • 重置/热插拔控制/状态
  • 接口电源管理
  • 宽度和通道映射协调
  • 通道极性反转

符号和特殊有序集生成:

  • 8b/10b 编码/解码
  • 内嵌时钟调整和对齐

符号传输和对齐:

  • 传输电路
  • 接收电路
  • 接收端的弹性缓冲器
  • 接收端多通道去偏差(对于宽度 > 1)

系统可测试性(DFT)支持特性:

  • 合规模式
  • 修改的合规测试

3.4.4 层间接口

3.4.4.1 事务层/数据链路层接口

事务层到数据链路层接口提供:

  • 要通过链路发送的字节或多字节数据
  1. 本地TLP(事务层数据包)传输握手机制
  2. TLP边界信息
  • 链路请求的电源状态

数据链路层到事务接口提供:

  • 从PCI Express链路接收的字节或多字节数据
  • 接收字节的TLP帧信息
  • 链路的实际电源状态
  • 链路状态信息
3.4.4.2 数据链路层/物理层接口

数据链路层到物理接口层提供:

  • 要通过链路发送的字节或多字节宽数据
  1. 数据传输握手机制
  2. 字节的TLP(事务层数据包)和DLLP(数据链路层数据包)边界信息
  • 链路请求的电源状态

物理层到数据链路层接口提供:

  • 从PCI Express链路接收的字节或多字节宽数据
  • 数据的TLP和DLLP帧信息
  • 物理层检测到的错误指示
  • 链路的实际电源状态
  • 连接状态信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1650272.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机考研|今年这么多高校改考408,该怎么择校呢?

25年改考408院校名单 考研第一重要的事情并不是分要多高,而是要能考得上! 尤其是408,绝对是选择大于努力的典范。方向不对,努力作废! 就看我22年的分数线吧,最炸的就属上海交大了,大旱区结果…

java-函数式编程-语法

目录 1、函数表现形式 分类 lambda表达式 参数类型可以全写,也可以全不写,但不能一部分写,一部分不写lambda 的省略策略:凡是可推导,都可以省略 方法引用 练习-判断语法正确性 练习-写出与方法引用等价的lambda表达式…

【Linux】HTTPS

欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:Linux 目录 👉🏻HTTPS协议概念👉🏻加密为什么要进行加密 👉🏻常见的加密方式对称加密…

C语言栈的含义与栈数据操作代码详解!

引言:在本篇博客中,我们将学到数据结构——栈,讲到栈的含义与关于栈的数据操作代码。栈可以在顺序表、双向链表以及单链表的基础上实现,而于本篇博客中,我们选择在顺序表的基础上实现栈。 更多有关C语言和数据结构知识…

大数据与会计专业主要学什么课程

大数据与会计专业是一个结合了传统会计知识与现代大数据技术的交叉学科,旨在培养既懂会计又熟悉大数据分析的复合型人才。该专业的学生将会学习以下主要课程内容: 会计基础课程:包括基础会计、财务会计、成本会计、管理会计等,这些…

如何搜索空文件夹_名称为(纯或含)中/英/数/符

首先,需要用到的这个工具: 度娘网盘 提取码:qwu2 蓝奏云 提取码:2r1z 打开工具,切换到批量文件复制版块,快捷键Ctrl5 点击右侧的搜索添加 设定要搜索的范围、指定为文件夹、包括子目录,勾选…

SSM整合-前后端分离-项目环境搭建 (上)

整合SSM 项目基础环境搭建项目介绍创建项目项目全局配置web.xmlSpringMVC配置配置Spring和MyBatis, 并完成整合创建表, 使用逆向工程生成Bean, XxxMapper和XxxMapper.xml注意事项和细节说明 实现功能01-搭建Vue前端工程需求分析/图解代码实现搭建Vue前端工程vue3项目目录结构梳…

宜选影票在线选座电影票小程序开发如何获取api接口?

要开发一个在线选座电影票小程序并获取API接口,你需要遵循几个关键步骤。以下是通常的流程: 明确需求和目标: 在开始之前,明确你的小程序需要哪些功能,例如电影查询、场次查询、在线选座、购票支付等。确定你需要从AP…

【智能优化算法】野狗智能优化算法(Dingo Optimization Algorithm DOA)

野狗智能优化算法(Dingo Optimization Algorithm DOA)是期刊“MATHEMATICAL PROBLEMS IN ENGINEERING”的2021年智能优化算法 01.引言 野狗智能优化算法(Dingo Optimization Algorithm DOA)该算法的灵感来自野狗的狩猎策略,即迫害攻击,分组策略和清除行…

VS Code中PlatformIO IDE的安装并开发Arduino

VS Code中PlatformIO IDE的安装并开发Arduino VS Code的安装 略 PlatformIO IDE的安装 PlatformIO IDE是是什么 PlatformIO IDE 是一个基于开源的跨平台集成开发环境(IDE),专门用于嵌入式系统和物联网(IoT)开发。…

2009-2022年上市公司华证ESG评级评分数据(含细分项)

2009-2022年上市公司华证ESG评级评分数据(含细分项) 1、时间:2009-2022年 2、来源:华证ESG 3、指标:证券代码、证券简称、综合评级、年度、综合得分、E评级、E得分、S评级、S得分、G评级、G得分 4、范围&#xff1…

如何解决3D模型变黑或贴图不显示的问题---模大狮模型网

在进行3D建模和视觉渲染时,经常会遇到模型表面变黑或贴图不显示的问题,这可能严重影响最终视觉效果的质量。这些问题通常与材质设置、光照配置或文件路径错误有关。本文将探讨几种常见原因及其解决方法,帮助3D艺术家和开发者更有效地处理这些…

Portforge:一款功能强大的轻量级端口混淆工具

关于Portforge Portforge是一款功能强大的轻量级端口混淆工具,该工具使用Crystal语言开发,可以帮助广大研究人员防止网络映射,这样一来,他人就无法查看到你设备正在运行(或没有运行)的服务和程序了。简而言…

ubuntu20安装colmap

系统环境 ubuntu20 ,cuda11.8 ,也安装了anaconda。因为根据colmap的官方文档说的,如果根据apt-get安装的话,默认是非cuda版本的,而我觉得既然都安装了cuda11.8了,自然也要安装cuda版本的colmap。 安装步骤…

MySQL之聚合函数与应用

1. 前言 上文我们讲到了单行函数.实际上SQL还有一类叫做聚合函数, 它是对一组数组进行汇总的函数, 输入的是一组数据的集合, 输出的是单个值. 2. 聚合函数 用于处理一组数据, 并对一组数据返回一个值. 有如下几种聚合函数 : AVG(), SUM(), MAX(), MIN(), COUNT(). 3. AVG(…

[Scrcpy]数据线连接安卓手机投屏windows电脑[win控制安卓手机]比Samsung Dex好用

配置好,只需要两步即可完成安卓手机投屏windows 第一步:usb线连接windows电脑 第二步:cmd输入投屏命令srccpy 搞定 前言/背景 一些视频资料只能下载到手机,很不喜欢手机那么小屏幕播放,播放很不方便 在家的话可以投…

在做题中学习(50):搜索插入位置

35. 搜索插入位置 - 力扣(LeetCode) 解法:二分查找 思路:题目是有序的,时间复杂度O(logN),二分没跑了,题目说如果找不到target,返回它应该被插入位置的下标,所以可以分析一下示例2…

QT截图程序,可多屏幕截图

截图程序&#xff0c;支持多屏幕时跨屏幕截图。截图使用setMask达到镂空效果&#xff0c;截图后会有预览和保存功能。截图时按下Esc可退出。 mainwindow.ui mainwindow.cpp #include "mainwindow.h" #include "ui_mainwindow.h" #include <QDebug> …

暴雨发布大模型专用分布式全闪存储

近日&#xff0c;暴雨信息发布为大模型专门优化的分布式全闪存储AVERSE系列。该系列依托暴雨信息自研分布式文件系统&#xff0c;搭载新一代数据加速引擎Xdata&#xff0c;通过盘控协同、GPU直访存储、全局一致性缓存等技术为AI大模型数据归集、训练、数据归档与管理等阶段提供…

本机MySQL数据库服务启动了,但是cmd登录不上10061

注意&#xff1a;不建议安装MySQL8&#xff0c;建议直接使用phpstudy中自带的MySQL5.7 错误信息 ERROR 2003 (HY000): Cant connect to MySQL server on x.x.x.x (10061) 原因 可能是端口号错误。比如修改了my.ini中&#xff0c;或者phpstudy中数据库端口的配置&#xff0c;…