NVMe开发——PCIe复位

news2025/1/5 10:58:06

简介

PCIe中有4种复位机制,早期的3种被称为传统复位(Conventional Reset)。传统复位中的前2种又称为基本复位(Fundamental Resets),分别为冷复位(Cold Reset),暖复位(Warm Reset)。第3种复位为热复位(Hot Reset)。第4种复位被称为功能级复位(Function Level Reset),出现在PCIe 2.0规范中。

传统复位

2.1. 基本复位

基本复位由硬件处理,并且是复位整个设备,重新初始化所有硬件的逻辑、端口状态以及配置寄存器。唯一的例外是,有一组标识为"sticky"的寄存器位,因为要记录复位过程中的错误,所以其配套有辅助电源(Vaux)。如果主电源和辅助电源同时关闭,那么Stick寄存器也会复位。

两种基本复位的定义:

冷复位:启动设备主电源或重启设备主电源都会导致冷复位。

暖复位(可选):不关闭主电源下的触发。规范没有定义实现机制,厂商可自行选择是否添加此功能,并设计具体触发的机制,可以考虑通过检测电源状态来实现。

基本复位发生和退出时,正负电压端阻抗必须满足要求,发射端的阻抗和直流也必须满足要求,详见技术规范。

两种基本复位方法:

  1. 通过辅助边带信号PERST#(PCI Express Reset)触发。

  2. 如果未提供边带信号,则重启电源时,组件或插槽会自动产生复位。

2.2. PERST# 基本复位的产生

PERST#信号是边带信号,系统不一定设计有。芯片组可能提供PERST#信号,如下图ICH对外提供PERST#信号。当POWERGOOD信号触发时,ICH会发出PERST#信号。PERST#边带信号会接入所有PCIe设备。

当设备电源关闭,POWERGOOD信号触发,然后产生PERST#信号,这是一个冷复位。(此时设备电源也会同时开启)。

当设备电源开启,系统可以通过其他方式产生PERST#信号以实现暖复位。

2.3. 自主复位的产生

设备在主电源接通时,应该自己产生复位信号,然后对设备进行本地复位。如果设备检测到电源超出范围,也必须生成自主复位。

2.4. 链路从低功耗唤醒

当设备的主要电源被关闭作为电源管理策略的一部分时,如果设备设计用于发出唤醒信号,它可能能够请求恢复到完全供电状态。当电源恢复时,设备必须进行复位。系统的电源控制器可以通过激活PERST#引脚向设备发送复位信号,但如果没有这样做,或者设备不支持PERST#,则设备必须在感知到主电源重新连接时自主生成其自己的基本复位。

2.5. 热复位(带内复位)

热复位是通过在链路上发送特定的TS1消息来实现的。这些消息中的第5个符号的第0位被设置为1,以表示这是一个热复位消息。这些消息将在所有通道上广播,以确保所有链路邻居都能够接收到,并执行相应的操作以响应热复位。一旦完成发送,发送器和接收器将进入特定的状态以处理热复位。这个过程有助于在高速数据链路中进行重置操作,以确保链路的正确性和稳定性。

软件发起的热复位是通过在桥接设备的配置寄存器中设置特定的位来实现的。这个位被称为Secondary Bus Reset位。当此位被设置时,与该桥接设备相关联的所有设备都将接收到复位信号,并进行自我复位。这种复位操作通常由具有桥接功能的设备(例如Root Complex设备或交换机)执行,并且可以通过其控制寄存器进行触发。交换机在接收到热复位信号后将广播给其下游端口,并要求所有下游设备进行复位。这确保了整个链路中的所有设备都可以正确地响应热复位,并重新初始化其状态。

如上图,如果Root Compex或Switch被软件启用了热复位,那么Root Compex或Switch会对其所有下端设备发生热复位。

当热复位接收器检测到连续2个热复位的TS1消息埋,它会进入Hot Reset状态并持续2ms,然后退出检测状态,上行端口和下行端口都会进行初始化,然后再进入检测状态,然后开始免链路的训练。如果下游设备也是交换机或桥接器,它也会将Hot Reset消息转发给其下游端口。

2.6. 热复位方法

2.6.1. 次级总线复位

上级桥接设备的Secondary Bus Reset位于配置空间的Bridge Control寄存器中,可以通过软件修改达到热复位。软件对Secondary Bus Reset寄存器先写入0再写入1,即发出TS1消息,连续2次。

2.6.2. 链路禁用

通过在下游设备的链路控制寄存器中设置Link Disable位,软件可以禁用链路。当禁用链路时,下游组件会收到禁用信号并执行相应的操作,这也会导致它们进行热复位。禁用链路的操作将触发下游端口进入Recovery LTSSM状态,并开始发送具有Disable位设置的TS1消息。需要注意的是,只有在禁用链路后,才能对下游端口进行控制。因此,Link Disable位被保留给上行端口,例如终端设备或交换机上行端口。

Link Control Register寄存器位于PCI Express Capability的Offset PXCAP + 10h: PXLC – PCI Express Link Control。

当上行端口识别到带有Disabled位设置的传入TS1消息时,物理层会向链路层发送LinkUp=0(false)信号,并使所有通道进入电气空闲状态。在经过2毫秒的超时后,上行端口将进入Detect状态,但下行端口将保持在Disabled LTSSM状态,直到被指示退出该状态(例如通过清除Link Disable位),因此链路将保持禁用状态,并且在未被解除禁用之前不会尝试进行训练。

功能层级复位

3.1. FLR

FLR(Function-Level Reset)功能允许软件仅重置多功能设备中的某一个功能,而无需对所有功能进行复位。为了确定是否支持FLR功能,软件可以检查设备能力寄存器中的Function-Level Reset Capability位。如果此位被设置,软件可以通过设置设备控制寄存器中的Initiate Function-Level Reset位来启动FLR操作。FLR的实现虽然推荐,但并非每个设备都支持该功能,因此在尝试使用FLR之前,软件应先确认设备是否支持该功能。

是否支持FLR,通过查看位于PCI Express Capability的Offset PXCAP + 4h: PXDCAP – PCI Express Device Capabilities。

设置FLR,通过设置于通过查看位于PCI Express Capability的Offset PXCAP + 8h: PXDC – PCI Express Device Control。

FLR重置功能的内部状态和寄存器,使其处于静止状态,但不会影响任何sticky位、硬件初始化的位或链路特定的寄存器(如Captured Power、ASPM Control、Max_Payload_Size或Virtual Channel寄存器)。如果已发送了一个未解除的Assert INTx中断消息,则必须发送相应的Deassert INTx消息,除非该中断由内部的另一个功能共享并且仍然处于已断言状态。当接收到FLR时,该功能的所有外部活动都需要停止。

3.2. 时间要求

  1. 与可能访问该功能的其他软件协调,确保在FLR期间不尝试访问该功能。

  2. 清除整个命令寄存器,使该功能处于静止状态。

  3. 确保先前请求的完成已通过轮询设备状态寄存器中的Transactions Pending位进行返回,直到该位被清除或等待足够长的时间以确保这些完成永远不会被返回。多长时间足够长呢?如果使用了完成超时,可以在发送FLR之前等待超时时间。如果禁用了完成超时,则至少等待100毫秒。

  4. 启动FLR并等待100毫秒。

  5. 设置功能的配置寄存器,并使其能够进行正常操作。

当FLR完成后,无论何时完成,都必须清除Transactions Pending位。

3.3. 复位退出

在退出复位状态后,链路训练和初始化必须在20毫秒内开始。由于复位信号是异步的,设备可能在不同的时间退出复位状态,但必须在此时间内开始进行训练。

为了允许复位组件执行内部初始化,系统软件必须在复位结束后至少等待100毫秒才能尝试发送配置请求到它们。如果软件在100毫秒等待时间之后向设备发起配置请求,但设备仍未完成自我初始化,它会返回带有CRS状态的完成。由于配置请求只能由CPU发起,因此完成将返回给根复杂性。作为响应,根复杂性可以自动重新发出配置请求,或者使失败对软件可见。规范还指出,如果启用了CRS软件可见性,则软件应仅使用100毫秒的等待周期,否则可能会导致长时间超时或处理器停滞。

在复位后,设备被允许有1.0秒(-0% / +50%)的时间来做出对配置请求的正确响应。因此,在判断一个无响应的设备是否损坏之前,系统必须小心等待那么长的时间。这个值继承自PCI,这种长时间延迟的原因可能是一些设备将配置空间实现为本地存储器,必须在配置软件能够正确查看之前进行初始化。它的初始化可能涉及从慢速串行EEPROM复制所需的信息,因此可能需要一些时间。

开发实践

Linux下和Windows下的PCIe复位,均是通过操作Capacity Register来实现的。Windows下操作Capacity Register可以通过rw-everything或内核驱动WinIo来实现。以下具体方法使用Linux。

4.1. 传统复位

能够软件操作的只有Hot Reset。两种Hot Reset的方法都需要在上行设备上进行设置。

获取上行设备路径:

michael@ubuntu22:~$ readlink /sys/bus/pci/devices/0000:0f:00.0
../../../devices/pci0000:00/0000:00:02.2/0000:0f:00.0
# 上面的内容即是DBF设备的完整路径,0000:00:02.2即是它的上行设备DBF

4.1.1. Secondary Bus Reset

# 获取Bridge Control寄存器
root@ubuntu22:~# setpci -s 00:02.2 3e.w
0012
root@ubuntu22:~# setpci -s 00:02.2 BRIDGE_CONTROL
0012
# 连续设置2个Reset, 0x52=0x12|0x40,即设置Secondary Bus Rset=1
root@ubuntu22:~# setpci -s 00:02.2 BRIDGE_CONTROL=0x52
root@ubuntu22:~# setpci -s 00:02.2 BRIDGE_CONTROL=0x52
# 还原
root@ubuntu22:~# setpci -s 00:02.2 BRIDGE_CONTROL=0x52
# 通知系统移除设备             /
root@ubuntu22:/home/michael# echo 1 > /sys/bus/pci/devices/0000:0f:00.0/remove
# Rescan
echo 1 > /sys/bus/pci/rescan

4.1.2. Link Disable Rset

# 获取Link Control Register
root@ubuntu22:~# setpci -s 00:02.2 CAP_EXP+10.b
40
# 连续设置2个Reset, 0x50=0x40|0x10,即设置Link Disable=1
root@ubuntu22:~# setpci -s 00:02.2 CAP_EXP+10.b=0x50
# 还原
sleep 1
root@ubuntu22:~# setpci -s 00:02.2 CAP_EXP+10.b=0x40
# 通知系统移除设备             /
root@ubuntu22:/home/michael# echo 1 > /sys/bus/pci/devices/0000:0f:00.0/remove
# Rescan
echo 1 > /sys/bus/pci/rescan

4.2. FLR

# 获取PXDCAP寄存器查看是否支持FLR
root@ubuntu22:/home/michael# setpci -s 0f:00.0 CAP_EXP+4.L
112c8da1
# 28Bit为1,支持FLR
# 连续设置2个Reset, 0x50=0x40|0x10,即设置Link Disable=1
root@ubuntu22:~# setpci -s 00:02.2 CAP_EXP+10.b=0x50
# 还原
sleep 1
root@ubuntu22:~# setpci -s 00:02.2 CAP_EXP+10.b=0x40
# 通知系统移除设备             /
root@ubuntu22:/home/michael# echo 1 > /sys/bus/pci/devices/0000:0f:00.0/remove
# Rescan
echo 1 > /sys/bus/pci/rescan

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1481735.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker 基础(二)

常见命令 Docker最常见的命令就是操作镜像、容器的命令,详见官方文档:https://docs.docker.com/ 数据卷 命令说明文档地址docker volume create创建数据卷docker volume createdocker volume ls创建数据卷docker volume lsdocker volume rm查看所有数…

【力扣白嫖日记】585.2016年的投资

前言 练习sql语句,所有题目来自于力扣(https://leetcode.cn/problemset/database/)的免费数据库练习题。 今日题目: 585.2016年的投资 表:Person 列名类型pidinttiv_2015floattiv_2016floatlatfloatlonfloat pid …

c++之运算符,程序流程结构

运算符 作用&#xff1a;用于执行代码的运算 1算术运算符 作用&#xff1a;用于处理四则运算 下面我们用代码展示&#xff1a; #include<iostream> using namespace std; int main() {//加减乘除int a1 10;int b1 3;cout <<" a1 b1 "<< a1…

广汽埃安工厂:蔚来汽车的造车工厂有哪些?

具体来说&#xff0c;理想汽车目前在常州仅有一家汽车制造工厂。 一期项目于2017年12月竣工&#xff0c;2019年12月投产&#xff0c;年产能10万辆/年。 同时&#xff0c;正在规划二期工程。 产能将增至20万辆/年。 此外&#xff0c;理想还计划接管现代汽车在北京顺义的第一家工…

阿里云短信验证笔记

1.了解阿里云的权限操作 进入AccessKey管理 选择子用户 创建用户组和用户 先创建用户组&#xff0c;建好再进行权限分配 添加短信管理权限 创建用户 创建好后的id和密码在此处下载可以得到 2.开通阿里云短信服务 进行申请&#xff0c;配置短信模板 阿里云短信API文档 短信服务…

【蓝牙协议栈】【蓝牙分析工具】Ellisys 分析HCI Log和btsnoop Log

1.Ellisys 介绍 Ellisys 的 air log sniffer设备要二三十万,一般不是专业开发蓝牙的估计不会选择使用这个工具,但是即使我们不买这个设备,安装了 Ellisys 的工具也可以看 btsnoop 的,下面我就一步一步教你通过 Ellisys 来打开 btsnoop。 1.1 首先打开 APP(Ellisys 不能直…

零基础学编程,中文编程工具之进度标尺构件的编程用法

零基础学编程&#xff0c;中文编程工具之进度标尺构件的编程用法 一、前言 今天给大家分享的中文编程开发语言工具 进度条构件的用法。 编程入门视频教程链接 https://edu.csdn.net/course/detail/39036 编程工具及实例源码文件下载可以点击最下方官网卡片——软件下载——…

Mybatis | Mybatis的核心配置

目录: Mybatis的核心配置 :一、MyBatis的 “核心对象”1.1 SqlSessionFactory1.2 SqlSession :SqlSession对象中的操作数据库的方法 :\<T> T selectOne ( String statement )\<T> T selectOne( String statement , Object parameter )\<E> List\<E> se…

Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了

文字终于不乱码了&#xff01; 足足酝酿一年之多&#xff0c;相比上一代一共进化了三大能力。 来&#xff0c;直接上效果&#xff01; 首先&#xff0c;是开挂的文字渲染能力。 且看这黑板上的粉笔字&#xff1a; Go Big or Go Home &#xff08;不成功便成仁&#xff09;&…

2023中国PostgreSQL数据库生态大会:洞察前沿趋势,探索无限可能(附核心PPT资料下载)

随着数字化浪潮的推进&#xff0c;数据库技术已成为支撑各行各业数字化转型的核心力量。2023中国PostgreSQL数据库生态大会的召开&#xff0c;无疑为业界提供了一个深入交流、共同探索PostgreSQL数据库技术未来发展趋势的平台。本文将带您走进这场盛会&#xff0c;解析大会的亮…

xsslabs第六关

看一下源码 <!DOCTYPE html><!--STATUS OK--><html> <head> <meta http-equiv"content-type" content"text/html;charsetutf-8"> <script> window.alert function() { confirm("完成的不错&#xff01;…

云呐智能运维包含哪些内容?运维未来的发展方向是什么?

智能运维&#xff08;AIOps&#xff09;是一种使用人工智能应用程序来调节IT操作和维护的实践方式。它结合了大数据和机器学习技术&#xff0c;旨在自动化和改进IT操作和维护任务&#xff0c;如故障检测、因果分析和自动故障修复。以下是智能操作和维护的具体内容、挑战和解决方…

无人售货机管理系统,让零售更智能,更高效

无人自动售货系统强大技术核心优势打造智能售货机系统&#xff0c;其引入物联网、大数据、 云计算等新一代信息技术与自动售货机完美融合&#xff0c;实现传统售货机向智能售货机转型升级。 1.市场前景 据前瞻产业研究院报告显示&#xff0c;中国无人零售行业市场规模自2017年…

Windows的Docker-Desktop安装与问题总结

目录 Docker-Desktop安装步骤 环境配置 Docker-Desktop安装问题总结 问题1&#xff1a;docker-desktop setting界面一直加载转圈 问题2&#xff1a;docker镜像的存储位置变更&#xff08;防止C盘空间不足&#xff09; 参考文献&#xff1a; Docker-Desktop安装步骤 环境…

基YOLOV5实现的AI智能盒子

基于yolov5实现的AI智能盒子框架 开发背景技术实现产品效果源码预览功能介绍 2021-2023是沉淀的几年&#xff0c;经济不景气&#xff0c;各行各业都不太好混&#xff0c;所以这几年也没有太多心思花在csdn上为各大网友写一些技术文章&#xff0c;2024年初&#xff0c;也算是给自…

Entry First Day 入职恩孚第一天

入职第一天&#xff0c;电脑还没配置好就去了工厂。 熟悉了一下设备&#xff0c;切了几个小玩意&#xff0c; hello world 一下。 了解了串行端口的Nodejs的库 https://github.com/serialport/node-serialport&#xff0c;以后要用这个东西和硬件通讯&#xff0c;安装&#…

Linux上搭建并使用ffmpeg(Java)

关于MacOs和Windows系统上使用ffmpeg就不多说了&#xff0c;有很多相关文章&#xff0c;今天给大家分享一个在Linux环境下使用Java语言来使用ffmpeg 一、首先去官网下载一个Linux对应的ffmpeg包 1、进入ffmpeg官网&#xff1a;官网 2、点击左侧导航栏Download 3、选择Linux对…

自动生成多个有规律的python列表

问大家一些问题&#xff0c;平常在我们练习时如果在没有给定数据的情况下&#xff0c;手敲这样一个DataFrame 对象是不是很麻烦&#xff0c;而且容易出错&#xff0c;我想了一个办法让其自动生成&#xff0c;这样就省事省力。 首先这些数据都是有规则的依次递增的例如&#xf…

本届挑战赛冠军方案:基于LLM的多场景智能运维

本文介绍本届挑战赛冠军得主SRE-Copilot团队的参赛方案&#xff1a;基于LLM的多场景智能运维。 基础架构-SRE&#xff0c;负责字节跳动基础架构部门所有组件的SRE工作&#xff0c;沿着成本、稳定性、效率、服务四条主线&#xff0c;致力于打造高扩展、高可用的生产系统。基础架…

林浩然与杨凌芸的Swing组件奇遇记:从按钮到滚动条的UI大冒险

林浩然与杨凌芸的Swing组件奇遇记&#xff1a;从按钮到滚动条的UI大冒险 The Swing Component Odyssey of Lin Haoran and Yang Lingyun: A UI Adventure from Buttons to Scrollbars 在Java王国的一隅&#xff0c;程序员才子林浩然和智慧女神杨凌芸正在进行一场别开生面的UI设…