supermicro AS -4125GS-TNRT 服务器GPU出现问题,有几张GPU速度较慢。需要确定其物理位置,具体流程如下:
1 GPU编号与BUS_ID对应关系
使用nvidia-smi即可查看,如下所示:![在这里插入图片描述](https://img-blog.csdnimg.cn/3807d94cedff4066bf972e63433f6e9c.png
如 2号卡 Bus-Id 为 41:00.0
2 获取Bus-ID对应的slot ID
需要root权限,使用dmidecode命令,查询Bus-ID对应的Slot ID
结合1,2 2号卡slot id为10
3 获取Slot ID对应的物理位置
查询supermicro官网;其他服务器需要查询其对应信息
图中所示即为GPU 的slotID位置,可以看到2号卡应位于图中10位置
4
最后发现和显卡硬件没有关系,问题是由于BIOS版本造成的,升级BIOS到1.4a即可;可能是由于PCIE5.0的问题,资源在以下网址:
https://www.supermicro.com/en/support/resources/downloadcenter/firmware/MBD-H13DSG-O-CPU/BIOS
(可以使用IPMI远程更新)