如何知道docker谁占用的显卡的显存?

news2024/11/25 14:34:58

文章目录

  • python环境安装nvidia-htop
  • 查看pid
  • 加一个追踪
  • 总结一下【找到容器创建时间】
      • 使用说明
      • 示例
  • 再总结一下【用PID找到容器创建时间,从而找到谁创建的】
      • 使用说明
      • 示例

python环境安装nvidia-htop

nvidia-htop是一个看详细的工具。

pip3 install nvidia-htop

查看pid

指令是:

nvidia-smi | nvidia-htop.py -l

比如0卡有进程PID是3311673,是root占用。凡是USER里不是普通用户名的,都是docker run起来的容器在使用显存。如何查看3311673是谁在占用?
在这里插入图片描述

我们需要找到进程的 cgroup 文件,然后从 cgroup 文件中提取容器 ID。

找到进程的 cgroup 文件:

cat /proc/3311673/cgroup

在这里插入图片描述

容器id是923dc8979571a的这个容器,启动了进程3311673,占用了显存。容器的名字是daonan_sdxl。

在这里插入图片描述

这一步之后只有审计追溯了,或者可以从inspect里找一些信息确认一下。

docker inspect daonan_sdxl

在这里插入图片描述

查了一下:https://cloud.tencent.com/developer/ask/sof/115145807,使用docker 就相当于是匿名用户,docker本身不会记忆谁执行了它。

加一个追踪

在Docker中,直接通过Docker命令来追踪启动容器的具体用户是不太可能的,因为Docker并不会默认记录启动容器的用户信息。不过,可以通过以下一些方法来间接地追踪和记录相关信息:

创建文件:

touch /var/log/docker-commands.log
chmod 777 /var/log/docker-commands.log

进入这里:

cd /usr/bin/
mv docker docker-original

创建一个脚本 docker

vim docker

#!/bin/bash

# 记录docker run命令
if [[ "$1" == "run" ]]; then
  echo "$(date) - $(whoami) - $@" >> /var/log/docker-commands.log
fi

# 执行docker命令
/usr/bin/docker-original "$@"

加权限:

sudo chmod +x /usr/bin/docker

ok!

总结一下【找到容器创建时间】

创建这个脚本:

#!/bin/bash

# 检查是否提供了PID参数
if [ -z "$1" ]; then
  echo "Usage: $0 <PID>"
  exit 1
fi

PID=$1

# 获取进程的cgroup文件内容
CGROUP_FILE="/proc/$PID/cgroup"

if [ ! -f "$CGROUP_FILE" ]; then
  echo "PID $PID does not exist or /proc/$PID/cgroup file not found."
  exit 1
fi

# 提取容器ID
CONTAINER_ID=$(cat $CGROUP_FILE | grep 'docker' | sed 's/.*\///' | grep -o -E '[0-9a-f]{64}' | tail -n 1)

if [ -z "$CONTAINER_ID" ]; then
  echo "No Docker container found for PID $PID."
  exit 1
fi

# 获取容器名称
CONTAINER_NAME=$(docker inspect --format '{{.Name}}' $CONTAINER_ID | sed 's/^\/\(.*\)/\1/')

if [ -z "$CONTAINER_NAME" ]; then
  echo "Failed to retrieve container name for container ID $CONTAINER_ID."
  exit 1
fi

# 获取容器创建时间
CONTAINER_CREATED=$(docker inspect --format '{{.Created}}' $CONTAINER_ID)

if [ -z "$CONTAINER_CREATED" ]; then
  echo "Failed to retrieve creation time for container ID $CONTAINER_ID."
  exit 1
fi

# 输出结果
echo "Container ID: $CONTAINER_ID"
echo "Container Name: $CONTAINER_NAME"
echo "Container Created: $CONTAINER_CREATED"

exit 0

使用说明

  1. 将上述脚本保存为 find_container_by_pid.sh
  2. 给脚本添加执行权限:
    chmod +x find_container_by_pid.sh
    
  3. 运行脚本并传入一个PID:
    ./find_container_by_pid.sh <PID>
    

示例

./find_container_by_pid.sh 3311673

该脚本将会输出指定PID对应的容器ID、容器名称和容器创建时间。

在这里插入图片描述

再总结一下【用PID找到容器创建时间,从而找到谁创建的】

可以通过编写一个新的Shell脚本来实现这个功能。这个脚本将会基于容器的创建时间,从日志文件 /var/log/docker-commands.log 中查找对应的记录。以下是这个新脚本的实现:

#!/bin/bash

# 检查是否提供了PID参数
if [ -z "$1" ]; then
  echo "Usage: $0 <PID>"
  exit 1
fi

PID=$1

# 调用之前的脚本来获取容器ID、名称和创建时间
container_info=$(./find_container_by_pid.sh $PID)
if [ $? -ne 0 ]; then
  echo "Failed to get container info for PID $PID."
  exit 1
fi

# 提取容器创建时间和容器ID
CONTAINER_CREATED=$(echo "$container_info" | grep "Container Created:" | awk '{print $3}')
CONTAINER_ID=$(echo "$container_info" | grep "Container ID:" | awk '{print $3}')

echo $CONTAINER_ID

# 将创建时间转换为前后1秒的时间范围
start_time=$(date -d "$(echo $CONTAINER_CREATED | sed 's/Z//') -1 second" +"%Y-%m-%dT%H:%M:%S")
end_time=$(date -d "$(echo $CONTAINER_CREATED | sed 's/Z//') +1 second" +"%Y-%m-%dT%H:%M:%S")

# 从日志文件中查找对应时间范围的记录
log_file="/var/log/docker-commands.log"
if [ ! -f "$log_file" ]; then
  echo "Log file $log_file not found."
  exit 1
fi

echo "Searching for logs between $start_time and $end_time"
log_entries=$(grep -E "$start_time|$end_time" $log_file)

# 打印结果
if [ -z "$log_entries" ]; then
  echo "No log entries found for the specified time range."
else
  echo "Log entries found:"
  echo "$log_entries"
  echo ""
  echo "Container Creator and ID:"
  echo "$log_entries" | while read -r line ; do
    creator=$(echo $line | awk '{print $4}')
    echo "Creator: $creator, Container ID: $CONTAINER_ID"
  done
fi

exit 0

使用说明

  1. 确保之前的脚本 find_container_by_pid.sh 是可执行的,并且路径正确。
  2. 将上述新脚本保存为 find_container_creator.sh
  3. 给新脚本添加执行权限:
    chmod +x find_container_creator.sh
    
  4. 运行新脚本并传入一个PID:
    ./find_container_creator.sh <PID>
    

示例

./find_container_creator.sh 3311673

该脚本将会基于容器的创建时间,从日志文件 /var/log/docker-commands.log 中查找对应时间范围的记录,并打印出来。希望这个新脚本能满足你的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1873549.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows部署MinIO,搭建本地对象存储服务

一、前言 二、MinIO介绍 三、Windows部署MinIO服务 1、准备工作 2、下载MinIO服务 3、启动MinIO服务 4、设置用户名密码 5、创建.bat文件启动服务 四、MinIO基本操作 1、存储桶管理 2、对象管理 3、数据查看 一、前言 基于外网的项目&#xff0c;可以使用阿里云等…

涨点超强!图像特征提取最新方法!性能效率快到飞起

在图像处理领域&#xff0c;有一个非常关键的步骤&#xff1a;图像特征提取。它能给我们提供一种高效、准确且灵活的方式来描述和分析图像内容。 通过降低图像数据的维度&#xff0c;去除冗余和噪声信息&#xff0c;图像特征提取不但简化了后续处理过程&#xff0c;还能提高算…

文本分析|小白教程

在信息爆炸的时代&#xff0c;文本数据无处不在&#xff0c;如何从这些海量的文字中提炼出有价值的信息呢&#xff1f;答案就是——文本分析。文本分析&#xff0c;简单来说&#xff0c;就是对文本数据进行深度的研究和分析。它能够从看似普通的文字中&#xff0c;提取出主题、…

老司机开发技巧,如何扩展三方包功能

前言 最近碰上有个业务&#xff0c;查询的sql如下&#xff1a; sql 复制代码 select * from table where (sku_id,batch_no) in ((#{skuId},#{batchNo}),...); 本来也没什么&#xff0c;很简单常见的一种sql。 问题是我们使用的是mybatis-plus&#xff0c;然后写的时候有没…

【C++ 初阶路】--- 类和对象(末)

目录 一、const成员1.1 取地址及const取地址操作符重载 二、再谈构造函数2.1 构造函数体赋值2.2 初始化列表2.3 explicit关键字 三、static成员3.1 概念3.2 特性 四、友元4.1 友元函数4.2 友元类 五、内部类六、匿名对象 一、const成员 将const修饰的“成员函数”称之为const成…

软考《信息系统运行管理员》-1.4 常见的信息系统

1.4 常见的信息系统 常见的信息系统综述 财务系统 财务信息系统会计信息系统 办公自动化系统业务处理系统生产管理系统ERP系统客户关系管理系统人力资源系统 会计信息系统 主要任务是保证记账的正确性。 订单处理子系统库存子系统会计应收/应支系统总账子系统 财务信息系…

[CTF]-PWN:mips反汇编工具,ida插件retdec的安装

IDA是没有办法直接按F5来反汇编mips的汇编的&#xff0c;而较为复杂的函数直接看汇编不太现实&#xff0c;所以只能借用插件来反汇编 先配置环境&#xff0c;下载python3.4以上的版本&#xff0c;并将其加入到环境变量中 下载retdec 地址&#xff1a;Release v1.0-ida80 ava…

Rust Eq 和 PartialEq

Eq 和 PartialEq 在 Rust 中&#xff0c;想要重载操作符&#xff0c;你就需要实现对应的特征。 例如 <、<、> 和 > 需要实现 PartialOrd 特征: use std::fmt::Display;struct Pair<T> {x: T,y: T, }impl<T> Pair<T> {fn new(x: T, y: T) ->…

亲测可用!SM2269XT量产工具下载,SM2269XT开卡软件分享

国内固态硬盘常用&#xff0c;且有量产工具流传出来的主控厂商包括慧荣、群联、点序、英韧、得一微、瑞昱、联芸、迈威、国科、华澜微等等。 每个主控需要用各自对应的量产工具&#xff0c;不同的量产工具支持的闪存颗粒也有差异&#xff0c;因此要根据固态硬盘实际的主控型号…

小白快速入门canvas画海报

小编以微信小程序原生语言举例 wxml页面&#xff1a; <canvas type"2d" id"myCanvas" style"width:375px;height:667px;"></canvas> js页面&#xff1a; import drawQrcode from ../../../utils/qrcode/weapp.qrcode.esmdata: {…

vue3+ el-upload封装上传组件

组件功能介绍 上传格式限制上传大小限制上传文件数量限制自定义上传区上传成功回调禁用上传开关与点击上传自定义事件暴露所以上传文件列表&#xff08;uploadList&#xff09;与当前文件数据&#xff08;uploadLatestFile&#xff09; 组件代码Upload.vue <template>&l…

Vue-cli搭建一个项目

目录 vue-cli搭建项目 主要的功能 需要的环境 用 HbuilderX 搭建 vue-cli 项目 1、创建一个vue项目(2.6.10) 2、组件路由 首先&#xff1a;安装 其次&#xff1a; 1.在src文件夹下创建router目录,创建index.js 2.使用路由——在App.vue中添加路由视图 3.在main.js 中…

C语言学习记录(十一)——指针基本知识及运算

文章目录 前言1. 指针的概念2.指针变量的说明3. 指针的含义4. 指针运算①指针加减&#xff1a;②指针的关系运算符 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 1. 指针的概念 在C语言中&…

天正T20 专业建筑软件分享,天正T20全家桶软件安装包齐全!

天正T20 V9.0&#xff0c;在建筑工程领域中占据了举足轻重的地位。该软件以其高效、精确和易用的特点&#xff0c;赢得了广大工程师的青睐和信赖。 天正T20 V9.0软件具有强大的计算功能&#xff0c;可以精确地对建筑结构进行力学分析&#xff0c;包括静力分析、动力分析、稳定性…

使用Python实现钉钉Stream模式服务开发及内部程序通信

1、什么是Stream模式 Stream 模式是钉钉开放平台提供的一种集成方式&#xff0c;它可以监听机器人回调、事件订阅回调和注册卡片回调。使用 Stream 模式接入&#xff0c;钉钉开放平台将通过 Websocket 连接与应用程序通讯&#xff0c;Stream 模式将极大降低接入门槛和资源依赖…

Windows系统开启python虚拟环境

.\env4socre\Scripts\activate : 无法加载文件 E:\SocreMan\env4socre\Scripts\Activate.ps1&#xff0c;因为在此系统上禁止运行脚本。 环境&#xff1a;windows 11、vscode 1、用管理员权限打开powershell 输入set-executionpolicy remotesigned&#xff0c;选择Y 2、返回v…

信创认证 | Smartbi Insight V11成功适配申威3231处理器

在信息技术飞速发展的浪潮中&#xff0c;软硬件的深度融合与协同发展已成为推动行业创新的关键因素。 近日&#xff0c;思迈特商业智能与数据分析软件[简称&#xff1a;Smartbi Insight]V11在统信服务器操作系统V20和中电科申泰信息科技有限公司产品申威3231处理器环境下完成适…

【Linux 命令行参数解析函数getopt()】原理及直白理解

最近写代码恰好碰见getopt()这个函数&#xff0c;去网上找了很久&#xff0c;说实话&#xff0c;其他人写的有点看不懂&#xff0c;所以将我认为可以便于理解的地方描述一下&#xff1a; int getopt(int argc, char * const argv[], const char *optstring);首先理解这个函数的…

pdf合并,这三种方法学会了吗?

在信息爆炸的时代&#xff0c;PDF文档凭借其跨平台、不易修改的特性&#xff0c;成为了我们工作和学习中不可或缺的一部分。然而&#xff0c;当面对多个PDF文件需要合并成一个完整的文档时&#xff0c;许多人可能会感到头疼。今天&#xff0c;就让我们一起来探讨三种高效的PDF合…

OOXML入门学习

进入-飞入 <par> <!-- 这是一个并行动画序列的开始。"par"代表并行&#xff0c;意味着在这个标签内的所有动画将同时开始。 --><cTn id"5" presetID"2" presetClass"entr" presetSubtype"4" fill"hold&…