八、Linux进程检测与控制

news2025/1/1 22:03:12

章节目标

  1. 了解进程程序的关系
  2. 了解进程的特点
  3. 能够使用top动态查看进程信息
  4. 能够使用ps静态查看进程信息
  5. 能够使用kill命令给进程发送信号
  6. 能够调整进程的优先级(扩展)

引言

  • 在运维的日常工作中,监视系统的运行状况是每天例行的工作,在 Windows 中我们可以很直观的使用"任务管理器"来进行进程管理,了解系统的运行状态
  • 通常,使用"任务管理器"主要有 3 个目的:
    1. 利用"应用程序"和"进程"标签来査看系统中到底运行了哪些程序和进程;
    2. 利用"性能"和"用户"标签来判断服务器的健康状态;
    3. 在"应用程序"和"进程"标签中强制中止任务和进程;

  • 在工作中,我们很少会用到Linux的图形化界面,更多时候会使用命令进行进程管理,但是进程管理的主要目的是一样的,即:
    • 查看系统中运行的程序和进程
    • 判断服务器的健康状态
    • 停止不需要的进程。

一、相关概念

1. 什么是进程和程序?

  • 进程是正在执行的一个程序或命令,每个进程都是一个运行的实体,并占用一定的系统资源。
  • 程序是人使用计算机语言编写的可以实现特定目标或解决特定问题的代码集合。

简单来说,程序是人使用计算机语言编写的,可以实现一定功能,并且可以执行的代码集合。进程是正在执行中的程序。

  • 举例:谷歌浏览器是一个程序,当我们打开谷歌浏览器,就会在系统中看到一个浏览器的进程,当程序被执行时,程序的代码都会被加载入内存,操作系统给这个进程分配一个 ID,称为 PID(进程 ID)。我们打开多个谷歌浏览器,就有多个浏览器子进程,但是这些进程使用的程序,都是chrome
  • PID = Process ID = 进程编号

2. 进程管理的内容

  1. 进程查看,通过查看,判断健康状态
  2. 进程终止
  3. 进程优先级控制

二、进程管理命令

工作场景:

小黑入职到一家公司,接到的第一项任务,就是监控生产服务器的性能,提到服务器性能,我们首先想到的就是CPU,内存和磁盘。

1. 【top】动态监测CPU信息

top

1.1. 系统整体信息

  1. 第一行

内 容

说 明

10:12:28

系统当前时间

up 13:05

系统的运行时间.本机己经运行 13 小时 05 分钟

3 users

当前登录了三个用户

load average: 0.00,0.01,0.05

系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载

  1. 第二行

Tasks: 230 total

系统中的进程总数

1 running

正在运行的进程数

229 sleeping

睡眠的进程数

0 stopped

正在停止的进程数

0 zombie

僵尸进程数。如果不是 0,则需要手工检查僵尸进程

  1. 第三行

内 容

说 明

Cpu(s): 0.1 %us

用户模式占用的 CPU 百分比

0.1%sy

系统模式占用的 CPU 百分比

0.0%ni

改变过优先级的用户进程占用的 CPU 百分比

99.7%id

idle缩写,空闲 CPU 占用的 CPU 百分比

0.1%wa

等待输入/输出的进程占用的 CPU 百分比

0.0%hi

硬中断请求服务占用的 CPU 百分比

0.1%si

软中断请求服务占用的 CPU 百分比

0.0%st

st(steal time)意为虚拟时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比

问题:如果我的机器有4核CPU,我想查看每一核心分别的负载情况怎能办?

答:交换快捷键 “1”

  1. 第四行

内 容

说 明

Mem: 1863252 total

物理内存的总量,单位为KB

829960 used

己经使用的物理内存数量

68352 free

空闲的物理内存数量。我们使用的是虚拟机,共分配了 628MB内存,所以只有53MB的空闲内存

96490 buff/cache

作为缓冲的内存数量

扩展:真正剩余内存 = free + buff/cache,真正使用内存 = used - buff/cache

  1. 第五行

内 容

说 明

Swap: 2097148 total

交换分区(虚拟内存)的总大小

3336 used

已经使用的交换分区的大小

2093812 free

空闲交换分区的大小

622420 avail Mem

可用内存

  1. 根据整体信息部分,判断服务器的健康状态

在Linux操作系统分区时,最少需要3个分区:

① /boot分区 : 系统分区

② swap交换分区 :一般情况下为内存的1~2倍,但是尽量不要超过2G

③ /分区 :根分区,所有文件都存放于此

swap分区:就是当计算机的内存不足时,系统会自动从硬盘中划出一块区域充当内存使用。

  • 我们通过 top 命令的整体信息部分,就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于CPU核数,说明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。

问题:根据以上信息,目前我们的系统压力如何?

答:看CPU负载及内存的使用情况

问题:如果我们发现CPU负载过大,接下来怎么办?

答:如果1分钟、5分钟以及15分钟全部超过CPU的总核心数(必须引起警觉),这个时候就要查看底部的进程信息了。

如果一个总核数=8核心的CPU,理论上平均负载达到16,也还可以坚持很长一段时间。

1.2. 系统进程信息

PID

进程的 ID。

USER

该进程所属的用户。

PR

优先级,数值越小优先级越高。

NI

NICE优先级,数值越小优先级越高,取值范围-20到19,默认都是0

VIRT

该进程使用的虚拟内存的大小,单位为 KB。

RES

该进程使用的物理内存的大小,单位为 KB。

SHR

共享内存大小,单位为 KB。计算一个进程实际使用的内存 = 常驻内存(RES)- 共享内存(SHR)

S

进程状态。其中S 表示睡眠,R 表示运行

%CPU

该进程占用 CPU 的百分比。

%MEM

该进程占用内存的百分比。

TIME+

该进程共占用的 CPU 时间。

COMMAND

进程名

  1. 问题:如果我们发现CPU负载过大,接下来怎么办?

答:查看占用CPU最多的进程

  1. 问题:如何查看占用CPU最多的进程?

答:交互操作快捷键P,P(大写):,表示将结果按照CPU 使用率从高到低进行降序排列

  1. 问题:如果我们发现内存可用量很小,接下来怎么办?

答:查看占用内存最多的进程,使用交互快捷键M(大写):表示将结果按照内存(MEM)从高到低进行降序排列

  1. 问题:当我们查看完系统状态,需要做什么?

答:退出,使用q,按键盘上的q,就会回到#提示符的状态。

2. 【free】查看内存使用情况

# free [选项]

1GB = 1024MB 1MB = 1024KB

选项说明:

-m : 以MB的形式显示内存大小

案例:显示计算机的内存使用情况

free -m

和Centos6相比,buffer和cached被合成一组,加入了一个available。

关于此available,即系统可用内存,用户不需要去计算buffer/cache,即可以看到还有多少内存可用,更加简单直观

3. 【df】查看磁盘

# df [选项]

df = disk free = 磁盘 剩余

-h :以较高的可读性显示磁盘剩余空间大小

Filesystem

磁盘名称

Size

总大小

Used

被使用的大小

Avail

剩余大小

Use%

使用百分比

Mounted on

挂载路径(相当于Windows 的磁盘符)

4. 【ps】查看进程命令(静态)

top : 动态查看系统进程的信息(每隔3s切换一次)

ps : 静态查看系统进程的信息(只能查询运行ps命令瞬间,系统的进程信息)

# ps [选项]

选项说明:

-e : 等价于“-A”,表示列出全部(all)的进程

-f : 表示full,显示全部的列(显示全字段)

案例:显示当前系统中所有进程的信息

ps -ef

UID

该进程执行的用户ID

PID

进程ID

PPID

该进程的父级进程ID,如果找不到,则该进程就被称之为僵尸进程(Parent Process ID)

C

Cpu的占用率,其形式是百分数

STIME

进程的启动时间

TTY

终端设备,发起该进程的设备识别符号,如果显示“?”则表示该进程并不是由终端设备发起

TIME

进程实际使用CPU的时间

CMD

该进程的名称或者对应的路径

在实际工作中使用ps命令其实主要用于查询某个进程的PID或PPID

工作场景

小黑用学到的命令,发现某个进程占用CPU很高,希望进一步查看这个简称的信息。

【ps -ef】 会列出全部进程,但是我们发现进程非常多,我们很难找到自己想要看的进程。这里需要使用过滤命令【grep】,来过滤掉我们不需要的信息。

用法:ps -ef |grep 想要看到的进程名

示例代码:

# ps -ef |grep crond

含义:查看crond进程的详细情况

注意:查询结果中,如果只有一条则表示没查到对应的进程(这1 条表示刚才ps 指令的自身)。只有查到的结果多余1 条,才表示有对应的进程。

案例:查询crond的进程信息

# ps -ef |grep crond

问题:以上信息只有第一行是crond的进程,第二行,实际是管道命令发起时,grep所启动的进程,如何去掉?

# ps -ef |grep crond |grep -v "grep"

root 7102 1 0 Mar23 ? 00:00:04 /usr/sbin/crond -n

【grep -v】 需要去除的相关信息 : 去除包含指定关键词的那一行

4.1. 扩展:【ps aux】命令

ps aux

# man ps

1 UNIX options, which may be grouped and must be preceded by a dash. ps -ef

2 BSD options, which may be grouped and must not be used with a dash. ps aux

USER

该 process 属于哪个使用者账号

TTY

该 process 是在那个终端机上面运作,若与终端机无关,则显示 ?

另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等等的,则表示为由网络连接进主机的程序。

PID

该 process 的ID

STAT

该程序目前的状态,主要的状态有

R :该程序目前正在运作,或者是可被运作

S :该程序目前正在睡眠当中 (可说是 idle 状态),但可被某些讯号 (signal) 唤醒。

T :该程序目前正在侦测或者是停止了

Z :该程序应该已经终止,但是其父程序却无法正常的终止他,造成 zombie (疆尸) 程序的状态

%CPU

该 process 使用掉的 CPU 资源百分比

START

该 process 被触发启动的时间

%MEM

该 process 所占用的物理内存百分比

TIME

该 process 实际使用 CPU 运作的时间

VSZ

该 process 使用掉的虚拟内存量 (Kbytes)

COMMAND

该程序的实际指令

RSS

该 process 占用的固定的内存量 (Kbytes)

5. 【netstat】【ss】查看进程网络访问

# netstat [选项] |grep 进程名称

选项说明:

-t:表示只列出tcp 协议的连接(tcp协议与udp协议)

-n:表示将地址从字母组合转化成ip 地址,将协议转化成端口号来显示 10.1.1.10:80

-l:表示过滤出"state(状态)"列中其值为LISTEN(监听)的连接

-p:表示显示发起连接的进程pid 和进程名称

案例:查询Web Server(httpd)服务的端口信息

netstat -tnlp |grep httpd

ss -naltp |grep 进程名称

比 netstat 好用的socket统计信息,允许查询 socket 的有关统计信息

-n, --numeric 不解析服务名称

-a, --all 显示所有套接字(sockets)

-l, --listening 显示监听状态的套接字(sockets)

-t, --tcp 仅显示 TCP套接字(sockets)

-p, --processes 显示使用套接字(socket)的进程

案例:查询sshd服务的端口信息

ss -naltp |grep sshd

netstat与ss区别?① netstat信息比较简洁,ss更加丰富 ② ss执行效率比netstat略高一些

6. 杀死进程

6.1. 【kill】根据pid杀掉进程

命令:kill

语法:kill [信号] PID

作用:kill 命令会向操作系统内核发送一个信号(多是终止信号)和目标进程的 PID,然后系统内核根据收到的信号类型,对指定进程进行相应的操作

经验:kill经常结合ps命令一起使用

kill命令用于杀死某个进程,这其实只是其一个功能。kill命令的实质是向进程发送信号

信号种类:

信号编号

含义

9

杀死进程,即强制结束进程。

15

正常结束进程,是 kill 命令的默认信号。

案例:使用kill命令杀死crond进程

#ps -ef |grep crond

查询crond进程信息,想知道它的进程名,以便使用killall终止进程

#kill 6925

结束6925的进程,这里使用默认信号,正常结束,如果强制结束,就是kill -9 6925

#systemctl start crond

使用前面学过的systemctl命令,重启crond服务

#ps -ef |grep crond

查询crond进程信息,这次查询是为了确认crond进程已经重新启动了,我们看到多了一个32934的进程,表明crond已经启动,并且进程ID变化了,这是一个新的进程

备注:在互联网中,经常看到kill -9 进程PID,强制杀死某个进程,kill -9 pid

6.2. 【killall】根据进程名称杀掉进程

killall [信号编号] 进程名称

案例:使用killall命令杀死crond进程

# killall crond

案例:使用killall命令杀死httpd进程

# killall httpd

单独的进程用pid(kill)杀死,多个进程用进程名(killall)杀死

三、进程优先级

1. 什么是进程优先级?

Linux是一个多用户、多任务的操作系统,系统中通常运行着非常多的进程。哪些进程先运行,哪些进程后运行,就由进程优先级来控制

  • 思考:什么时候需要用到进程的优先级呢?

答:当CPU负载过高时,如CPU的使用率>=90%以上。这个时候进程的优先级就会起作用。

2. 查看进程优先级

  • PR 优先级,数值越小优先级越高。
  • NI 优先级,数值越小优先级越高,可以人为更改。(NI = NICE = Nice)

讲个小故事:Nice值 = 0,Nice值越高,代表这个人越绅士(Nice值越高,优先级越低)

NI值有一个范围 -20 ~ 19

问题:这两个数值是在哪里看到的?

答:top命令

3. 调整进程优先级

3.1. 【top】调整进程的优先级

第一步:使用top命令获取你要调整的进程信息(PID编号)

# top -bn 1 //获取所有进程的信息

回车后看到有很多进程信息,假如要调整atd的优先级

PID COMMAND

7107 atd(at命令的底层服务)

第二步:运行top命令,然后按"r",输入要调整进程的PID编号

# top

按r,输入要调整进程的PID编号,按回车

第三步:根据提示,重置NICE值

Renice PID 7107 to value : -5

第四步:按q退出top模式,然后使用top -p PID编号,只查询某个进程的信息

# top -p 7107

3.2. 【renice】调整进程的优先级

renice [NI优先级设置的数字] 想调整的进程ID

案例:使用renice调整atd的优先级

第一步:通过ps或top命令获取atd的PID编号

# ps -ef |grep atd

7107

第二步:使用renice命令调整7107的NICE值

# renice -10 7107

7107 (process ID) old priority 0, new priority -10

注意:NICE值取值范围-20 ~ 19,不能使用小数

3.3. 【nice】调整进程的优先级

nice [NI优先级设置的数字] 想调整的进程名称

-n:指定进程的优先级(整数

注意:nice命令只能调整没有运行的程序

nice实际操作三步走

第一步:将程序停止

# ps -ef |grep crond

# kill PID

# systemctl stop crond

第二步:启动并制定优先级(使用nice)

nice -n -10 crond

第三步:确认优先级(查看优先级)

# ps -ef |grep crond

PID

# top -p PID

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1643991.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python数据分析——业务数据描述

业务数据描述 前言一、数据收集数据信息来源 二、公司内部数据(1)客户资料数据(2)销售明细数据(3)营销活动数据 三、市场调查数据1 观察法2 提问法3 实验法 四、公共数据五、第三方数据六、数据预处理七、数…

Vue工程化开发和脚手架Vue CLI

目录 一、介绍 二、使用步骤 1. 全局安装(一次) 2.查看Vue版本 3.创建项目架子(项目名不能使用中文) 4.启动项目 一、介绍 Vue CLI是Vue官方提供的一个全局命令工具。可以帮助我们快速创建一个开发的Vue项目的标准化基础架子…

【HCIP】OSPF综合实验报告

一、分析要求 R4为ISP,直连设备间使用公网网段R3、R5、R6、R7为MGRE环境,R3为NHS合理划分172.16.0.0/16网段做NAT配置使私网能够访问R4环回ospf优化(汇总和特殊区域),减少计时器时间加快收敛,设备之间做认…

解决:mybatisplus分页查询失效,总是查询到所有数据

目录 问题描述&#xff1a;解决方案&#xff1a;1.配置mybatisplus拦截器PaginationInterceptor2.自行编写SQL语句查询 问题描述&#xff1a; 在前端使用Map<String, Object> params&#xff0c;把page&#xff0c;limit参数作为请求体传送到后端&#xff0c;但是分页查…

WWW‘24 | 课程学习CL+模仿学习IL用于ETF及商品期货交易

WWW24 | 课程学习CL模仿学习IL用于ETF及商品期货交易 原创 QuantML QuantML 2024-05-04 13:47 论文地址&#xff1a;[2311.13326] Curriculum Learning and Imitation Learning for Model-free Control on Financial Time-series (arxiv.org) 本文探讨了在金融时间序列数据上…

vulnhub靶场之FunBox-3

一.环境搭建 1.靶场描述 Boot2Root ! Easy going, but with this Funbox you have to spend a bit more time. Much more, if you stuck in good traps. But most of the traps have hints, that they are traps. If you need hints, call me on twitter: 0815R2d2 Have fun.…

C++实验五 : 类的继承 -----CUST

【题目】 1.定义person类&#xff0c;包括数据私有成员&#xff1a;姓名&#xff0c;性别&#xff1b;共用成员函数&#xff1a;带参数构造函数&#xff0c;display函数输出本类对象的所有数据成员值。 2.定义student类&#xff0c;保护继承person类&#xff1b;增加保护数据成…

从零开始:Django项目的创建与配置指南

title: 从零开始&#xff1a;Django项目的创建与配置指南 date: 2024/5/2 18:29:33 updated: 2024/5/2 18:29:33 categories: 后端开发 tags: DjangoWebDevPythonORMSecurityDeploymentOptimization Django简介&#xff1a; Django是一个开源的高级Python Web框架&#xff…

【Python项目】基于时间序列的【大气污染预测系统】

技术简介&#xff1a;使用Python技术、B/S架构、MYSQL数据库等实现。 系统简介&#xff1a;本系统的主要使用角色为普通用户和管理员用户&#xff0c;两者的功能几乎是一致的&#xff0c;但管理员用户比普通用户多了用户管理的功能&#xff0c;可以对系统内的用户进行管理。普通…

Vue的项目启动指令分析

通过Vue CLI脚手架创建的项目&#xff0c;默认的启动项目方式是 npm run serve 这里的serve是可以修改的。 在创建的项目目录中&#xff0c;找到package.json 双击打开&#xff0c;找到scripts部分 在scripts部分&#xff0c;有一个"serve"键值对&#xff0c;这里的…

如何进行Go语言的性能测试和调优?

文章目录 开篇一、性能测试1. 使用标准库中的testing包2. 使用第三方工具 二、性能调优1. 优化算法和数据结构2. 减少不必要的内存分配和垃圾回收3. 并发和并行 结尾 开篇 Go语言以其出色的性能和简洁的语法受到了广大开发者的喜爱。然而&#xff0c;在实际开发中&#xff0c;…

DML操作表的数据

一、增加数据 语法&#xff1a; INSERT [INTO] 表名 [( 列名表 )] VALUES ( 值列表 ) 1.1 插入全部字段 l 所有的字段名都写出来 INSERT INTO 表名 (字段名1, 字段名2, 字段名3…) VALUES (值1, 值2, 值3); l 不写字段名 INSERT INTO 表名 VALUES (值1, 值2, 值3…); 注&…

我这次没有蹭Oracle发布热度的原因

这次没有去蹭热度&#xff0c;原因有几个。 主观 确实是生病了&#xff0c;身体不舒服&#xff0c;那几个卷王在卷公众号的时候&#xff0c;我在床上卷成一团。 不和这几个打了鸡血的人比了。我卷了一点和他们不一样的。我节日期间看到我初中同班同学发的微博。 对这个就是我…

创造价值与回报:创业者的思维格局与商业智慧

在纷繁复杂的商业世界中&#xff0c;有一种信念始终贯穿于无数创业者的心中——那就是创造价值。张磊的这句“只要不断地创造价值&#xff0c;迟早会有回报”道出了创业者的核心思维格局和商业智慧。本文将从创业者的角度&#xff0c;探讨创造价值的重要性&#xff0c;以及如何…

力扣每日一题112:路径总和

题目 简单 给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径&#xff0c;这条路径上所有节点值相加等于目标和 targetSum 。如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 叶子节点 是…

《原则》生活和工作 - 三余书屋 3ysw.net

原则&#xff1a;生活和工作 您好&#xff0c;今天我们解读的书是《原则&#xff1a;生活和工作》。这本书和我们之前解读过的《原则&#xff1a;应对变化中的世界秩序》是同一个作者写的。那本书的主题非常宏大&#xff0c;它讨论的是世界运行的原则。而今天我们聊的《原则&a…

消费品行业的5G新时代:2024年消费品行业趋势洞察报告

来源&#xff1a;安永 2023 年&#xff0c;我国社会消费品零售总额达人民币 47.147.147.147.1万亿元&#xff0c;比上年增长 7.2%7.2%7.2%7.2%&#xff1b;最终 消费支出拉动经济增长 4.34.34.3个百分点&#xff0c;比上年提高 3.13.13.1个百分点&#xff0c;对经济增长的贡献…

linux C语言Makefile

ChatGPT 在Linux中使用Makefile来自动化C语言项目的构建过程是很普遍的实践。Makefile是一个包含了一系列构建目标及如何构建这些目标的依赖和规则的文本文件。 一个基本的Makefile例子可能会像这样&#xff1a; # 定义编译器 CCgcc# 定义编译选项 CFLAGS-I.# 定义可执行文件…

C++ : list类及其模拟实现

目录 一、list的介绍和使用 list的介绍 list的使用 1.list的构造 构造函数 2.list iterator 的使用 3.list capacity 4.list element access 5.list modifiers 6.list的迭代器失效 二、list的模拟实现 要点 list类模拟实现部分接口全部代码展示 一、list的介绍和使…

C++笔试强训day13

目录 1.⽜⽜冲钻五 2.最长无重复子数组 ​编辑 3.重排字符串 1.⽜⽜冲钻五 链接 简单逻辑题&#xff0c;按照题目意思模拟就能过。 详细代码&#xff1a; #include <iostream>using namespace std;int n,k; void solve() {cin >> n >> k;string s;cin…