作用:在服务器CPU高负载时发送邮件通知
目录
一、功能代码
二、配置开机自启动该监控脚本
1,配置自启脚本
2,启动
三、功能测试
一、功能代码
功能:在CPU负载超过预设置的90%阈值时就发送邮件通知!邮件内容显示服务器的公网IP、CPU逻辑核心数及每个逻辑核心数的负载详情
import psutil
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
import requests
import time
# 阈值设置
threshold = 90
# 邮件服务器配置
smtp_server = 'smtp.qq.com'
smtp_port = 587 # QQ邮箱的端口号为587
# 发送方邮箱账号和密码
sender_email = 'xxxxxxx@qq.com'
sender_password = 'yxamfeswlsnijaie'
# 接收方邮箱地址
receiver_email = 'xxxxx@qq.com'
# 全局变量
cpu_usage = None # 每个逻辑处理器的负载
def get_server_ip():
server_ip = '未获取到公网ip'
try:
response1 = requests.get('https://ip.3322.net/', timeout=5)
if response1.text:
server_ip = response1.text
except:
pass
try:
response2 = requests.get('https://myip.ipip.net', timeout=5)
if response2.text:
unformat_server_ip = response2.text
server_ip = unformat_server_ip.split(':')[1]
except:
pass
try:
response3 = requests.get('https://ddns.oray.com/checkip', timeout=5)
if response3.text:
unformat_server_ip = response3.text
server_ip = unformat_server_ip.split(':')[1]
except:
pass
return server_ip
# 监测CPU负载并发送邮件通知
def monitor_cpu_load():
# 初始化标志变量
last_email_sent = None
while True:
global cpu_usage
time.sleep(3) # 这里睡眠3秒是因为服务器在重启开机时的瞬间cpu负载是比较高的,所以并不准确,等待3秒更准确
cpu_usage = psutil.cpu_percent(interval=1, percpu=True) # 每个逻辑处理器的负载
if all(usage >= threshold for usage in cpu_usage) and last_email_sent != "high":
subject = "CPU负载过高警告"
body = '服务器公网IP:{0}\n CPU逻辑核心数:{1}\n CPU每个逻辑核心负载均已超90%,请登录服务器查看详情\n CPU核心负载详情:\n'
send_email(subject, body)
last_email_sent = "high"
elif all(usage < threshold for usage in cpu_usage) and last_email_sent != "normal":
subject = "CPU负载恢复正常通知"
body = '服务器公网IP:{0}\n CPU逻辑核心数:{1}\n CPU已恢复正常。\n CPU核心负载详情:\n'
send_email(subject, body)
last_email_sent = "normal"
# 发送邮件通知
def send_email(subject, body):
# 创建邮件内容
global cpu_usage
cpu_count = psutil.cpu_count(logical=True) # cpu逻辑核心数
server_ip = get_server_ip() # 获取公网ip
for i in range(cpu_count):
body += "\t{%d}%%\n" % (i + 2)
body = body.format(server_ip, cpu_count, *cpu_usage)
message = MIMEMultipart()
message['From'] = sender_email
message['To'] = receiver_email
message['Subject'] = subject
# 添加邮件正文
# MIMEText有三个参数第一个为文本内容,第二个 plain 设置文本格式,第三个 utf-8 设置编码可不填
message.attach(MIMEText(body, 'plain'))
# 发送邮件
try:
print("正在发送邮件...")
smtp = smtplib.SMTP(smtp_server, smtp_port)
smtp.starttls() # 开启TLS加密连接
smtp.login(sender_email, sender_password)
smtp.sendmail(sender_email, receiver_email, message.as_string())
print("邮件发送成功!")
except smtplib.SMTPException as e:
print("邮件发送失败:", e)
finally:
print("正在退出")
smtp.quit()
if __name__ == "__main__":
monitor_cpu_load()
sender_email和receiver_email 填写自己的邮箱地址
sender_password 是登录QQ邮箱的授权码
详情参考:https://itutd.blog.csdn.net/article/details/131810368?spm=1001.2014.3001.5502
二、配置开机自启动该监控脚本
1,配置自启脚本
在服务器/usr/lib/systemd/system目录下创建一个新的.service文件
vi /usr/lib/systemd/system/autorun_python.service
写入以下内容
[Unit]
Description=python_script - monitor cpu
After=network.target remote-fs.target nss-lookup.target
[Service]
Type=simple
ExecStart=/root/.virtualenvs/qubian/bin/python3 /home/monitor_cpu.py
Restart=always
[Install]
WantedBy=multi-user.target
修改配置后可能需要运行以下命令重新加载
systemctl daemon-reload
参数解释:
-
[Unit]
:这个部分主要用于定义服务单元的基本信息,包括服务的描述和启动顺序等。Description
:描述这个服务的作用,通常是一个简短的描述。After
:指定在启动这个服务之前需要先启动的其他服务单元。在本例中,指定了在启动这个服务之前需要先启动的服务有network.target
、remote-fs.target
和nss-lookup.target
。
-
[Service]
:这个部分定义了服务运行时的相关参数。Type
:指定服务的类型,有 simple、forking、oneshot、dbus、notify 等类型。在这里,Type=simple
表示这是一个简单类型的服务。ExecStart
:定义服务启动时执行的命令或脚本。在这个例子中,指定了使用指定的 Python 虚拟环境中的 Python 解释器执行/home/monitor_cpu.py
脚本。
-
Restart
:指定服务异常退出时的重启策略,always
表示始终重启。
-
[Install]
:指定服务的安装相关信息。WantedBy
:指定服务所属的 target,即服务启动的目标。在这里,multi-user.target
表示这个服务是为了多用户模式下运行的。
对于Type参数的值有以下:
-
Type=forking
:表示服务将以分叉(forking)方式运行,即服务会创建一个子进程来运行主要的服务进程。当主进程退出时,服务就会被认为是已经停止。但是,它还支持在主进程退出后,Systemd会等待一段时间,以便子进程可以执行一些清理工作。 -
Type=simple:
它表示这个服务是一个简单的服务,即它只有一个主进程,当这个主进程退出时,服务就会被认为是已经停止。 -
Type=oneshot
:这种类型的服务是指它只需要在启动时运行一次。当主进程退出时,服务就会被认为是已经停止。 -
Type=dbus
:这种类型的服务是指它需要一个D-Bus名称,以便Systemd可以监控它。 -
Type=notify
:这种类型的服务是指它会在主进程准备好接受请求时,发送一个通知给Systemd。当Systemd接收到这个通知时,它就会认为服务已经启动。 -
Type=idle
:这种类型的服务是指它会在所有其他类型的服务都已经启动后,才会启动。
2,启动
# 设置开机自启动
systemctl enable autorun_python.service
# 运行服务
systemctl start autorun_python.service
# 查看服务运行状态
systemctl status autorun_python.service
查看服务运行状态,显示active(running)正在运行中...
更多相关命令
# 关闭开机自启
systemctl disable autorun_python.service
# 停止运行服务
systemctl stop autorun_python.service
# 重启服务
systemctl restart autorun_python.service
三、功能测试
写一个让CPU满载的程序测试上面监控CPU的代码功能是否能正常工作
from multiprocessing import cpu_count
from multiprocessing import Process
def func(): # 死循环函数,让cpu满载
while True:
pass
if __name__ == '__main__':
p_lst = [] # 定义一个列表
core_count = cpu_count() # CPU核心数
for i in range(core_count):
p = Process(target=func) # 子进程调用函数
p.start() # 启动子进程
p_lst.append(p) # 将所有进程写入列表中
for p in p_lst:
p.join() # 检测p是否结束,如果没有结束就阻塞直到结束,否则不阻塞
print('结束')
使用htop命令查看cpu的负载状态
这时四个核心全被干满了!
也收到了超负载的邮件通知
当CPU负载恢复正常时也收到了相应的邮件