避免90%以上IT故障,医院运维效率狂飙

news2024/12/26 23:25:27

一、故障发现到解决,仅用15分钟

一、问题描述

上午11点半左右,平台接到医院某软件PACS+数据库离线和CPU使用率异常告警。

图片

(告警信息)

图片

(告警详情)

二、查找问题的原因

图片

cpu使用率时序图

从CPU使用率时序图中,可以看到11点33分左右,CPU使用率迅速从20%左右增长到100%。因为操作系统的CPU资源不足,导致SQL Server数据库软件不能正常工作,平台检测不到数据库运维参数,生成离线告警。

三、问题处理步骤

1、通知现场工程师。

某软件PACS+数据库离线,需要协助排查软件PACS+数据库是否正常运行。现场工程师远程连接服务器,确认服务器操作系统正常运行。

图片

2、通知软件工程师查看SQL server数据库是否正常运行

图片

3、查找数据库离线原因

图片

4、问题解决

将数据库重启,并对数据库占用资源设置限制,继续观察;

CPU使用率下降,恢复正常,Sql Server数据库运行正常。

图片

小结:医院应用软件较多,软件工程师人力有限,未能及时发现PACS+数据库离线问题。MOC工程师在数据库卡死的第一时间联系用户工程师,并协助现场工程师进一步检查SQL server数据库。最终锁定数据库占用CPU资源未释放,将数据库使用资源情况做限定,从发现到问题解决只用15分钟。

二、减少90%以上IT故障,医院效率狂飙

医院运维的难点在于业务系统错综复杂,数据庞大、资产分布广,数据安全敏感。高度依赖信息系统稳定和安全运营。具有以下特点:

  • 设备多、分布广,巡检工作量大,极易错检、漏检;

  • 缺乏系统预警,无法预知设备运行状况;

  • 故障处理无序状态,依赖个人技术、手工,分散运维,风险系数高。

LinkSLA深耕医疗行业,根据医院运维环境特点,打造专业的服务方案。

1、统一部署,全栈监控

医院拥有硬件设备、网络设备、数据库、中间件等多种资产,分别由不同的供应商提供维护服务。LinkSLA智能运维管家通过统一部署实现数据中心一体化监控和智能化运维,将所有的监控资源和对象统一采集,建立底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析设备对业务系统造成的影响,有效降低故障风险。

LinkSLA智能运维管家SaaS云运维,降低部署难度可开箱即用,省去大量分级部署,迅速完成数据库、中间件、容器环境。大大提高运维效率。

2、AI趋势性预测,更精准高效

基于医院运维场景的需求和相关的时序数据集, 定制了ML算法(孤立森林、梯度提升树、 直方图检测),经过训练、调整后的模型, 实际验证准确率达到85%以上;经过一线值守服务的再次筛选,准确率达到95%左右。AI+人力服务最终达至了基本无误报的结果。

在业务数据上,提供一套完整的、处理分析与发现问题的算法。通过智能算法或规则实现异常监测,告警降噪,避免传统工具带来的告警风暴,集成告警事件工单,让故障得到快速响应。

3、MOC值守,诊断+修复

平台主动监控,MOC实时响应。基于资产价值定义SLA,量化服务水平,提供数字化决策依据。链接人员及流程,关联各种运维因子。平台内置ITIL流程,闭环运维,配套知识库,提供技能学习培训,避免人肉运维。也可远程申请MOC工程师协助,通过分析实时数据,查看时序图,迅速定位故障,实现高效远程协作指导。

4、极致的可视化用户体验

1、客户大屏

图片

集中展示资产健康状况和服务水平

2、业务视图

图片

业务系统监控状况集中展示

3、工单详情

图片

展示工单流程、基本信息、根因分析和历史相似工单

4、网络拓扑

图片

告警收敛和辅助根因分析的重要依据

将孤立分散的系统统一监控,减少重复和繁琐的日常巡检工作,使运维工作由被动变主动,提高IT服务的可用性、可靠性、和安全性的同时,实现低成本运维。LinkSLA智能运维管家,构建安全模式的纵深监控产品和服务,以稳定、高效、安全的特点助力智慧医疗加速发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1004470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022年全国研究生数学建模竞赛华为杯E题草原放牧策略研究求解全过程文档及程序

2022年全国研究生数学建模竞赛华为杯 E题 草原放牧策略研究 原题再现: 一、背景介绍   草原作为世界上分布最广的重要的陆地植被类型之一,分布面积广泛。中国的草原面积为3.55亿公顷,是世界草原总面积的6%~8%,居世界第二。此外…

Windows安装Neo4j

图数据库概述 图数据库是基于图论实现的一种NoSQL数据库,其数据存储结构和数据查询方式都是以图论(它以图为研究对象图论中的图是由若干给定的点及连接两点的线所构成的图形)为基础的, 图数据库主要用于存储更多的连接数据。 Neo…

1.Zigbee开发,环境搭建

一。环境搭建 1.开发环境 1.IAR开发环境搭建 2.TI官方必备软件安装 (安装此文件,类似Cubemx不同型号stm32的固件库)(这是协议栈) 3.仿真器及USB串口驱动安装 (就是使用串口烧录到板子上所需要的软件&#…

PyTorch实现注意力机制及使用方法汇总,附30篇attention论文

还记得鼎鼎大名的《Attention is All You Need》吗?不过我们今天要聊的重点不是transformer,而是注意力机制。 注意力机制最早应用于计算机视觉领域,后来也逐渐在NLP领域广泛应用,它克服了传统的神经网络的的一些局限&#xff0c…

【IBMMQ】搭建测试队列

一、安装IBMMQ 网上有教程,可以学习 我用的IBMMQ7.5,安装教程 二、创建测试队列 进入工作台: 右击队列管理器,新建队列管理器 写队列管理器名称 点击下一步 点击下一步 点击下一步 端口默认为1414,建议换一个 注…

短视频引爆销售:TikTok如何改变跨境电商游戏规则

随着数字时代的到来,跨境电商行业正经历着前所未有的变革。在这个变革的浪潮中,TikTok(抖音国际版)作为一款全球短视频社交应用,正逐渐成为跨境电商领域的巨大推动力。它不仅改变了品牌的推广方式,还提供了…

ATFX汇市:离岸人民币大幅升值,昨日盘中跌破7.3关口

ATFX汇市:美国CPI数据即将公布之际,周一美元指数大跌,带动离岸人民币升值0.85%,实现3月14日以来的最大单日升值幅度,当日汇率(USDCNH)最低触及7.292,突破7.3000关口。消息面上&#…

【云原生进阶之PaaS中间件】第二章Zookeeper-2-安装部署

1 Zookeeper安装配置 环境准备: 一台安装有jdk的虚拟机:192.168.152.130 1.1 安装 1.1.1 下载 cd /softwarewget http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz 1.1.2 解压 tar -zxvf zookeeper-3.4.6.tar.g…

火山引擎 ByteHouse:两个关键技术,揭秘 OLAP 引擎中的数据导入技术

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 数据导入是衡量 OLAP 引擎性能及易用性的重要标准之一,高效的数据导入能力能够加速数据实时处理和分析的效率。 作为一款 OLAP 引擎,火山引…

Apollo自动驾驶平台:从传感器到决策的技术解析

前言: 随着科技的进步,自动驾驶技术正逐渐成为现实。而在这个领域,Baidu的Apollo自动驾驶平台展现出了强大的技术实力。本文将从传感器融合到决策技术,深入解析Apollo自动驾驶的核心技术链。 1. 传感器:Apollo的眼和耳…

数据结构与算法之(赫夫曼树,哈夫曼树,压缩软件)

一:思考 1.电报发送:二战的时候大家都知道那时候普遍会应用电报,如果让你来设计一个电报的发送编码你该如何设计呢? 2.压缩算法:给你10000个字符(每个字符1btye,也就是8bit)的文件&a…

C++:类的六个默认成员函数

文章目录 前言一、构造函数概念特性 二、析构函数概念特性 三、拷贝构造函数概念特性 四、赋值运算符重载运算符重载赋值运算符重载 五、取地址及const取地址操作符重载const成员取地址及const取地址操作符重载 总结 个人主页 : 个人主页 个人专栏 : 《数…

项目工单管理系统有什么用?“的修”报修系统在工单管理方面的优势是什么?

项目工单管理系统主要用于管理和协调项目中的任务和活动,它以帮助企业在项目管理、客户服务、资源优化和团队协作等多个方面实现显著提升,因此被越来越多的企业所采用。 企业使用项目工单管理系统的原因主要有以下几点:   提升工作效率&…

JOSEF约瑟 JL-A/41DK JL-A/42DK JL-A/43DK 无辅源电流继电器 过负荷

JL-A、B DK系列无辅源电流继电器 JL-A/11DK JL-A/31DK JL-A/12DK JL-A/32DK JL-A/13DK JL-A/33DK JL-A/21DK JL-A/22DK JL-A/23DK JL-A/34DK JL-A/35DK JL-A/41DK JL-A/42DK JL-A/43DK JL-A、B/41 DK无辅源电流继电器概述 JL-A、B/41 DK无辅源电流继电器作为继电保护元…

《Web安全基础》06. 逻辑漏洞越权

web 1:逻辑漏洞2:逻辑越权3:修复防御方案4:越权问题4.1:商品购买4.2:找回重置机制4.3:接口安全问题4.4:验证安全 5:相关资源 本系列侧重方法论,各工具只是实现…

LAND 所有路者线图——2023 年 9 月更新

来自世界各地的 LAND 所有者社区,你们好,欢迎阅读我们最新的路线图更新! 我们很高兴能回顾一下我们为实现元宇宙所做的一切努力。让我们开始吧! 简要介绍: ● 社区为每个地点提供专用赋能,促进品牌和用户之…

【C++】结构体内存对齐规则

一、结构体内存对齐(重要) 结构体内存对齐是结构体大小的计算规则,是校招笔试和面试过程中一个十分热门的考点,希望大家认真对待。 在学习结构体内存对齐之前,我们先给两组计算结构体大小的题目,看看你能否做对: //…

口袋参谋:淘宝不限类目,透视竞品实时销量!快试试这个插件

​在运营一家店铺之前,可以先了解各类目宝贝的市场行情,及时掌握不同类目宝贝的价格、销售情况,根据需求制定出属于自己的营销策略。 【可跨类目竞店透视】功能: 支持一键获取任意店铺宝贝概况信息 【跨类目竞店透视】功能使用 …

WavJourney:进入音频故事情节生成世界的旅程

推荐:使用 NSDT场景编辑器快速搭建3D应用场景 若要正确查看音频生成的强大功能,请考虑以下方案。我们只需要提供一个简单的指令,描述场景和场景设置,模型就会生成一个扣人心弦的音频脚本,突出与原始指令的最高上下文相…

如何应对数字时代的网络安全新挑战?

随着数字时代的来临,我们迎来了无限的机遇,同时也伴随着网络安全领域新的挑战。网络攻击变得更加智能化和复杂化,威胁也在不断演化。为了应对这些新挑战,我们必须采取创新的网络安全策略和技术。本文将探讨数字时代网络安全的新挑…