详解华夏银行iDo平台一体化运维的落地过程

news2024/12/23 10:52:27

随着数字化转型的深入,基于中台和PaaS架构的一体化运维建设也在各行各业快速展开,但是如何将运维平台本身的能力与企业已有的工具能力进行中台化整合、工具场景如何联动,是个复杂而庞大的工程。

本次,史春志老师以华夏银行运维平台化的落地和建设过程进行分享,从“概述”、“基于蓝鲸的运维平台化建设”到“经验总结和未来的展望”详细阐述,希望能给予同业一些启示。

* 注:以下内容整理自:华夏银行运维经理 史春志 于嘉为蓝鲸2022研运一体创新峰会的精彩分享——《合纵连横:华夏银行iDo平台一体化运维的落地过程》

01. 概述

华夏银行围绕“移动化”、“开放化”、“智能化“、”平台化”制定了“智慧金融、数字华夏”的规划愿景,但如何支撑华夏银行整体的数字化转型,更快地响应前端的业务诉求,华夏银行运维团队面临着大量新技术、新应用、新架构的挑战:

为更好的支撑数字化转型,华夏银行明确运维平台化建设的目标:围绕自身业务特点,抽象运维所需底层的能力,通过构建通用能力的平台,横向覆盖大家都认知的监、管、控各个领域,纵向支撑组织架构的应用管理、系统管理和网络管理,实现:

  • 最大化复用运维的在权限、配置、自动化、作业等通用能力构建场景;而不是重复建设工具来支撑场景;
  • 平台具备整合场景的能力,可以通过运维开发等手段,讲底层能力在上层场景需要时调用;
  • 横向在监管控、纵向上在网络、系统、应用均可以支撑和响应快速变化的业务需求;提供更好更快的运维支持能力;

建设目标明确后,我们基于蓝鲸打造了属于华夏银行的平台——iDo平台。“Do”有两层含义:一是响应平台的理念,即“做”,而不仅仅是“说”,提倡动手实干;二是低成本的运维开发工具“DevOps”,摘取字母“D”和“o”。

基于蓝鲸打造的iDo平台,底层是管控平台进行运维对象的统一纳管,使工具平台与运维对象之间能够建立有效连接,中间层为作业、配置、数据平台为代表的运维通用能力,除蓝鲸自身的能力之外,也可以进行能力的拓展和优化将华夏原有的自动化、运维管理等能力融入进来。以API为脉络和纽带,连接起平台本身和周边工具的能力和数据,达到场景贯通的目的。

同时,蓝鲸通用的开发框架可以支撑行内依据自身需求开发应用工具,应用工具的不断建设也会反哺到能力中心,形成互相螺旋式提升状态,能力会不断地完善,场景会越来越丰富。

02. 基于蓝鲸的运维平台化建设

1)平台层统一对接

① 认证扫码

在引进蓝鲸之前银行内部已经建设大量的运维相关应用和系统,引进蓝鲸平台之后,首先要做的就是进行人员组织架构的对接、同步,并通过认证扫码登录,通过与认证系统(ITIL、企业微信等)做统一认证、接入,目前可以实现通过扫码的方式快速登陆平台,同时行内的统一的组织架构信息,也给后续的权限管理提供了很多便利;

② 接入

目前生产运维接入了300+的业务系统,纳管了12000+主机。通过能力中心的建设,共有400+API,同时基于平台通过场景建设了100+SaaS工具,并且这些规模数量还在不断增加;

③ 消息

iDo通过和短信网关、企业微信等通知方式的对接,将日常运维中的审批信息、告警信息、待办信息等等都实现了移动端的消息覆盖,让运维人员即使人不在值班中心也不会漏下任何的故障和工作信息;

④ 企业级管理

华夏在全国有40多家一级分行,几千个营业网点,目前iDo以完成了从上到下的统一管理,这里面平台的以业务划分,统一管理又相互独立的模式发挥了很大的作用,因为各分行有自己的运维人员,统一管理便于总行的整体的运营明确下一步建设优化方向,独立的应用又可以让分行运维人员依据实际的业务诉求进行个性化的调整;

2)平台化配置管理

配置管理在业内是建设的难点。华夏银行也有配置管理系统。在平台化建设后,首先同步数据、模型。行内重要的模型主要有业务系统、人员、IP等;

第二,进行流程上的控制。对配置管理做了流程上的对接,包括设备的上下线,人员的调整等,保证配置管理的准确性;

第三,改造原有CMBD API在用接口,统一封装到API网关中,与蓝鲸的CMDB功能一起做了统一的服务;

第四,数据消费。数据消费是目前CMDB建设的重点,通过强消费、场景化的建设,对CMDB的数据进行消费。这也是一个循环的模式,即有些不准确的CMDB数据,会通过消费场景来反映CMDB的准确性,确保CMDB数据的准确;

第五,自动采集项。自动采集也是CMDB建设的重点,由于很多数据单靠静态的管理,且没有在消费的场景里,容易导致数据采集不准确。通过自动采集插件反哺到CMDB中,从而确保数据采集的实时数据,实时反映CMDB的配置信息情况。同时通过可视化的展示不断完善数据的准确性以及数据采集插件,让插件继续丰富。

3)平台化监控管理

利用平台能力补足监控的不足,同时基于平台统一的开放能力,实现统一监控的汇聚等等。

华夏银行最早使用的监控产品是IBM、ITM。随着国产化趋势,“去IOE”行动,行内业务系统需同步进行信创化改造,使用国产化信创设备,因此银行使用蓝鲸监控,去逐步替代ITM的基础监控,通过蓝鲸对信创的基础监控实现统一纳管。

除IBM、ITM基础监控外,还有:

  • 蓝鲸监控、自定义监控、拨测、日志、关键字等监控,目前都在大规模使用;
  • 云监控,行内自研的应用监控,是根据行内的应用监控规范、基于蓝鲸能力开发的应用监控;
  • 第三方监控,比如APM监控、端到端的监控等。

行内监控极其分散,通过蓝鲸统一的开发框架,开发了统一的告警中心。接入蓝鲸监控、存量的ITM监控、云监控及交易监控,进行统一的告警汇聚、分级、收敛、处置、通知等,即在平台上集合了所有监控,并具有可视化大屏展示。

统一监控告警中心在华夏银行服务台以及各个项目组是一个非常受欢迎的产品。有了统一的告警的功能后,大家能够及时地查看系统的运行情况;同时基于统一告警进行了根因定位、故障画像等相关方面的研究,也已经开始投入应用了。

4)双Agent模式解决国产化自动化难题

在自动化(控)方面,华夏银行原来的自动化产品是用国外的BMC,在使用过程中会遇到国产化兼容的难题。通过蓝鲸Agent、BMC Agent这种双Agent模式,解决了国产化自动化的难题。

在双Agent模式下,通过蓝鲸的自动化能力去纳管国产化设备,并且两种Agent同时运行。双Agent模式支持在业务无任何感知的情况下进行国产化的替换,最大化兼容了稳定性和自主可控的要求。

随着国产化新设备的上线,银行将围绕业务生命周期,逐步切换到蓝鲸Agent,同时保持用户的使用习惯。目前已有30+套国产化架构的业务系统通过蓝鲸进行自动化投产和变更,未来将通过增量业务逐渐进行替换,实现国产化的适配。

5)容器自动化管理

行内华为云X86、华为云ARM、道客云均是通过容器实现自动化管理。每个容器云厂商有各自的管理模式,难以统一管理。通过容器的自动化管理,可对不同厂商、不同架构的容器云进行统一的容器管理,包括应用定义、多集群的纳管集群的运维、容器应用的运维等等。

典型的管理场景举例介绍:

① 平台化资源交付

平台能力层有强大的开发能力,能串联自动化、流程、CMDB三方面能力实现资源交付的申请。整个可视化的流程编排可以增加API、审批流程的管理,全部实现线上化审批。举个简单的例子,堡垒机场景会增加主机、权限以及密码托管等,只靠提单来完成资源交付会很繁琐,但通过平台化的资源交付,审计堡垒机时依托平台的开放能力,把API和审批流程串起来,在用户申请后,堡垒机的管理员只需通过API加流程完成,替代手工操作,资源交付的效率大大地提升了。

另外,通过可视化方式呈现资源交付的成功率、交易量、交易类别等多维度的数据,直观呈现服务运营的价值,即平台资源化。平台资源化会有各种服务,现能通过平台化的流程管理,实现可视化编排。

② 平台能力中心可持续交付的服务

蓝鲸加上企业自有系统服务的封装,使得平台层的内容场景丰富,API流程控制、统计等能力增强。目前平台能力中心主要的业务功能是能力的上传、申请以及使用等。

首先,能力自定义、自服务上传。如希望把原来第三方系统放到统一能力中心,那可通过能力中心的SaaS应用,实现注册、申请,最终上线到统一的能力中心。

第二,使用人员的申请。目前的使用人员不局限于运维,也有部分的应用运维人员、系统运维人员以及开发人员,他们通过平台能力中心,申请各自所需的能力,然后再去组装SaaS应用。

如下是接口授权调用的逻辑。在申请时SaaS相关的信息、使用申请、使用说明、申请时限等都会反映到流程中,通过审批后会再反映到用户的实际调动中。

前端的使用统计。主要是统计成功率、使用次数、SaaS的调用使用量以及接口的使用量等。

6)一个iDo平台可以带来“百花齐放”, 平台有100+SaaS工具

网络层面是相对独立、专业的运维领域,分行的网络告警是通过平台提供服务。目前行内网络团队通过底层能力,将告警统一接入到平台上,基于平台开发了SaaS服务。

在系统层面,蓝鲸本身是应用视角的平台,而系统层面会注重整体视角。行内通过赋予用户权限,例如提供50套系统的权限,通过API对这50套系统获取数据,再在这上面做一层以系统为视角的SaaS应用。现银行的一些系统类、数据库统一管理的视角的SaaS,便是基于这个方式实现的。如数字魔方,TongEasy分析、GTP智能运维,也都是系统层面统一运维的SaaS应用。

在应用层面。交易的成功率、交易量、响应时间、数据库连接都是基于自研的云监控去完成。核心/借记卡监控也是属于应用监控的范畴。

因此,我们是基于这一个平台提供的统一能力,不断地丰富各个层面的场景,从而实现华夏银行的运维平台化的建设。

03. 经验总结和未来的展望

引入蓝鲸平台后,从搭平台框架、融合协同、场景拓展演进,最终实现iDo平台智能化。

通过本次平台化建设,助力运维价值升级:

① 打破传统运维的思维

通过平台工具建设,解放运维繁琐的工作,实现运维管理横向扩展,借助平台能力实现原来难以实现的场景,提升自身的价值;

② 需求开发周期迅速缩短

通过平台快速试飞的应用开发场景,新的需求开发周期会迅速缩短;

③ 迅速提升运维人员能力

运维不再是一个简单重复的工作,通过对平台能力的抽象、平台开发框架的工具文化的赋能,运维开发对运维人员是一条很好的转型之路;

④ 为业务发展提供更多的决策依据

依靠腾讯蓝鲸在运维行业的引领,我行的金融运维产品可以对外输出,体现更高的价值。

运维得天独厚的一个优势,是我们能够获取实时的数据,更贴近地去体现业务的价值,并通过平台化能力及快速开发模式来辅助运营,为业务发展提供更多的决策依据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32357.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Revit二次开发】元素(Element)

图元与图元类型元素元素 元素(Element)也称图元 图元作为revit建模的基础,数量庞大,关系千丝万缕。先了解图元的分类,将会帮助我们整理思路,找到功能开发的关键点。 每一个人都可以按照自己的思路将图元进行分类。建模人员可以按…

vue详细教程

原文链接:https://www.cnblogs.com/MrFlySand/p/16921017.html 02vue的安装 程序说明 1、在body中有2个counter,一个是id,一个是class。 2、创建应用,分别用id和class将配置对象传入 语法:Vue.createApp(方法名).mount…

DPDK之PMD原理

PMD是Poll Mode Driver的缩写,即基于用户态的轮询机制的驱动。本文将介绍PMD的基本原理。 在不考虑vfio的情况下,PMD的结构图如下: 图1. PMD结构图 虽然PMD是在用户态实现设备驱动,但还是依赖于内核提供的策略。其中uio模块&…

Java 面试题 —— TCP 粘包、拆包问题

Java 面试题 —— TCP 粘包、拆包问题 1、粘包、拆包问题概况 正常情况: ​  服务端一共接收到客户端的两个数据包,两个数据包各自包含完整的消息。 粘包问题: ​  服务端一共接收到客户端的一个数据包,这个数据包共包含两条…

【java进阶06:数组】使用一维数组模拟栈数据结构 使用二维数组模拟酒店,酒店管理系统 Arrays工具类 冒泡排序算法、选择排序算法、二分法

目录 数组 二维数组 总结 作业 Arrays工具类 数组 数组总结 及 静态初始化一维数组 /* Array:1、java语言中的数组是一种引用数据类型,不属于基本数据类型,数组的父类是Object2、数组实际上是一个容器,可以同时容纳多个元素&#xff08…

【负荷预测、电价预测】基于神经网络的负荷预测和价格预测(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

Webpack DevServerExpress 中间件

前言 webpack-dev-server 底层是 express webpack-dev-middleware。 express是基础。 webpack-dev-middleware是中间件,以监听模式启动 webpack,将编译后的文件输出到内存(使用fs-memory),沟通webpack的HRM&#xf…

机器学习之特征提取

Question Orientied:来自论文的一个学习点 Feature extraction 定义: 特征提取是指使用计算机提取图像中属于特征性的信息的方法及过程。 简言之 提取图像关键信息。 特征提取出来的结果叫特征向量。 进入主题之前 普及几个常识: 像素的英文名称:Pixe…

Flutter 完全手册

小册介绍 Flutter 作为一个跨平台的框架,其开发技术栈融合了 Native 和前端的技术,不仅涉及到了 Native(Android、iOS )的开发知识,又吸取了很多前端(例如 React)的技术理念和框架,并…

甘露糖-聚乙二醇-CY3 Cy3-PEG-mannose

甘露糖-聚乙二醇-CY3 Cy3-PEG-mannose 中文名称:甘露糖-荧光染料CY3 英文名称:mannose-Cyanine3 别称:CY3标记甘露糖,CY3-甘露糖 溶解性:溶于大部分有机溶剂,如:DCM、DMF、DMSO、THF等等。在…

业务数据分析-Excel数据透视表(四)

目录 1、什么是数据透视表 2、如何操作 3、数据透视表的优势 4、适用什么场景 5、使用前注意事项 1、什么是数据透视表 先来举个例子 看下面这段对话 下午5点30 boss:把这张表给我整理成如下格式,就是根据平台给我汇总一下销量和收入&#xff0c…

机械工程基础笔记整理

第一章 绪论 第一节 课程的特点 1. 综合性 本课结合了工程力学,机械工程材料,常用机构,支撑零部件,机械传动,液压传动,气压传动的相关知识。 2. 基础性 无论从事机械制造,还是使用研究机械&…

OpenCV图像处理——(实战)答题卡识别试卷

总目录 图像处理总目录←点击这里 二十、答题卡识别试卷 20.1、预处理 灰度图 输出灰度图高斯滤波去噪 gray cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blurred cv2.GaussianBlur(gray, (5, 5), 0)边缘检测 edged cv2.Canny(blurred, 75, 200)20.2、轮廓检测 找到原…

快速构建一个简单的对话+问答AI (上)

文章目录前言part0 资源准备基本功能语料停用词问答闲聊语料获取part01句的表达表达one-hot编码词嵌入大致原理实现简单版复杂版如何训练转换后的形状part02 循环神经网络RNNRNN投影图RNN是三维立体的LSTM&GRUpart03意图识别分词FastText分类FastText网络结构优化点构造Fas…

http请求走私漏洞原理,利用,检测,防护

目录 什么是请求走私 漏洞成因与常见类型 Keep-Alive&Pipeline CL&TE 常见走私类型 1.CL不为0 2.CL CL 3.CL TE 4.TE CL 5.TE TE 走私攻击应用实例(漏洞利用) 使用CL TE走私获取其他用户的请求、Cookie 2.泄露请求头重写请求实现未…

UE4贴图自适应屏幕大小

游戏开发中,不同屏幕下的分辨率不同,模型/物品被拉伸之后贴图也会随之拉伸。 如果需要在不同屏幕下面实现贴图真实大小不变(以下简称为自适应),需要对UV进行缩放处理之后再取得对应贴图的颜色。 本文提供一种能够实现不…

为什么国外程序员的创造力比中国程序员强?

1川口耕介是个日本程序员,他曾在Sun公司从事Java、XML和Solaris相关的开发。2004年,他用Java写了叫做一个Hudson的开源工具,专门做持续集成(CI)。Hudson安装、配置、使用都非常方便,并且支持用插件的形式扩…

有求必应 | 听说这个管线排布,横竖都行?

大家好,今天还是被 yi 情反复拿捏的建模助手。 拿捏归拿捏,企微客服还是很认真得在给大家答疑解惑记bug,刚好有求知若渴的盆友问到管线排布这个角度,是否能有小数点,比如1.2,或者0.8。 对待此类问题&#x…

无线传感器网络:排队论(Queueing Theory)模型

文章目录The arrival ProcessQueueing SystemThe M/M/1 queueThe M/M/1/N queueReferences排队理论已被用于评估通信网络的性能很多年了。早在1917年,丹麦数学家 Erlang 就将该理论用于电话交换机的设计,并开创了现在著名的 Erlang-B 和 Erlang-C 公式&a…

DevData Talks | 知乎艾辉:从工具建设到运营,千人团队研发提效最佳实践

在千人级别的组织层级提升研发效能,是一种什么体验?可以确定的是,千人级组织的效能提升,并不是百人级团队的等比放大。 在数十人乃至小百人的团队,统一规范研发工具与流程的门槛相对较低,参与方也比较简单…