建设背景
“以数据为核心资源的数字化时代,正在成为引领和推动新一轮科技革命的核心力量,将会深刻影响卫生健康行业。”
这是四月份发布的《公立医院运营管理信息化功能指引》中对数据重要性的描述。数据库作为数据的载体,支撑着整个业务系统,发挥着非常重要的作用,被喻为“IT的心脏”。让数据库安全、稳定、高效地运行是数据库建设的核心目标。格瑞趋势在对200家医院的调研中发现普遍存在以下痛点:
-
业务高峰期访问压力大,经常出现阻塞或死锁的现象,导致业务系统运行缓慢,影响正常的使用;
-
没有专职DBA,事前,无法通过全面巡检发现潜在隐患。事中,无法快速解决问题导致系统故障时间增长。事后,无法准确定位问题的原因,各厂商相互推诿;
-
数据库既要支撑主业务的访问压力,又要支撑银行、医保、卫健委、集成平台等数据抽取的访问压力,对数据库读写分离架构要求越发强烈;
-
传统的双机、容灾软件已不能满足数据库在两个或多个数据中心多活的要求
建设方案
Moebius(莫比斯) — 数据库多活集群
Moebius数据库多活集群是能够同时满足可靠性、数据安全、容灾、读写分离、负载均衡的一站式多活集群。采用“share nothing”架构,每个节点使用自己的数据库文件,通过日志同步技术实现各节点中数据的一致性。为HIS、CIS、LIS、PACS等核心数据库分别构建三节点集群,节点1和节点2部署在主机房,出现故障后10秒内完成自动切换。节点3为备用机房容灾节点,主机房整体宕机后可手动切换到备用机房。Moebius集群对硬件环境没有特殊要求,可以在物理机、虚拟化、超融合之间灵活搭配。存储可以使用本地磁盘、磁盘阵列,也可以使用高性价比的SSD,三份冗余的数据可以抵消SSD寿命的风险。
Moebius集群的每个节点都是”活“的,因此可根据医院实际场景配置多种读写分离策略,把银行、医保、卫健委、集成平台等大量的数据抽取操作的SQL语句分离到其他节点,既减轻了主节点的访问压力,又避免了大数据量抽取操作带来的阻塞。
SQL专家云 — 数据库智能运维平台
数据库智能运维平台SQL专家云可满足实时可视化观测、问题回溯、性能优化、智能诊断、深度体检、实时告警等常用运维场景。专业DBA的经验是数据库管理的灵魂,SQL专家云将DBA长年积累的最佳实践经验代码化,形成标准化产品后,用户相当于得到专家DBA的驻场服务,数据库的管理水平得到大幅提升。
主机和数据库多维度实时观测数据库当前运行情况,做到“看一眼就知道异常,点一下就找到根源”。
自动生成阻塞树,快速、精准定位阻塞源头,可在SQL专家云中快速结束阻塞源头,并提供智能分析,防止误杀会话。
对CPU、内存、磁盘、网络、活动会话、慢语句、数据库文件、连接数、请求数等12个常用指标全面呈现历史运行趋势,快速发现运行异常情况,并通过天 》小时 》分钟的逐层下钻方式,精准定位问题根源,做到“看一眼就知道异常,点一下就找到根源”。
对任意时间段内语句进行汇总分析,按照执行次数多、资源消耗高、执行时间长等多个维度找到低效的语句。
100+项指标全面巡检,所有隐患一目了然。
智能分析,生成优化方法,辅助DBA进行改善。
协作运维服务 — 数据库管理闭环
格瑞趋势技术顾问以虚拟员工的身份入职到客户,作为专属DBA,和客户一起协作。结合智能运维平台SQL专家云,事前,定期全面巡检,变被动为主动,让问题少发生或者不发生;事中,快速解决问题,降低系统故障时间;事后,追根溯源,有效改善,避免问题重复发生。实现数据库管理闭环,解决医院没有专职DBA的苦恼。主要内容包括:应急响应:对系统遇到的各类突发问题,提供7*24实时响应,协助客户快速定位、解决问题,并进行有效改善,避免问题再次发生。主动巡检:定期对数据库软硬件环境、性能、备份、安全等维度进行全面的巡检,给出可行性改善建议,协助医院进行改善;评估硬件性能是否满足未来一段时间内的运行要求。性能优化:和医院、应用厂商一起配合,对环境、参数、索引、统计信息、执行计划、SQL语句等进行全面的优化,最大幅度地提升数据库性能。
客户收益
高安全:三份相同的数据存放在主、备机房,确保数据足够安全,同时满足本地、异地容灾要求。
高可靠:服务器间秒级自动切换,机房间分钟级手动切换,保障业务系统的可靠性和连续性。
高性能:Moebius集群的读写分离架构使得报表、数据抽取等大查询造成的阻塞、死锁问题得到了有效解决;同时全面的性能优化使系统性能得到数倍以上的提升。
高效率:通过智能运维平台SQL专家云和协作运维服务搭建据库管理闭环体系,专业的人做专业的事,提高了处理数据库问题的效率,节省了运维人员的时间。
高投资回报:降低专职DBA人力成本、减少系统故障带来的损失、避免盲目的硬件投资等综合指标计算,带来几倍到几十倍的投资回报。