随着大数据在医疗行业临床诊疗、医院管理、健康管理等领域应用热度增加,越来越多医院设立了大数据中心或者在信息中心基础上开展了大数据的建设。
什么是大数据中心?大数据中心和CDR的区别是什么?医院应该怎样进行大数据建设?
1
什么是大数据中心
医院数据中心是医院信息化建设的核心,它是一个集中管理、存储、处理和分发数据的地方。医院数据中心可以管理医院的各种数据,包括病人信息、医生信息、医疗设备信息、药品信息、医疗记录等等。
同时,医院数据中心还可以提供实时数据分析和决策支持,以帮助医院管理层更好地掌握医院的运行情况。
2
医院建立了CDR还需再建设大数据中心吗
在不同场景下,“医院数据中心”的含义也并不相同,通常有两类数据中心:
第一类是以业务支撑为主、面向电子病历的数据中心,也即CDR,其作用是支撑日常的医疗活动,进行医疗过程中的数据收集与呈现,同时兼顾常规报表统计等功能。
第二类是以管理和科研利用为主的数据分析中心,也即大数据中心,其作用是面向临床研究、医院管理与智能产品开发,满足数据批量处理的挖掘与分析需求。
从技术手段来看,大数据中心一般需引入ETL等方式,在数据组织方面以群体数据为中心,通常对实时性要求不高。
在医院已经建有CDR的基础上,为开展大数据分析工作,仍需建立大数据分析中心。
✦ 二者收集与使用的数据内容有异;
✦ 二者工作模式不同;
✦ 二者技术形态也不一样。
从定位和职责来看,二者也有较大差异。大数据中心有三种定位:管理、处理和分析。
❶ 数据资源管理
把大数据整合管理起来提供数据资源服务,科室需要的数据经过审批和授权后,由大数据中心提供,这是基本职能,具体职责包括:
✦ 整合各个业务系统数据;
✦ 形成长期的管理机制,即对历史的、现在的数据资源进行一体化的管理;
✦ 根据临床访问需求,进行访问授权。这一定位的工作平台为数据整合平台(ETL)、数据检索系统、数据浏览系统和数据在线使用(虚拟桌面),所需人才为IT工程师。
❷ 数据的处理和加工服务
根据临床问题研究需要对原始数据进行处理,从中抽取一些特征,然后提供给临床:
✦ 增加自然语言处理工具;
✦ 建立专病数据库的平台,帮助一线的医护人员或科研人员整理数据;
✦ 建立组学数据等专业化技术平台支撑特定数据的处理,该定位所需人才还是IT工程师 。
❸ 数据的分析服务
即按照科室的需求做数据的分析,比如病例分布、基于数据建立模型进行疾病和不良事件预测等:
✦ 各种类型的建模工具;
✦ 可视化平台,通过图表把数据分析结果更直观地展示出来;
✦ 需建立大数据深度学习平台,这时所需人才除了传统的IT工程师,还需要专门的数据分析工程师。
3
建立大数据中心的意义
从整体上看,当前医院信息化建设可以划分为三大块:业务信息系统建设、集成、数据分析利用。
在这三大板块里,数据中心位于一个非常基础的地位,每一个板块都与它有很深的关联。
医院信息化建设架构
早期,信息中心主要的职责是建系统,后来逐渐发展为“建设”与“运维”并重,以保证系统可靠、稳定地运行。
现在,信息中心不只负责建系统管硬件,如何提供真正的信息服务,变成一个越来越重要的问题。
实际上,这个需求是客观存在的,以某大型医院信息科为例:每天都有科室来申请查数据,以做统计分析。即使信息科安排专人对接查询数据,但总体来讲,还是自发、散在的服务。相信大多数医院的信息科普遍面临同样的问题。
总之,建设医院数据中心的意义:
✦ 可以提高医院的信息化水平,促进医院的数字化转型
✦ 可以提高医院的管理效率,减少医疗事故的发生
✦ 还可以提高医院的服务质量,提高患者的满意度
4
医院数据能否一次性治理到位
目前,数据治理通常有两种路径:
❶ 将不同来源的异构数据进行整合
建立数据库,再对文本数据进行解析,将数据结构化;最后对于非标准术语进行归一处理,形成清洗后的数据,后续可以以其为基础进行数据分析。
❷ 整合原始数据形成原始数据资源池
待研究问题产生以后,再针对特定问题选取相关数据进行结构化和归一化处理。
数据治理是贯穿数据分析整个过程的,没有办法一次性完成。
建议在数据整合阶段,以数据结构转换为主,尽量保持数据的原始性,但为了便于数据检索,可以在整合完成后进行数据特征抽取。数据加工与深度治理,则放在面向特定目标和问题的研究阶段再进行处理。
5
一站式医疗体系数仓构建
海睿思S-DW智能数仓提供一站式医疗体系数仓构建能力,帮助医院降低数仓建设技术门槛、提高数据稽核效率、提高数据治理效率以及降低数据运维成本。
海睿思S-DW智能数仓系统界面
数据智能接入&标准化
✦ 一键接入电子病历、HIS、LIS等医疗系统,并自动完成标准化转换
✦ 数据治理效率提高5倍以上
可视化数据模型构建
✦ 以维度建模为理论,全流程可视化分层构建数据模型,包括事实表、维度表、汇总表等
✦ 全流程可视化构建完善的指标体系
高效便捷的数据稽核
✦ 数据地图通过导图形式,逐层展示数仓资源,同时提供智能检索入口,搜你所想
✦ 数据血缘包括数据溯源和指标血缘,全面展示数据流转全貌
高质高效的数据运维
✦ 数据资产大屏反映数据资产概貌
✦ 可视化审计日志、数据运维等能力实现数仓整体数据资源全生命周期管理