从IT时代步入DT时代,医疗大数据成为智慧医院建设的重要驱动力。经过多年信息化系统建设,很多医院已经积累了大量的医疗数据资源,但由于各业务系统间数据孤岛化严重、系统架构落后、数据缺乏深度治理等问题存在,导致现有数据深度及质量难以支撑医院临床科研和运营管理决策。如何构建全院统一的数据开放服务平台,在保证原始数据安全的前提下深挖数据应用价值,赋能临床诊疗及科研进阶,已成为推动医院高质量发展的关键。
近日,爱分析对华西二院信息管理部主任吴邦华进行了专访。吴邦华指出,医院数据开放服务平台建设的本质是业务需求驱动,其落地实施应当与医院的战略规划、业务发展目标及业务流程紧密相连。隐私计算+AI全栈技术能力是解锁医疗行业数据价值的最优解法,目前华西二院已经在高质量数据资产沉淀、临床科研成果及质量提升、临床诊疗精准高效等方面取得了突出成效。展望未来,伴随数据质量提升及覆盖范围扩大,具有隐私安全技术的数据开放服务平台将加速华西二院临床科研成果向临床应用转化,不断提高临床诊疗水平和治疗效果。
01 业务价值驱动医院数据开放服务平台建设
医疗大数据作为大数据的细分领域,伴随着国家医疗相关政策推动、新兴技术应用支撑,已经从基本的数据概念升级为数据资产,并不断释放数据应用价值。政策层面,《“十四五”全民健康信息化规范》等政策文件相继出台,鼓励医院加强医疗数据的深度挖掘与应用分析,提升医学科研及应用效能,推动智慧医院发展。同时,公立医院绩效考核、三级医院等级评审、医保支付改革等相关要求,都需要准确、可靠、及时的数据支撑。因此,强有力的数据开放服务平台是提升医院“数据力”的关键抓手。
“医院数据开放服务平台的建设,不单是信息系统的建设,在实际落地中一定要考虑医院的整体战略规划和业务发展目标。”吴邦华介绍,“十四五”期间,华西二院的发展战略可归纳为两个转型:即从“基本医疗服务”转型为“主动健康服务”,从“妇幼专科医院”转型为“妇女儿童综合型健康服务机构”。为了保证“两个转型”顺利实现,华西二院将业务协同平台和数据平台作为重要的数字化建设方向。“2023年医院的核心工作是推动数据开放服务平台及专病库建设,实现医疗集团的一体化经营和同质化发展,并全力支持医院从基础科研转向临床科研。”
图1:华西二院从发展战略到业务目标实现路径
从本质上看,医院数据开放服务平台建设是业务需求驱动,其核心是业务逻辑,而非简单IT建设。目的在于通过对业务流程的再造、知识的再重构、数据的再融合治理,进一步赋能医院业务价值提升。
那么,数据开放服务平台如何能够更好地支撑医院业务发展?
“先明确业务目标,再梳理业务流程,最后实施IT建设。”华西二院将这一应用思路贯穿于数据开放服务平台的整个建设过程。推动数据开放服务平台建设,需要信息科室与临床科室之间高效协同,把医院业务目标、业务流程与数据治理“捆绑”在一起,避免出现IT与业务两张皮的现象。
第一步,明确业务目标。医院数据开放服务平台始终只是个管理手段和管理工具,其实质是要满足业务部门需求、助力业务部门目标达成,因而需要保证数据建设全过程都为业务目标而服务。“两个转型”战略规划下,华西二院总体业务发展目标是要实现医院内部的同质化管理和一体化经营,这也就需要借助数据开放服务平台实现床位、检验检查、财务等全院资源的共享和统一管理。
第二步,梳理业务流程。医院业务流程的每个节点都承载了大量数据资源,好的业务流程能够产出高质量的数据,而数据分析则可以反过来进行流程改造,实现流程效率优化。医院数据开放服务平台的建设,需要站在医院全局视角出发,梳理清楚整个医院的业务流程和业务规则,比如患者就医服务的全流程管理、各个信息系统的业务交互规则、技术架构的设计规则等,找到业务流程中的断点或不合理地方,都要做相应的治理改造。
第三步,实施IT建设。医院数据开放服务平台项目建设,涉及数据从汇集、治理到最终应用的全过程,且在保证原始数据安全的前提下对医疗数据价值安全流通和共享提出很高的要求,因此需要“隐私计算+AI”的全栈技术矩阵来支撑平台建设。
图2:华西二院数据开放服务平台建设思路
02 从数据汇集到智能应用,“隐私计算+AI” 双轮驱动医疗数据价值释放
华西二院数据开放服务平台项目建设面临两大挑战:一方面,过去医院根据特定的科研项目,建设了一批独立、封闭的专病数据库系统,由于各个系统的数据标准等要求各不相同,导致医院科研数据系统重复建设、利用率低,且数据存在缺失、异常等问题,如何实现高质量数据治理、形成全院通用的数据资产是重要挑战之一。另一方面,传统多中心的医疗数据合作,往往受限于项目价值论证、合同签署、数据脱敏等繁琐流程,因而需要解决院外数据合规应用的挑战。
如何解决上述业务挑战,实现医疗数据资源“用起来”、“用得好”?吴邦华介绍了医院数据开放服务平台及专病库建设的思路流程:基于医院业务特点与需求,利用隐私计算、AI等技术,整合院内各业务系统数据,通过数据治理将海量、多源异构的医疗数据转化为结构化、高质量的可用数据集,在数据开放服务平台上形成全院一体化的、高复用的医疗数据资源,在充分保障原始数据安全前提下支撑上层临床科研、临床诊疗等多场景应用;在科研数据中心基础上,通过专病知识图谱、NLP后结构化、专病数据域模型等核心技术,进一步构建出适合医院特定专科的专病数据库。
图3:华西二院数据开放服务平台与智能应用
数据汇集。根据医院不同业务系统的数据库类型,数据开放服务平台支持多种数据采集方式,比如ETL工具、OGG/CDC实时同步技术等,能够完成多源异构数据的定制化采集和整合。
数据治理。针对医疗数据的多源多模态特征,华西二院利用自然语言处理、影像识别等技术,将非结构化数据转换成结构化数据,并进行数据缺失值和异常值清洗、数据归一、标准化处理,建立通用数据模型CDM,将不同数据源的数据能够用同一种方式组织、表达出来,实现数据源间的有效融合,为后续专病数据库建设做铺垫。
隐私计算。“数据安全是医疗数据跨机构流通的前提保障。”吴邦华表示,针对未来多中心医疗数据合作场景,数据开放服务平台内置同态加密、联邦学习、安全沙箱等多种隐私计算技术,可根据不同安全信任假设和计算复杂度场景选择最为合适的隐私计算方式,实现数据的隐私保护和安全流通。
AI模型应用。华西二院数据开放服务平台可结合项目需求部署相应的AI服务及模型应用,包括深度学习模型、医学知识库、文本标注系统、图像标注系统等AI服务,以及疾病预测预警模型、辅助诊断模型等适合具体医学场景的AI模型。例如,在先心病专病库建设中,华西二院通过学习大量相关病例,构建胎儿先天性心脏病预测评估模型和预警系统等AI应用,助力学科诊疗水平提升。
总结医院数据开放服务平台及专病库建设的实践经验,吴邦华认为,“从数据到数据价值释放,仅靠隐私计算技术远远不够,隐私计算+AI的全栈技术能力才是解锁医疗行业数据价值的最佳工具组合。AI具有强大的数据处理功能,是实现数据价值深度挖掘与释放的核心技术,而隐私计算的加持则可以有效保护流通共享过程中的数据安全。”为此,华西二院在最开始系统选型阶段就瞄准“全栈技术能力”,最终选择国内隐私计算企业翼方健数来负责搭建数据开放服务平台及先心病专病库。“依托于全栈技术,医院能够一站式完成医疗数据整合、数据治理、隐私计算、工具模型建设到智能应用的闭环支撑体系,促进医疗数据充分发挥临床、科研及运营管理价值。”
03 打造基于隐私计算的专病库,赋能临床科研、临床诊疗效能显著提升
吴邦华指出:“通过构建全院一体化、高质量的数据底座,不仅能够沉淀医院高质量的数据资产,而且可以支撑临床科研、临床诊疗、医院绩效管理和等级评审等诸多应用场景。”
首先,沉淀医院高质量数据资产。华西二院数据开放服务平台汇聚了集团内部所有业务系统数据,通过利用机器学习、自然语言处理等AI技术,将海量、多源、多模态的医疗数据转变为可直接用于多业务场景使用的标准化数据资源,为医院实现广泛场景应用奠定了坚实的数据底座。
据吴邦华介绍,数据开放服务平台目前已经接入大量的病历文书、药品医嘱、非药品医嘱、检验报告、检验结果等数据资源,下一步将继续扩大数据覆盖范围,统一集团内不同院区、甚至是外部医疗机构、医联体的数据资源,形成更为丰富的数据资产沉淀。
图4:华西二院数据开放服务平台接入数据类型
其次,实现医院科研成果质的飞跃。基于数据开放服务平台,华西二院进一步搭建了临床科研数据中心和先心病专病库,积累了丰富的小儿先天性心脏病数据资源,为科室进行临床科研思路的探寻和未来多中心研究提供了高效的工具支撑。
图5:专病科研协作平台架构
最后,提升临床诊疗水平。通过将历史电子医疗数据和实时医疗数据进行统一整合、治理,华西二院构建出针对特定病种的高质量专病数据库,并利用疾病预测预警、风险评估等AI模型,辅助医生进行临床决策诊断,从而提高医院临床治疗效果与临床质量。
比如在先心病专病库搭建完成后,华西二院将利用专病库标准化和结构化数据,构建孕前—产前—生后全过程的先心病防治各阶段预警和预测模型,提高早期识别率和减少并发症。同时,通过建立数据驱动的先心病三级防治一体化平台,对诊疗过程环节进行监控,助力早发现早治疗,始于本院辐射周边,提升学科整体诊疗水平。
吴邦华介绍到,先心病专病库建立后,将改变过去根据科研课题重复进行数据治理的局面,构建基于数据开放服务平台的专病库系统,顺利跑通医院专病库高效支持临床科研的流程模式。后续医院还将启动妇科肿瘤、盆底等专病库的搭建工作,逐步推动多学科领域临床科研、临床诊疗效能全面提升。
04 展望:打造“临床-科研-临床”的闭环生态
“临床科研是驱动精准诊疗、高效预防的动力源泉,建设更为完善的数据开放服务平台可加速科研成果向临床应用转化。”吴邦华指出,相较于基础科研,华西二院在临床科研方面还较为薄弱。未来,医院将基于数据开放服务平台,在提升医院整体数据质量、扩大医疗数据覆盖范围的基础上,持续深入探索数据在临床科研上的智能应用,不断提高临床诊疗水平和治疗效果。同时,医院也将组建专业的临床数据挖掘分析团队,全力支撑临床数据应用价值释放。