血常规、尿检等指标就能识别卵巢癌!中山大学刘继红团队牵头,四大医学院联合构建 AI 融合模型

news2024/11/27 12:56:57

根据国家卫生健康委员会发布的《卵巢癌诊疗指南(2022 版)》,我国卵巢癌年发病率居女性生殖系统肿瘤第 3 位,仅次于子宫颈癌和子宫体恶性肿瘤,病死率位于女性生殖道恶性肿瘤之首,其 5 年生存率与诊断时的病程阶段密切相关。根据美国国家癌症研究所发布的数据,在早期的局部感染阶段,卵巢癌 5 年生存率为 92.4% ,而转移阶段 5 年存活率则下降至 31.5%。

卵巢深处盆腔,卵巢病变处于早期时常无特异临床症状,因出现症状就诊时,70% 的患者已处于晚期。因此卵巢癌的早期诊断具有重大意义。

在这里插入图片描述

卵巢癌不同阶段的 5 年生存率

近日,中山大学肿瘤防治中心妇科刘继红教授团队,联合南方医科大学、华中科技大学同济医学院附属同济医院、浙江大学医学院附属妇产科医院,针对卵巢癌目前早期诊断困难、缺乏有效肿瘤标志物的困境,构建了卵巢癌诊断人工智能融合模型 MCF,输入常规实验室检验数据和年龄即可计算卵巢癌的患病风险。 相关成果已发表于《柳叶刀·数字健康》(The Lancet Digital Health)。

在这里插入图片描述

论文地址:
https://doi.org/10.1016/S2589-7500(23)00245-500245-5/fulltext#%20)
关注公众号,后台回复「卵巢癌」获取完整论文

研究亮点:

  • 该研究收集了我国 3 家医院的数据,并使用基于多标准决策的分类融合 (MCF) 框架来开发模型

  • 该模型识别卵巢癌的准确率优于 CA125 和 HE4 等传统生物标志物

  • 该研究证明了低成本、易获得的常规实验室检测,具备成为有效卵巢癌诊断工具的潜力

汇集 3 家医院、1 万名患者、98 项相关检查及数据

研究人员收集了 2012 年 1 月 1 日至 2021 年 4 月 4 日期间,中山大学肿瘤防治中心、华中科技大学同济医学院附属同济医院、浙江大学医学院附属妇产科医院内,超过 1 万例患者(卵巢癌及子宫附件良性病变/正常体检女性患者)的 98 项实验室检查和临床特征数据。

其中,华中科技大学同济医学院参与者(共 3,007 人)的数据被选为训练集,并在该训练集上进行了五倍交叉验证。两个外部验证集分别来自浙江大学医学院妇女医院(共 5,641 人)和中山大学肿瘤中心(共 2,344 人)。

MCF:融合 20 个基础分类模型

在这里插入图片描述

研究流程图

该研究招募了我国 3 个不同地区的大量参与者。3 个队列中卵巢癌诊断的中位年龄为 51-56 岁。然而,大规模数据也带来了一些问题。例如,多中心数据是异质的,不利于构建稳健的人工智能模型,并且存在一些缺陷,包括卵巢癌患者和对照参与者数量之间存在显著不平衡,单位不一致,以及大量的缺失值(内部验证集为 48.5%)。

为了解决这些数据问题,确保模型的稳健性,研究人员进行了大量的数据清洗工作, 包括:

  • 构建模型时,将 98 项实验室检测项目列为候选输入特征。对于单位不同的实验室检测项目,进行了单位统一处理。

  • 缺失数据通过 MICE (multivariate imputation by chained equations) 算法进行估算。

  • 为了减少机构间数据分布的差异,使用 Box-Cox 算法进行了数据调和,然后通过 min-max 标准化进行了数据规范化处理。

  • 为了解决数据不平衡问题,采用了自适应综合采样方法,平衡比例为 0.5。

此外,MCF 框架是该研究团队在先前工作中提出的 H-MCF(基于 MCF 的分层预测方案)的一个变体,研究人员建立了 176 个基础分类模型,并结合了特征选择方法 (feature selection method) 与机器学习分类器 (machine-learning classifier),通过五倍交叉验证,从 176 个模型中选出前 20 个基础分类模型。其中 ,特征选择过程将识别最重要的 20 个特征,供分类器使用以生成一个基础分类模型。

随后,研究人员根据多准则决策理论 (multi-criterion decision-making) 估计每个模型的权重,最终融合其预测以达成一致性分类。

在这里插入图片描述

前 20 个基础分类模型

模型性能显著高于传统方法

研究人员通过 AUC、准确性、特异性、敏感性、阳性预测值、阴性预测值和 F1 分数,来量化 MCF 模型预测准确性,结果如下图所示:

在这里插入图片描述

研究人员从前 20 个基础分类模型中选出的 52 个特征(51 项实验室检验指标和年龄),其中约 90% 的特征与卵巢癌的风险显著相关,并基于 SHAP(Shapley Additiveexplanation ,一种评估和解释模型预测的技术)构建了类似的一致性特征排名。单个特征的预测 AUC 范围为 0.477 (AFP) 至 0.886 (CA125),并且总体上与它们的排名一致。

其中,51 项实验室检验指标包含了常规血液检查、尿检、生化检查等, 例如血小板 PLT、纤维蛋白原测定 FIB、评定炎症程度的指标 CRP、测定血清白蛋白水平的 ALB、红细胞沉降率 ESR、尿 ph 值等。下图 A 为检验指标的重要性排序。

在这里插入图片描述

特征排名及相关分析

MCF 在内部验证集和两个独立的外部验证集上的 AUC 分别达 0.949 (95%CI 0.948-0.950)、0.882 (0.880-0.885) 和 0.884 (0.882-0.887)。

研究人员还将 MCF 与卵巢癌检测中的传统肿瘤标志物进行了比较。对于区分卵巢癌的所有 3 个验证集,MCF 的 AUC、敏感性和 F1 评分均高于传统肿瘤标志物, 如下图所示:

在这里插入图片描述

对于晚期卵巢癌与对照组的分类,MCF 在内部验证集中的 AUC 为 0.985;第一个外部验证集达到 0.972,第二个外部验证集达到 0.943。对于早期卵巢癌症与对照组的分类,MCF 在内部验证集中的 AUC 为 0.879,在第一和第二外部验证集中分别为 0.823 和 0.810。

研究结果显示 ,MCF 模型识别卵巢癌患者、特别是早期卵巢癌患者的 AUC 和灵敏度显著高于传统卵巢癌标志物 CA125、HE4 及两者联合, 且在部分指标缺失的人群中依然可以对卵巢癌的风险进行较准确的预测,这表明 MCF 模型具有较好的稳定性,并对真实世界数据具有较好的兼容性。

此外,本研究还发现,除肿瘤标志物外,其他常规实验室检验,如 D-D二聚体、血小板计数等,也对卵巢癌诊断预测有较大贡献,提示这些检验指标相关病理生理过程可能在卵巢癌的发展过程中发挥了重要作用,其潜在机制值得进一步探讨。

AI 赋能基层医疗发展

根据「2022 年我国卫生健康事业发展统计公报」,尽管我国基层医疗卫生机构达到 979,768 个,占全国医疗卫生机构总数的 94.85%,但就诊疗量而言,基层医疗卫生机构诊疗量 42.7 亿人次,仅占全年总诊疗量的 50.7%。可以看出,我国基层医疗卫生机构数量占比较高,但诊疗量仍有较大上升空间。

此外据国家癌症中心的数据统计,在我国肿瘤医疗服务市场,公立三甲医院承担了超过 80% 的肿瘤治疗任务。这些三甲医院大多分布在省会城市,却要同时接待来自四面八方的患者,医生的压力可想而知。

但近些年人工智能的成熟应用给医疗行业带来了无限遐想,也为基层就诊提供了新思路。本研究构建的卵巢癌诊断模型 MCF 已开源,输入相应实验室检验数据和年龄即可计算患卵巢癌的风险值,无疑为该模型在基层医疗机构的普及提供了重要助力。

人工智能辅助诊断在基层卫生机构的配置至关重要,国务院此前印发的「关于进一步深化改革促进乡村医疗卫生体系健康发展的意见」中也提到,要加快推动人工智能辅助诊断在乡村医疗卫生机构的配置应用。

人工智能应用于基层卫生机构,不仅可以将医疗信息处理为结构化数据,解决「数据孤岛」和数据质量问题,为区域内的医疗信息互联共享打下基础;还能通过辅助问诊、辅助诊断、慢病管理等功能,提高基层诊疗水平,降低漏诊、误诊概率,让更多地方享受到高质量的诊断和治疗。

参考资料:

1.https://www.sysu.edu.cn/news/info/2331/1091611.htm

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1582191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VM-UNet: Vision Mamba UNet for Medical Image Segmentation

VM-UNet: Vision Mamba UNet for Medical Image Segmentation VM-UNet:基于视觉Mamba UNet架构的医学图像分割 论文链接:http://arxiv.org/abs/2402.02491 代码链接:https://github.com/JCruan519/VM-UNet 1、摘要 文中利用状态空间模型SS…

Vue2 —— 学习(四)

一、收集表单数据 (一)介绍 前面其实已经 学过了 v-model 双向绑定事件,能获取到表单中的内容到 vm 实例对象中 但是前面只是收集文本框,下面学习一下 各种类型表单数据收集 (单/多 选,下拉框&#xff0…

Java - 赋值运算符

在这个实战中,我们将学习赋值运算符的使用方法。首先,我们将介绍简单赋值运算符的基本概念和语法格式。然后,我们将通过案例演示来加深对赋值运算符的理解。接下来,我们将对比Java和Python这两种不同的编程语言,探讨它…

linux进阶篇:文件查找的利器——grep命令+管道操作详解

Linux文件查找的利器——grep命令管道操作详解 1 grep简介 grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。 Uni…

4.2.4 理解路由器数据包过程

1、实验目的 通过本实验可以掌握: 了解IP路由原理了解数据包封装和解封装的概念了解路由器路由和交换过程 2、实验拓扑 观察路由器路由数据包过程的实验拓扑如图4-3所示,设备接口地址信息如表4-2所示。 图4-3 观察路由器路由数据包过程的实验拓扑 本…

常见深度学习之十二大激活函数【函数定义、性质、数学公式、代码实现】

目录 前言 1、激活函数的定义与作用 2、激活函数的性质 二、常见的激活函数 2.1 Sigmoid函数: 1. 作用 2. 优点 3. 缺点 4. 数学公式 5.Sigmoid函数实现及可视化图像 2.2 Tanh函数 1. 函数定义 2.优点 3.缺点 4.Tanh函数实现及可视化图像 2.3ReLU 函数 :…

盘点那些好用的FIORI App(六)-导出金税批量开票文件

着全电发票政策的推行,越来越多的企业由原来的纸质专票以及电子票转向了全电发票,全电发票与原来票的区别在于,企业不再需要金税盘,可以直接登录电子开票平台,开具电子发票。税务平台提供了一个可以批量上传发票进行开…

SpringBoot学习笔记三-原理分析

SpringBoot学习笔记三-原理分析 SpringBoot自动装配1.1 案例1.2 通过注解方式管理Bean1.3 小结1.4 Enable注解1.5 Import注解1.5.1 ImportSelector实现类1.5.2 导入ImportBeanDefinitionRegistrar 1.5 EnableAutoConfiguration1.6 案例 SpringBoot自动装配 当再pom.xml中导入对…

数据结构|排序总结(1)|直接插入排序

排序分类 插入排序:直接插入排序,希尔排序 选择排序:选择排序,堆排序 交换排序:冒泡排序,快速排序 归并排序 插入排序 直接插入排序 相当于摸牌,例如我们现在手上有{2,4&#xff0…

无法解析符号 ‘mybatis‘(类似这种报错)

问题:无法解析符号 mybatis(类似这种报错) 解决:

安科瑞用户侧35kV用户变电站系统结构【110kV/66kV/35kV】

35kV综自系统项目怎么做?客户群体是什么?能带来多大的业绩? 1)主要客户群体是设计院(电力设计院、行业设计院)、甲方、总包。 2)综自系统本身的体量和业绩: a.大约35kV&#xff08…

螺旋矩阵.

0螺旋矩阵 - 蓝桥云课 (lanqiao.cn) 题目描述 对于一个n行m列的表格,我们可以使用螺旋的方式给表格依次填上正整数,我们称填好的表格为一个螺旋矩阵。 例如,一个4行5列的螺旋矩阵如下: 1 2 3 4 5 14 15 16 17 6 13 20 19 18 7 12 …

微服务(狂神)

什么是微服务: 微服务方案: 1. SpringCloud NetFlix 2. Dubbo 3. SpringCloud Alibaba 解决了什么问题: 1. 服务过多,客户端怎么访问 2. 服务过多,服务间怎么传值 3. 服务过多,如何治理 4. 服务过多…

【HTML】简单制作一个分形动画

目录 前言 开始 HTML部分 效果图 ​编辑​编辑​编辑​编辑总结 前言 无需多言,本文将详细介绍一段代码,具体内容如下: 开始 首先新建文件夹,创建一个文本文档,其中HTML的文件名改为[index.html]&a…

Python中csr_matrix的两种初始化方法

本文以csr_matrix为例来说明sparse矩阵的使用方法,其他类型的sparse矩阵可以参考https://docs.scipy.org/doc/scipy/reference/sparse.html csr_matrix是Compressed Sparse Row matrix的缩写组合,下面介绍其两种初始化方法 csr_matrix((data, (row_ind…

京东云16核64G云服务器租用优惠价格500元1个月、5168元一年,35M带宽

京东云16核64G云服务器租用优惠价格500元1个月、5168元一年,35M带宽,配置为:16C64G-450G SSD系统盘-35M带宽-8000G月流量 华北-北京,京东云活动页面 yunfuwuqiba.com/go/jd 活动链接打开如下图: 京东云16核64G云服务器…

Python-VBA函数之旅-bool函数

目录 1、bool函数 1-1、Python: 1-2、VBA: 2、相关文章: 个人主页:非风V非雨-CSDN博客 bool函数(Boolean Function)用于将给定的值转换为布尔值(True或False)。常见的应用场景有: 1、条件判断:bool()…

vulhub之ActiveMQ篇

ActiveMQ的web控制台分三个应用,admin、api和fileserver,其中admin是管理员页面,api是接口,fileserver是储存文件的接口;admin和api都需要登录后才能使用,fileserver无需登录。fileserver是一个RESTful API…

冻干可以天天给成年猫吃吗?5大好口碑不翻车专家直入!

近年来,冻干猫粮因其高品质而备受喜爱,吸引了无数猫主人的目光,像我这样的资深养猫人早已开始选择冻干喂养。新手养猫就弄不明白了,什么是冻干猫粮呢?冻干可以天天给成年猫吃吗? 一、什么是冻干 简单来说&…

【微服务】------微服务架构技术栈

目前微服务早已火遍大江南北,对于开发来说,我们时刻关注着技术的迭代更新,而项目采用什么技术栈选型落地是开发、产品都需要关注的事情,该篇博客主要分享一些目前普遍公司都在用的技术栈,快来分享一下你当前所在用的技…