小罗碎碎念
2024-05-28|文献速递
今天推荐的6篇文章,质量都非常的高,都是与肺癌
相关的最新进展。
看我推文的,很多来自不同的专业,研究不同的癌种。小罗友情提醒,不要只盯着自己领域的癌种,要兼容并包,海纳百川,哈哈。
肺癌
、乳腺癌
还有前列腺癌
这些癌种,属于是研究最早的一批癌种,公开数据集
非常多。数据获取难度降下来了,也就意味着挤进这个赛道的人变多了,可借鉴的经验也就变多了。但是,随之而来的还有一个问题,那就是不同人群之间,会存在数据偏差
;另外,公用数据集的质量,大概率没有内部数据集的质量好,这就会影响模型的泛化性
。
今天分享的这几篇文章,刚好把上面提到的那些问题都涉及到了,重点推荐一下第四篇文章——作者提出的模型,能够从CT图像中获取与相应病理图像中包含的“金标准”信息。想做多模态
的同学和老师,不妨思考一下,如果影像组学
本身就能提取出与病理
对应的金标准信息,后期再融合两种模态
,模型的效果会不会更好呢?
哈哈,点到为止,今天的推文就到这里了。课题设计没有灵感的,记得每天来看小罗的推文哈,我们明天见!!
交流群
欢迎大家来到【医学AI】交流群,本群设立的初衷是提供交流平台,方便大家后续课题合作。
一 、肿瘤微环境新发现:肺癌细胞如何’策反’免疫卫士?
文献概述
这篇文章是一项关于非小细胞肺癌
(non-small cell lung cancer, NSCLC)的单细胞
和空间转录组学
分析研究。
研究团队由Marco De Zuani、Haoliang Xue、Jun Sung Park等人组成,他们从25位
未接受治疗的肺腺癌
和鳞状细胞癌
患者中收集了大约90万个细胞
进行分析。研究发现肿瘤生态系统中存在多种免疫细胞类型,尤其是髓系细胞,在疾病进展中扮演重要角色。
研究结果揭示了抗炎性巨噬细胞与NK细胞/T细胞之间的负相关关系,以及肿瘤内NK细胞的细胞毒性降低。尽管肺腺癌和鳞状细胞癌在细胞类型组成上相似,但在多种免疫检查点抑制剂的共表达上存在显著差异。此外,研究还发现了肿瘤中巨噬细胞的转录“重编程”,使它们趋向胆固醇输出,并采取类似胎儿的转录特征,这有助于铁的外排。
这项多组学资源提供了肿瘤相关巨噬细胞的高分辨率分子图谱,增进了我们对其在肿瘤微环境中角色的理解。研究还发现肿瘤与邻近肺组织相比,具有更高多样性的免疫和非免疫细胞。在肿瘤中,成纤维细胞和淋巴内皮细胞的比例发生了变化,并且上皮细胞的多样性增加。
研究还探讨了肿瘤微环境中的细胞间相互作用网络,发现肺腺癌和鳞状细胞癌虽然在细胞组成上相似,但在细胞间相互作用网络上存在差异。例如,某些免疫检查点抑制剂及其相应的抑制分子在两种癌症中的共表达不同。研究还发现,在肿瘤微环境中,巨噬细胞亚群之间存在连续性,并且STAB1+巨噬细胞可能与肿瘤细胞紧密相关。
此外,研究还发现肿瘤巨噬细胞在肿瘤微环境中经历了“重编程”,采取了有利于胆固醇外排和铁外运的转录特征,从而支持肿瘤的进展。研究结果为开发针对NSCLC的更有效治疗策略提供了重要信息。
重点关注
Fig. 1 展示了非小细胞肺癌(NSCLC)异质性的单细胞转录组学分析结果。
以下是对图中各个部分的分析:
A. 研究概述:从切除的肿瘤组织、邻近未受累组织(背景)以及已故捐赠者的健康肺中制备了单细胞悬浮液,并富集了CD45+或CD235-的细胞进行单细胞RNA测序(scRNA-seq)。使用新鲜冷冻的肿瘤、背景和健康组织的冷冻切片进行10x Genomics Visium空间转录组学研究。
B. 队列概览:符号代表了个体患者以及执行的分析。
C. UMAP投影:展示了肿瘤和结合背景+健康数据集的UMAP(Uniform Manifold Approximation and Projection)投影图,这是一种用于降维和数据可视化的技术。
D. 点图(Dotplot):显示了用于肿瘤样本中宽泛细胞类型注释的代表性基因。点图通常用于展示基因表达水平,点的大小代表表达量,颜色代表表达水平的变化。
E. 等高线图(Contour plot):展示了在AT2细胞(44,399个细胞)、CAMLs(2520个细胞)和AIMφ(16,120个细胞)中共表达的髓系(LYZ, CD68, MRC1)和上皮系(EPCAM)基因。这些数据被标准化、缩放和对数转换。
F. 箱线图(Boxplot):展示了在AT2细胞、CAMLs和AIMφ中髓系(LYZ, APOE, CD68, MRC1)和上皮系(EPCAM, KRT8, KRT19)基因的标准化、缩放和对数转换后的基因表达。箱形图显示了四分位数,须表示1.5倍四分位距。
G. 非免疫细胞亚群的相对比例:在CD235-富集中计算的肿瘤与背景之间的差异。箭头指示了肿瘤与背景相比的增加(↑)或减少(↓)。使用双边Wilcoxon秩和检验和Bonferroni校正进行多重比较。**P < 0.01。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。
H. 广泛免疫细胞的相对比例:在所有免疫细胞中识别的CD235-富集中计算的肿瘤与背景之间的差异。箭头指示了肿瘤与背景相比的增加(↑)或减少(↓)。使用双边Wilcoxon秩和检验和Bonferroni校正进行多重比较。*P < 0.05, **P < 0.01, ***P < 0.001。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。
I. 肿瘤和背景中NK、DC、B、T细胞和巨噬细胞亚群的相对比例:在CD235-富集中计算的广泛注释内的肿瘤与背景之间的差异。箭头指示了肿瘤与背景相比的增加(↑)或减少(↓)。使用双边Wilcoxon秩和检验和Bonferroni校正进行多重比较。***P < 0.001。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。
总体而言,Fig. 1 通过单细胞转录组学和空间转录组学技术,揭示了肿瘤组织与邻近正常组织在不同细胞类型上的异质性和差异。这些结果有助于深入理解肿瘤微环境中细胞的复杂性,并为未来的治疗策略提供潜在的靶点。
二 、肌肉流失预警:接受免疫治疗的晚期肺癌患者的生存新指标
文献概述
这篇文章是一项关于接受免疫治疗
的晚期非小细胞肺癌
(NSCLC)患者的体成分
(BC)与肿瘤学结果之间关系的多队列研究。研究的主要目的是评估在接受免疫治疗的晚期或转移性NSCLC患者中,体成分与肿瘤学结果(如总生存期(OS)和无进展生存期(PFS))之间的相关性。
研究包括来自Dana-Farber Brigham Cancer Center (DFBCC)的临床数据,以及1108研究的第1/2阶段和MYSTIC试验的化疗部分的前瞻性
收集数据。使用深度神经网络自动选择基线和随访计算机断层扫描(CT)图像
的L3层面,并进行体室分割
(骨骼肌[SM]、皮下脂肪组织[SAT]和内脏脂肪组织)。根据基线的体成分测量或首次随访扫描时的变化比较结果。
研究结果显示,在1791名
NSCLC患者中,骨骼肌质量
的丢失(通过L3骨骼肌面积的变化表示)与跨患者群体的较差肿瘤学结果相关。这种关联在男性患者中最显著,在MYSTIC试验和DFBCC-CIO队列的女性患者中关联不显著。此外,皮下脂肪密度增加超过5%(通过皮下脂肪室的平均CT衰减量化)与3个患者群体中较差的OS相关。这种变化主要在女性患者中观察到。
研究结论指出,这项多队列研究的结果表明:
- 在NSCLC的系统治疗期间,骨骼肌质量的丢失是一个不良结果的标志,特别是在男性患者中。
- 皮下脂肪组织[SAT]密度的变化也与预后相关,特别是在接受免疫检查点抑制剂治疗的女性患者中。
研究建议在确定NSCLC预后时应考虑自动CT衍生的体成分测量。
文章还讨论了体成分作为各种癌症潜在预后标志物的研究背景,以及如何使用CT成像等影像学方法来量化和区分体成分的不同部分。此外,文章还提到了性别差异在脂肪分布和免疫功能方面的影响,以及这些差异可能如何影响研究结果。
这项研究的局限性在于其回顾性汇总设计可能限制了推断因果关系的能力,并且研究人群的异质性以及接受不同系统治疗方案的患者可能导致治疗反应的差异。尽管如此,这项研究提供了有关晚期NSCLC患者在接受系统治疗期间体成分变化与肿瘤学结果相关性的有价值的见解。
重点关注
Figure 1提供了该研究中模型实施和研究人群的概览。
这个图表可以分为几个部分来分析:
A. Model Workflow (模型工作流程)
这部分展示了研究中使用的深度学习模型的工作流程。流程包括:
- Offset: 可能指的是图像预处理步骤,用于调整图像数据。
- Abdominal CT series (3-D): 表示腹部的三维计算机断层扫描系列。
- Slice selection network (4-block DenseNet): 一个用于选择特定切片(例如L3切片)的网络,使用DenseNet架构,该架构包含4个区块。
- Extract slice L3 slice (2-D): 从三维数据中提取L3层面的二维图像。
- Segmentation mask: 表示用于分割不同体成分(如骨骼肌、皮下脂肪和内脏脂肪)的掩膜。
- Segmentation network (multiclass 2-D U-Net): 一个用于图像分割的网络,采用多类别的二维U-Net架构,用于区分图像中的不同组织类型。
B. Datasets (数据集)
这部分描述了用于训练和验证模型的数据集。数据集可能包括不同来源和类型的数据,例如回顾性和前瞻性收集的数据。
C. Body Composition Profiling (体成分分析)
这里展示了在基线和随访扫描时进行的体成分分析。这可能涉及评估患者的骨骼肌、脂肪和其他组织的变化。
D. Examples (示例)
这部分提供了模型输出的一些代表性示例,展示了不同体成分分布的患者图像:
- Representative high SM/low fat: 代表高骨骼肌/低脂肪分布的患者。
- Representative low SM/high fat: 代表低骨骼肌/高脂肪分布的患者。
- Representative high SM/high fat: 代表高骨骼肌/高脂肪分布的患者。
这些示例可能用于说明模型如何区分不同的体成分特征。
E. Color Coding (颜色编码)
在示例图像中,不同的颜色代表不同的组织类型:
- Yellow: 代表皮下脂肪组织 (SAT)。
- Green: 代表骨骼肌 (SM)。
- Brown: 代表内脏脂肪组织 (VAT)。
整个Figure 1为读者提供了一个清晰的视角,了解研究中使用的模型是如何工作的,以及研究人群是如何被定义和分析的。通过这种详细的流程和示例,读者可以更好地理解研究方法和结果的科学基础。
三、从误诊到治愈:AI揭示75岁老人的隐藏肺癌
文献概述
这篇文章讲述了一个75岁女性患者
的故事,她在常规X光检查后被误诊为无异常。这位患者三年前因直肠和肛管癌接受了腹会阴切除手术,当时的诊断为直肠腺癌
(中度至良好分化的管状腺癌,25mm×20mm,pT2N0M0,I期)和肛管鳞状细胞癌
(5mm×5mm,pTisN0M0,0期)。作为随访的一部分,她进行了X光检查
,但初步报告未发现任何异常。
然而,后来X光片被一个由Fujifilm Medical Corporation开发的基于人工智能(AI)的放射诊断软件CXR-AID重新检查,该软件在去年被医院采用用于所有胸部X光的常规检查。AI报告指出左下叶有一个结节。
尽管患者体格检查未发现任何异常,实验室检查(包括全血细胞计数、血清C反应蛋白浓度和血清隐球菌抗原)以及肿瘤标志物(包括癌胚抗原、糖类抗原19-9和鳞状细胞癌抗原)均显示正常,但胸部CT扫描显示心脏和降主动脉后方有一个10mm的结节,这个结节在X光片上由于支气管阴影的遮挡而难以看到。
初步诊断为肺转移瘤
,来自直肠和肛管癌。患者随后接受了胸腔镜下的部分肺叶切除术,术后没有问题。手术中取出的12mm×8mm病变组织的病理组织学检查显示为中度至良好分化的管状腺癌
,证实了肺转移瘤的诊断。
在3个月的随访中,通过放射科医生和AI软件复查的胸部X光片未发现癌症复发的证据。患者报告自己状况良好,没有呼吸症状。
文章还提到,近年来,有许多尝试使用机器学习和深度学习提供基于胸部X光的自动诊断。计算机辅助诊断开始被纳入诊断过程,减轻了医生的工作量。基于AI的胸部X光的诊断性能已经达到了放射科医生的准确性,在某些情况下甚至超过了它。
重点关注
通过人工智能(AI)诊断出隐藏性转移性肺癌的三个关键图像:
(A) 后前位胸部X光片显示无异常:这张图显示了患者胸部的X光片,从后向前观察,没有发现任何异常。这表明在初步检查时,放射科医生未能发现患者的肺部异常。
(B) 人工智能生成的复查胸部X光片指出左下肺野的病变(箭头):这张图是AI系统分析后的X光片,它指出了左下肺野中的一个病变区域。AI系统通过算法识别出了人类视觉可能遗漏的异常,用箭头标记出了病变的位置。
© 胸部CT扫描显示心脏和降主动脉背侧的小结节(箭头):这张图是更详细的胸部计算机断层扫描(CT)图像,它显示了心脏和降主动脉背侧的一个微小结节。这个结节在X光片上可能因为位置的原因而被遮挡,不易被发现,但在CT图像中可以清楚地看到。
分析这三个图像,我们可以看到:
- AI的辅助作用:AI系统能够识别出人类可能忽视的病变,这对于提高诊断的准确性至关重要。
- 病变的位置和隐蔽性:病变位于心脏和降主动脉的背侧,这个位置在常规X光片上可能不易被观察到,说明了某些病变的隐蔽性和复杂性。
- 诊断技术的差异:CT扫描提供了比普通X光更详细的图像,有助于更准确地识别和定位病变。
这些图像和分析结果强调了AI在医疗诊断中的重要性,尤其是在提高早期发现和治疗癌症方面的潜力。同时,它们也展示了不同成像技术在诊断过程中的互补性。
四、肺癌亚型辨析|单模态CT图像揭示多模态病理秘密
文献概述
这篇文章是关于一种新型的深度学习网络(SGHF-Net),用于在计算机断层扫描(CT)图像
上准确分类肺癌亚型。研究团队由来自中国浙江工业大学
信息工程学院、浙江实验室
、奥地利格拉茨工业大学计算机图形与视觉研究所、中国西北工业大学
计算机科学与工程学院、上海人工智能实验室
和美国罗格斯大学
计算机科学系的成员组成。
文章首先强调了肺癌亚型病理学准确诊断对于后续治疗和预后管理的重要性。作者提出了一种自生成混合特征网络
(SGHF-Net),它通过深度神经网络定量映射跨模态关联,从CT图像中获取与相应病理图像中包含的“金标准”信息。此外,研究者设计了一个放射学特征提取模块
(RFEM),直接获取CT图像信息,并与病理先验有效融合,使整个分类模型能够生成更具指示性和特异性的病理相关特征,最终输出更准确的预测。
SGHF-Net
模型的创新之处在于其能够基于单模态输入(即CT图像)自生成包含多模态图像信息的混合特征。为了评估模型的有效性、适应性和泛化能力,作者在大规模多中心数据集(即来自三家医院的829个病例
)上进行了广泛的实验,将模型与一系列最新技术(SOTA)分类模型进行了比较。实验结果表明,所提出的模型在肺癌亚型分类方面具有显著的准确性提升,包括准确率(ACC)、曲线下面积(AUC)、阳性预测值(PPV)和F1分数等方面都有显著提高。
文章的其余部分详细介绍了研究方法、实验设置、评估指标、实施细节以及多中心数据集的外部验证。作者还讨论了所提方法的潜在局限性和未来工作的方向,包括在更复杂的应用中实施所提方法的可行性,例如多灶性癌症/合并癌症的CT图像诊断、癌症侵袭程度评估以及其他与癌症相关的临床问题。
最后,作者得出结论,SGHF-Net
是一个新颖的深度学习网络,能够通过CT图像准确分类肺癌亚型,并且该模型的病理先验引导策略有很大的潜力被扩展到更复杂的应用中。
重点关注
Fig. 1 展示了两组图像:LUAD(肺腺癌)病例的CT图像和病理图像(a和b),以及LUSC(肺鳞癌)病例的CT图像和病理图像(c和d)。
这些图像的详细模式可以帮助识别和区分两种不同类型的肺癌亚型。
-
LUAD病例(a & b):第一组图像展示了肺腺癌的CT图像(a)和对应的病理图像(b)。CT图像可能显示了肿瘤的大小、形状、位置以及可能的转移情况,而病理图像则提供了细胞形态、细胞分化程度、细胞密度等详细信息。这些信息对于理解肿瘤的生物学行为和制定治疗计划至关重要。
-
LUSC病例(c & d):第二组图像展示了肺鳞癌的CT图像©和对应的病理图像(d)。与腺癌相比,鳞癌在CT图像上的表现形式可能不同,病理图像也会反映出不同的细胞学特征。例如,鳞癌可能在CT图像上呈现为中央型肿瘤,而病理图像可能显示角化珠的形成,这是鳞癌的一个特征。
Fig. 1的分析表明,通过结合影像学和病理学数据,可以更全面地理解肺癌的特征,并为开发更准确的诊断工具提供支持。
SGHF-Net(自生成混合特征网络)的流程图——基于CT图像的新型分类模型。
SGHF-Net 通过结合病理学特征(pathological features)和放射学特征(radiological features)来提高肺癌亚型的分类准确性。
-
特征提取:
- 𝑓p 代表从病理图像(Pathological Images)中提取的特征,这些特征是通过病理特征合成模块(Pathological Feature Synthetic Module, PFSM)生成的,该模块能够从CT图像中定量映射跨模态关联,生成类似于病理图像的高级特征。
- 𝑓r 代表直接从CT图像中提取的放射学特征(Radiological Features),这是通过放射学特征提取模块(Radiological Feature Extraction Module, RFEM)完成的。
-
特征融合:
- 𝐹(⋅) 表示融合模块(Fusion Module),它的作用是将病理学特征 𝑓p 和放射学特征 𝑓r 结合起来。这个融合过程旨在整合两种模态的信息,以生成更全面的特征表示,这些表示能够更好地捕捉肺癌的病理特性。
-
分类:
- 𝐶(⋅) 表示分类组件(Classification Component),它利用融合后的特征来执行肺癌亚型的分类任务。分类组件的输出是模型对CT图像中肺癌亚型的预测。
-
整体流程:
- 输入:模型的输入是CT图像及其对应的病理图像(仅在训练阶段使用)。
- 训练:在训练阶段,PFSM 和 RFEM 被训练以提取和融合特征。
- 验证和测试:在验证和测试阶段,模型只依赖于CT图像来生成预测。
-
创新点:
- SGHF-Net 的创新之处在于其能够自生成包含多模态信息的混合特征,即使在只有单模态输入(CT图像)的情况下。
-
优势:
- 通过结合病理学和放射学特征,模型能够生成更具指示性和特异性的特征,从而提高分类的准确性。
- 该模型还具有较好的泛化能力,能够在大规模多中心数据集上实现有效的分类。
Fig. 2 展示了 SGHF-Net 如何通过融合来自不同医学图像模态的信息来增强肺癌亚型的分类能力,突出了深度学习在医疗图像分析中的潜力。
五、ChatGPT4辅助论文撰写,探索人工智能在非小细胞肺癌治疗中的应用
文献概述
这篇文章是一篇关于人工智能(AI)在非小细胞肺癌(NSCLC)治疗中应用的编辑评论
。文章由Shumpei Ishikawa撰写,讨论了AI如何通过预测治疗结果、验证新辅助疗法并提高精确度来增强NSCLC的护理。
文章提到,肿瘤学领域正在经历一个变革时期,AI在病理评估中的整合,尤其是在NSCLC的新辅助疗法背景下。Dacic等人的研究提供了AI在肺癌突变联盟3(LCMC3)研究基础上推进癌症护理的潜力的深刻见解。
免疫检查点抑制剂
(ICIs)作为NSCLC的新辅助疗法,已被美国食品药品监督管理局批准,并被发现在晚期肺癌中特别有效。这些疗法,尤其是当ICIs与化疗结合使用时,显示出显著的临床益处。CheckMate 816试验的结果表明,病理完全缓解与ICIs新辅助治疗的无事件生存期延长之间存在相关性。
文章强调了个性化治疗的必要性,但测量ICIs的有效性一直是一个挑战,因为需要较长时间来观察无病生存和总体生存等临床终点。病理反应
(PathR)是一个反映治疗后组织学变化的指标,对于评估早期治疗有效性至关重要。PathR包括主要病理反应(MPR)和病理完全反应。
LCMC3研究引入了一种新视角,利用卷积神经网络
模型数字化分析切除的肿瘤标本。这种方法不仅符合既定指南,还提供了一种更有效、精确和一致的肿瘤活性评估。AI驱动的方法与传统病理学家的视觉评估高度一致,强调了其准确性。更重要的是,数字化评估的MPR发现与更长的无病生存和总体生存之间存在显著相关性,强化了其作为患者结果可靠预测者的潜力。
文章还讨论了AI在提高PathR评估精确度方面的作用,从而使患者护理决策更加明智。此外,AI以其可扩展性和标准化能力,解决了临床试验和常规实践中手动评估的挑战。AI不仅简化了评估过程,还减少了常常困扰手动评估的变异性。
最后,文章指出,AI在肿瘤学中的更广泛应用,不仅展示了AI在评估PathR
方面的有效性,而且为AI在肿瘤学中的更广泛应用树立了先例。随着我们接受这项技术进步,我们正朝着一个癌症治疗不仅有效,而且根据患者个体需求量身定制的未来迈进。
作者还讨论了在肺癌新辅助治疗中,尽管接受了术前免疫疗法,肿瘤仍然进展的问题,并提出了通过活检预先预测免疫疗法的反应,以便及时对不太可能从中受益的患者进行手术的必要性。作者声明在撰写过程中使用了ChatGPT4
来改善语言,并承担了出版物内容的全部责任。
六、技术进步背后的种族偏见:揭示隐藏在算法中的人口统计偏差
文献概述
这篇文章发表在《Nature Medicine》2024年4月号上,题为《Demographic bias in misdiagnosis by computational pathology models
》,作者包括Anurag Vaidya, Richard J. Chen, Drew F. K. Williamson等多位研究人员。文章主要探讨了在计算病理学模型中,人口统计因素对性能的影响,尤其是这些模型在对乳腺癌
和肺癌
亚型分类以及胶质瘤
中IDH1突变
预测时,对不同人群可能存在的偏见和误差。
文章指出,尽管计算病理学系统获得了越来越多的监管批准,但基于深度学习的系统经常忽视人口统计因素对性能的影响,可能导致偏见。这一问题尤为重要,因为计算病理学依赖于大型公共数据集,而这些数据集往往不能充分代表某些人群。研究使用了来自癌症基因组图谱(The Cancer Genome Atlas, TCGA)和EBRAINS脑肿瘤图谱的公开数据,以及内部患者数据,展示了在不同人群之间存在显著的性能差异。
研究结果表明,使用常见的建模方法时,白人和黑人患者在乳腺癌亚型分类、肺癌亚型分类以及胶质瘤中IDH1突变预测方面的性能差距分别为3.0%、10.9%和16.0%。研究发现,通过自监督视觉基础模型获得的丰富特征表示可以减少群体间性能差异。即便如此,自监督视觉基础模型并不能完全消除这些差异,这突显了在计算病理学中持续需要努力减轻偏见。
文章还讨论了数据特征、模型架构和偏见缓解策略对模型公平性和性能的影响,并建议监管和政策机构在评估指南中整合人口统计分层评估。此外,研究还发现,即使在考虑了与人群相关的数据特征后,不同种族群体之间的性能差异仍然存在,这表明需要在计算病理学中进一步研究和解决这些差异。
文章最后强调,为了提高计算病理学模型的公平性和性能,需要采取多种措施,包括使用自监督学习、改进数据预处理技术、实施偏见缓解策略,并确保在不同人群中进行充分的模型评估和测试。
重点关注
Fig. 1 展示了在研究中使用的三个数据集(TCGA、MGB和EBRAINS脑肿瘤图谱)的特征、研究中使用的公平性指标以及建模选择。
以下是对图的详细分析:
a 部分展示了用于研究的三个数据集的组成,包括它们包含的用于诊断算法研究的幻灯片数量。这些数据集用于调查在最小化行动学习(MIL)幻灯片级别癌症诊断算法中的人口统计偏差,具体是针对乳腺癌和肺癌亚型分类以及胶质瘤中IDH1突变预测。研究使用了种族分层的ROC AUC(接收者操作特征曲线下面积)、TPR差异(真正例率差异)和独立测试队列上的种族预测来调查差异。
b 部分描述了MIL计算病理学研究中使用的深度学习(DL)管道的不同阶段,包括组织分割和贴片、使用贴片编码器映射到低维表示,以及分类。图中还展示了与公平性相关的技术,包括控制批次效应和测试集偏差、建模选择和偏见缓解策略。
c 和 d 部分介绍了研究中使用的两种常见的偏见缓解策略。c 部分描述了重要性加权(IW),这是一种通过与它们在总人口中的大小成反比地对种族群体中的患者进行采样,以确保公平代表性的方法。d 部分描述了对抗性正则化(AR),这是一种通过使嵌入对种族不可知来缓解偏见的策略。通过最大化辅助种族分类器的损失来实现这一点。
总体而言,Fig. 1 提供了对研究中使用的数据集、评估方法和偏见缓解策略的全面视图,并通过可视化手段展示了不同技术对减少种族间性能差异的潜在影响。