小罗碎碎念
本期文章分享的主要是AI
与肿瘤的复发
、转移
相关的最新研究。
筛选规则如下:
- (artificial intelligence or deep Learning or convolutional networks or transformer or selfattention or machine learning) and (Tumor metastasis or Recurrence of Cancer)
- IF>5
分享规划
一周有七天,周一至周五,每天分享6篇
文章(概述),周六日则会从30篇
文章中挑选与我课题相关的3篇
进行精析。为了方便工科与临床的交流,为大家创造课题合作的机会,我特意建了一个交流群
,欢迎临床与工科的同学入群交流!!
本期分享
文献获取
后台回复4516。
一、《柳叶刀》最新研究·老年女性与子宫内膜癌:为何年龄不应成为治疗的障碍
文献概述
这篇文章是一项发表在《柳叶刀·肿瘤学》(Lancet Oncology
)上的多方法分析研究,探讨了年龄
对子宫内膜癌
女性患者肿瘤学结果的预后影响和因果关系。
研究使用了来自三个大型随机试验
(PORTEC-1、PORTEC-2和PORTEC-3)的1801名
女性的数据分析,包括中风险、高中间风险和高风险子宫内膜癌患者。研究目的是要解决老年女性是否因年龄本身而具有更高的复发风险和癌症相关死亡风险,还是由于随着年龄增长其他风险因素变得更加普遍的问题。
研究方法包括统计分析和因果推断,使用了一种称为AutoCI
的深度学习因果推断模型。研究发现,随着年龄的增长,总体复发和子宫内膜癌特异性死亡的风险显著增加。老年女性更频繁地出现深肌层侵袭
、浆液性肿瘤组织学类型和p53异常肿瘤。年龄被确定为总体复发(风险比[HR]每年1.02,95% CI 1.01–1.04;p=0.0012)和子宫内膜癌特异性死亡(HR每年1.03,1.01–1.05;p=0.0012)的独立风险因素,并且被识别为一个显著的因果变量。
研究的主要发现包括:
- 高龄与更具侵袭性的肿瘤特征的关联
- 年龄与较差结果之间的独立和因果关系
- 不应仅根据年龄将患有子宫内膜癌的老年女性排除在诊断评估和治疗之外
要点总结
- 患有子宫内膜癌的老年女性复发和癌症相关死亡的风险更高。
- 研究旨在确定高龄是否是因果预后因素,或者其他风险因素是否随着年龄的增长而变得更加常见。
- 利用来自三项大型随机试验的数据进行统计分析和因果推断技术。
- 高龄与更具侵袭性的肿瘤特征有关。
- 年龄被确定为较差肿瘤学结局的独立且重要的因果变量。
- 患有子宫内膜癌的老年女性不应仅根据年龄被排除在诊断评估和治疗之外。
二、哈佛医学院·告别切片局限:3D病理如何革新癌症预后
文献概述
这篇文章介绍了一个名为TriPath
的3D病理
深度学习平台,它用于临床终点预测。TriPath
利用弱监督
人工智能(AI)分析3D病理样本,以预测患者的复发风险。
研究发现,与基于2D切片的方法相比,使用3D组织体积进行患者预后可以显著提高性能,因为它能更好地采样异质性组织并提取3D形态特征。
主要亮点包括
- TriPath是一个用于临床终点预测的3D病理深度学习平台。
- 3D组织体积的预后优于2D切片方法。
- 3D预后优于病理医师的基线标准,显示出其临床潜力。
- 更大的组织体积可以减少采样偏差,并考虑到组织的异质性。
- TriPath通过将大型输入组织体积划分为较小的实例集,并将其总结为单一的低维特征向量,从而实现对患者级别临床终点的预测。
- TriPath不依赖于成像方式,可以灵活适应2D和3D分析,以满足不同任务的需求。
通过对前列腺癌
样本的训练,TriPath
展示了其在风险分层模型中的有效性,这些样本通过开放顶部光片显微镜或微型计算机断层扫描成像。TriPath
的性能在不同的3D成像方式和临床基准测试中得到了验证,包括与六位经过认证的泌尿生殖系统病理医师的读片研究比较。
研究表明,3D病理学在临床决策支持中的应用前景广阔,可以作为引导病理医师选择高风险2D截面的工具,或者作为自动化决策支持的完全替代。尽管3D病理学是一个新兴领域,但本文开发的技术和方法支持了其临床转化的可行性,并为未来的研究提供了基础。
文章还讨论了3D病理学在临床实践中的潜在应用,包括开发基于3D病理学的实验室开发测试(LDTs),这些测试将完全无损于宝贵的组织样本。该研究的局限性包括临床队列的大小相对较小,以及需要进一步的大规模验证研究来实现3D病理学的愿景。
文章最后强调了TriPath
作为开发临床可转化的计算3D病理检测方法的关键步骤,并预示着3D生物标志物发现和临床检测开发的新时代。
要点总结
- 由于采样偏差,传统的 2D 组织病理学在表示人体组织的复杂性方面受到限制,因此需要 3D 成像模式。
- TriPath 是一个深度学习平台,可处理组织体积以根据 3D 形态特征预测临床结果,用于临床终点预测。。
- 该平台在患者预后方面优于基于 2D 切片的方法,展示了其临床应用潜力。
- 通过捕获更大的组织体积,TriPath 可减轻采样偏差并考虑组织异质性,从而改善预后性能。
- 该文件强调了从 2D 病理学过渡到 3D 病理学的重要性,以更好地表征组织形态并增强患者诊断、预后和治疗反应预测。
三、吸烟者警惕:你的基因突变可能预示着更高的肿瘤风险!
文献概述
这篇文章是一项关于中国早期非鳞状非小细胞肺癌
(Ns-NSCLC)的多组学
队列研究。研究团队通过对76名
患者的肿瘤样本、配对血液样本和正常肺组织进行全外显子测序
(WES)、RNA测序
和T细胞受体(TCR)测序
,深入分析了这些样本的基因组、转录组和TCR谱。
主要发现包括:
- 平均每个患者样本中识别出
128个
外显子突变,其中最常见的突变基因是EGFR
(55%),其次是TP53
(37%)和TTN
(26%)。 - MUC17、ABCA2、PDE4DIP和MYO18B基因的突变与显著不利的
无病生存期
(DFS)相关。 - 在
复发病例
中突出显示了8q24.3、14q13.1、14q11.2的细胞带扩增和3p21.1的缺失。 - 吸烟者中人类白细胞抗原(HLA)杂合性丧失(LOH)的发生率更高,肿瘤突变负担(TMB)和肿瘤新抗原负担(TNB)也更高。
- HLA-LOH与更高的
TMB
、TNB
、肿瘤内异质性
(ITH)和全染色体不稳定性
(wCIN)评分相关。 ITH
是早期Ns-NSCLC更好的DFS
的一个独立预测因子。- 免疫相关基因的上调,包括CRABP2、ULBP2、IL31RA和IL1A,可能影响肿瘤与免疫系统的交流。
- 通过机器学习(ML)算法评估了
临床
、基因组
、转录组
和TCR谱数据
对DFS
的预测准确性,其中随机森林(RF)算法结合临床和RNA特征,在训练和测试队列中的表现显著优于其他方法。
研究的结论是,这项研究全面分析了中国早期Ns-NSCLC的基因组、转录组和TCR谱,揭示了可能有助于预后发展和个性化治疗策略的生物学基础和候选生物标志物。研究还指出,需要对发现与临床结果之间的关联或因果关系进行前瞻性和跨队列验证,以改善临床实践。
该研究由多个中国研究机构和深圳裕策生物科技有限公司合作完成,并发表在《Translational Lung Cancer Research》期刊上,于2024年4月25日在线发表。
要点总结
- 该研究旨在分析中国早期
Ns-NSCLC
的基因组、转录组学和T细胞受体谱 - 鉴定出与
无病生存期
相关的基因突变、细胞带扩增和缺失 - TCR多样性等免疫相关因素与预后之间的相关性
- 建立了具有良好预测准确性的
多组学
预后模型 - 强调了多维方法在早期
NS-NSCLC
表征中的重要性
四、单细胞研究新突破:SpatialCells软件如何解码癌症的隐秘角落?
文献概述
这篇文章是关于一个名为SpatialCells
的开源软件包的介绍,该软件包旨在对具有空间分辨能力的多重单细胞数据进行区域性探索分析和全面特征化,以研究肿瘤微环境
(TME)。文章由Guihong Wan、Zoltan Maliga、Boshen Yan等人撰写,发表在《Briefings in Bioinformatics
》2024年第25卷第3期上。
癌症是由恶性细胞与肿瘤微环境中的免疫细胞、基质细胞等相互作用形成的复杂细胞生态系统。了解TME的分子、细胞和空间特性对于癌症的治疗和预后至关重要。
最近的空间分辨多重成像技术(如CODEX和CyCIF)使得研究者能够在单细胞分辨率下生成大规模、高维度的生物样本数据集。文献提出的SpatialCells
软件能够自动化提取多重单细胞数据的特征,并处理包含数百万细胞的样本。它支持后续的关联分析和机器学习预测,是推动对肿瘤生长、侵袭和转移理解的重要工具。
功能和特点
- 定义感兴趣区域(ROIs)并进行基于区域的分析。
- 提取肿瘤细胞和肿瘤-免疫细胞相互作用的特性,如
肿瘤增殖指数
、免疫细胞浸润分数
和肿瘤-免疫细胞距离
。 - 支持对整个组织或局部区域进行评估。
数据探索
SpatialCells提供了测量和可视化工具,用于初步了解样本,包括全切片细胞组成、基于区域的细胞组成、基于区域的聚类等。
肿瘤细胞中心分析
专注于肿瘤细胞的特征化,包括肿瘤区域和密度、多变量增殖指数(MPI)和肿瘤隔离指数。
免疫细胞导向分析
研究TME中的细胞组成,进行宏观区域和微观区域分析,以及细胞间的相互作用。
兼容性
SpatialCells基于Anndata、Shapely和Scanpy框架构建,易于与其他常用工具包集成。
要点总结
该文献介绍了SpatialCells
,这是一个开源软件包,旨在使用多重单细胞数据
对肿瘤微环境
(TME)进行基于区域的探索性分析和全面表征。
该研究强调了了解TME
内细胞的空间组织对肿瘤生长、侵袭和转移的重要性。SpatialCells
简化了从多路复用的单细胞数据中自动提取特征的过程,从而实现后续的关联分析和机器学习预测。该工具对于促进我们对癌症进展的理解和改善临床决策至关重要。
- 癌症是一个复杂的细胞生态系统,恶性细胞与
TME
内的免疫细胞、基质细胞和其他细胞相互作用。 - 空间分辨多路复用成像的最新技术进步已经产生了大规模数据集,因此需要自动化方法来表征
TME
。 SpatialCells
旨在分析包含数百万个细胞的组织样本,提取定量特征,并促进关联分析和机器学习预测。- 该工具解决了处理多路复用成像数据的系统计算方法的不足,并为临床应用提供了可扩展的分析。
SpatialCells
集成了临床病理学特征来预测患者的预后,并为数据探索、以肿瘤细胞为中心的分析和面向免疫细胞的分析提供教程。- 该软件可以处理来自各种来源的
空间分辨多路复用数据
,例如 CyCIF、10X Genomics Visium 数据和 4i 数据。
总体而言,SpatialCells
为研究人员和临床医生提供了宝贵的资源,以深入了解肿瘤微环境并改进癌症治疗策略。
五、生存游戏:如何用AI预测结直肠癌肝转移的胜负?
文献概述
这篇文章是一篇关于结直肠癌肝转移
(CRLM)患者预后临床预测模型的全面综述。文章由Stamatios Kokkinakis、Ioannis A. Ziogas、Jose D. Llaque Salazar、Dimitrios P. Moris和Georgios Tsoulfas共同撰写,发表在《Cancers
》期刊上,卷16,编号1645。
文章首先强调了对CRLM患者预后分层的兴趣日益增加,并指出近年来已经开发出许多临床预测模型,这些模型要么依赖于传统统计方法,要么利用了人工智能技术。
文章首先介绍了CRLM的潜在可治愈性,以及对于风险分层和个性化管理路径的重要性。随后,回顾了之前几十年开发的临床预测模型,这些模型使用了传统的Cox回归方法,并讨论了它们的局限性。
本综述提供了一个表格,概述了纳入研究的模型开发特征,如数据收集方式、模型类型、单变量筛选预测因子、结果、患者数量、内部/外部验证、缺失数据处理和风险组;讨论了用于CRLM患者预后的各种短期和长期结果,包括术后并发症、生存率和复发。
此外,该文献还详细列出了模型中包含的不同预测因子,包括患者相关、实验室生物标志物、疾病相关、组织病理学、治疗相关、RAS状态和分子预测因子;总结了研究的特点,包括数据收集方式、使用的统计技术、内部和外部验证方法、处理缺失数据的方法以及风险组的划分;概述了包括研究中开发预测模型的性能,使用AUC值和校准措施来评估;讨论了研究数量的增加、使用传统统计技术的模型、以及在预后CRLM患者时使用临床预测模型的AI模型的缺乏。
结论和未来方向
尽管人工智能在外科肿瘤学的所有方面都很流行,但CRLM患者的预后研究仍然以传统统计技术开发的模型为主。文章建议未来的模型开发研究在选择要包括在模型构建过程中的候选预测因子时,可以参考本综述提供的概览。同时,强调了遵守TRIPOD指南的重要性,以改善预测模型在不同患者设置和人群中的普遍性和可转移性。
要点总结
本文强调了从传统的基于回归的方法到基于人工智能的模型的转变,重点关注各种预测因素和结果,如总生存期 (OS)、无病生存期 (DFS) 和术后并发症。
该文献批判性地评估了模型开发和验证技术,强调了遵循 TRIPOD 等指南进行正确报告的重要性。本文件旨在总结有关 CRLM 患者预后模型的文献,强调预测因子、模型开发、验证技术和模型性能。
- 对结直肠肝转移患者预后分层的兴趣正在增加。
- 使用传统的基于回归的方法和人工智能技术来开发预测模型。
- 考虑各种预测因素和结果,如总生存期、无病生存期和术后并发症。
- 该审查评估了模型开发和验证技术,强调了遵循 TRIPOD 等指南进行正确报告的重要性。
六、MetGen模型·突破癌症研究的‘数据荒’
文献概述
这篇文章介绍了一个名为MetGen
的深度学习模型,它是一个用于生成转移性癌症基因表达文件的工具。转移性癌症是导致癌症相关死亡的主要原因,但获取足够的转录组数据
以研究这一现象面临挑战。MetGen
利用原发性癌症和正常组织样本生成合成的转移性癌症表达特征,旨在克服数据收集的难题。
主要贡献和方法概述如下:
-
MetGen模型:基于
对比学习
的生成模型,能够从原发性癌症和正常组织表达样本生成转移性表达特征。 -
数据预处理:使用MET500数据集和TCGA数据训练MetGen,通过筛选和统一基因集,以及对样本进行标准化处理。
-
MetVAE模型:一个变分自编码器(VAE),用于从MET500样本中提取潜在的转移性癌症代码。
-
对比学习:MetGen网络通过对比学习框架训练,以生成与MET500数据库中相应转移性癌症类型分布一致的潜在代码。
-
模型评估:通过分类器评估生成的样本,并与独立MetVAE生成的样本进行比较,以验证MetGen生成的样本质量。
-
模型解释性:通过对比分析
转移性前列腺癌
和转移性乳腺癌
样本,展示了MetGen
模型的解释性。 -
结果:MetGen生成的样本与真实转移性癌症样本高度相似,且在多种分类测试中表现良好。
-
未来方向:尽管MetGen在生成转移性癌症样本方面取得了进展,但作者指出仍需解决的挑战,例如转移性肿瘤高度依赖微环境,当前模型仅提供一般性环境组织位点信息。
要点总结
该文献介绍了一种新型深度学习模型MetGen
,旨在使用原发性癌症和正常组织数据生成合成转移性癌症表达谱
。
转移,即癌细胞的扩散,是癌症相关死亡的主要原因,由于数据可用性有限,研究转移性癌症带来了挑战。MetGen
旨在通过生成与真实数据相当的样本来解决这个问题,从而在癌症和组织分类方面实现高性能。
该模型优于传统的生成模型,并展示了可解释性,突出了癌症生物学中的相关特征。MetGen
的开发代表了在理解转移性癌症生物学和确定潜在治疗靶点方面的重大进展。
- 尽管医学取得了进步,但转移仍是癌症相关死亡的主要原因
- 开发
MetGen
,一种用于生成转移性癌症表达谱的深度学习模型 - 获取足够的转移性癌症数据的挑战
MetGen
在生成可比样本和分类准确性方面的表现- 模型中对比学习的优势
MetGen
避免了模式坍缩、稳定训练和可解释的潜在空间- 整合原发性癌症信息,进行鉴别分析和可视化