浙大上交联合阿里腾讯，共同构建医学AI领域的顶尖科研+商业团队

小罗碎碎念

昨晚锻炼时，我想着是时候对推文的内容做一些改进了——既能通过写推文来锻炼自己写paper的能力，也希望凭借自己一点微弱的影响力，去带动更多的人加入医学AI的队伍中。

这一期推文系统且深度的分析一下，国内哪些学者在医学AI领域发表过30+以上的文献，看完这篇推文，你大概能清楚什么样的团队才能做出杰出的成果。

同时，无论是保研/考研、申博、博后入站、青椒入职甚至是找工作，这篇推文都会对你们有帮助，可以快速的让你们了解国内医学AI实力较强的团队有哪些。

这期推文还有一个很有意思的点，在作者单位中出现了三家公司，并且有两家直接出现在一作或者通讯的重要位置：

阿里巴巴（达摩院）
腾讯（AI实验室）
赛维森科技

在这里插入图片描述

推文目录

一、团队分析
二、课题方向
三、未来趋势
四、医学AI公司

一、团队分析

1-1：作者数量

今天选取的四篇文章中，除了中山大学Tianxin Lin团队发表的Nat Med全部是国内作者，其余三篇均属于跨国合作的课题。

Tianxin Lin这篇文献也很有意思，虽然不和国外合作，但是他和公司合作（赛维森，广州，广东），稍后我也会做一个详细分析。

我们再来看一下这四篇文章的作者总数，最少的19个，最多的达到35个。

1-2：作者单位

由于四篇文献的一作和通讯数量太多了，所以我放在两张图展示。

（做标记的代表国内通讯）

除了第一篇文献是和哈佛共同通讯以外，其余的三篇文献都是国内的通讯。

（做标记的代表国内通讯）

1-3：通讯背景

既然已经写到这了，不如我们再深度挖一挖通讯作者们的背景。

列这张表主要有两个目的：

激励与小罗一样的青年学者，向领域内优秀的人看齐，争取未来再上一个平台。
提醒那些身处头部单位，但是觉得医学AI没有未来的前辈们，不妨和自己身边同层次的人多交流一下，也许态度会有改观。时代从未被某一项技术取代，后来者居上的，一直都是掌握新技术的同行。

二、课题方向

无论我们身处哪一个研究领域，有一问题经常听到或者被问到——这个领域未来的发展趋势是什么？有一个言论经常被谈及——（无论方向是否新颖）这个方向都被做烂了，没有什么好做的了，别卷了。

我们可以通过这四篇顶刊，结合发表时间、数据量以及解决的临床问题，来看看当前的一个趋势。

首先是数据量，即便面向的临床问题不一样，但是肉眼可见的数据量增长。这是一个好消息，为什么呢？因为数据量不可能无限增长，最后要落实到临床的话，我们更加关注的是小数据量如何取得同样好的效果。

现在再来看看临床问题，Nature的那篇文章，属于一个基础模型，所以收集的数据量很大，衔接的下游任务也很多，例如：

预测肿瘤起源
预测癌症样本的基因突变状态、IDH状态和MSI状态

例如识别肿瘤区域

2024年的那篇Nat Med和2023年的那篇Lancet Oncology，其实研究的临床问题最后都可以归为一个点——肿瘤的转移——一个是研究未知原发部位（转移了才会谈原发）的肿瘤起源，一个是研究肿瘤淋巴结的转移。

肿瘤在人体器官内的转移示意图

2023年上交和达摩院发表的那篇Nat Med，当时引起了很大的关注，我在和其他人交流时也多次提到过这篇文章。

某个课题组请我过去交流时准备的PPT

在上图的右侧，我解释了PANDA模型的命名缘由，左侧则是大致介绍了一下模型的三个阶段：胰腺定位、病变检测和病变亚型分类。

这个模型挺有意思的，训练阶段采用了监督学习，使用的数据是对比增强的CT，并且还用WSI来辅助打标签，提升模型在胰腺定位方面的效能。

为什么要这样做呢？原因很简单，日常的检测中，非对比增强的数据更多（患者更容易采用这种方式），但是效果没有对比增强CT的数据好，所以试图降低医学检测的门槛。

百度健康：CT平扫没问题还要做增强吗？

三、未来趋势

前面做了很多铺垫，现在来说说大家关心的问题——病理AI未来的发展趋势是什么？

2024年9月11日，JCO发了一篇EDITORIALS，探讨了一个问题——病理AI是精准医学的未来吗？

答案是肯定的，所以掌握了病理AI的发展趋势，也就掌握了精准医疗的发展趋势。

3-1：具体的方向

这几天偶尔会有两三个博士和我吐槽，总结一下就是，我一篇推文让他们中秋和国庆都没有了（没办法，重大专项10.14开始提交系统）。

无论是他们写这次的重大专项标书，又或者明年三月的国自然标书，亟需解决的问题都是不可避免的。

3-2：数据

多机构（Multi-institutional）:
- 指的是数据来源于不同的医疗机构和研究中心。这种多样性有助于提高研究结果的普适性和可靠性，因为它减少了单一数据源可能带来的偏差。
合成（Synthetic）:
- 合成数据是通过模拟或算法生成的数据，用于补充真实数据集。在病理学中，合成数据可以用来增强模型的泛化能力，尤其是在某些罕见疾病或条件的数据难以获得时。
种族、年龄、性别（Ethnicity, age, gender）:
- 强调在数据收集和策划过程中考虑这些因素的重要性，以确保数据集能够反映不同人群的特征，从而提高研究的公平性和普适性。
案例检索（Case retrieval）:
- 指的是能够从大量数据中检索特定病例的能力。这对于病理学家和研究人员来说是一个重要的工具，可以帮助他们找到具有特定特征或条件的病例进行研究。
电子医疗记录（Electronic medical records, EHR）:
- 电子医疗记录包含了患者的详细医疗历史和相关信息，如诊断、治疗、实验室测试结果等。这些数据可以与病理图像结合使用，以提供更全面的疾病分析。
多重成像（Multiplex imaging）:
- 多重成像技术可以在单个组织样本中同时检测多个生物标志物。这种技术可以提供关于肿瘤微环境复杂性的详细信息，有助于病理诊断和生物标志物的发现。
三维/纵向病理学（3D/longitudinal pathology）:
- 三维病理学涉及对组织样本进行三维重建和分析，而纵向病理学则关注疾病随时间的发展。这些方法可以提供更深入的组织结构和疾病进程的理解。

这些数据来源和类型的结合使用，可以极大地推动计算病理学在疾病诊断、预后预测、生物标志物发现和药物开发等方面的研究和应用。

3-3：特征提取

下一代卷积神经网络（Next-generation CNNs）:
- 指的是对传统卷积神经网络（CNNs）的改进或新型设计，以提高模型的性能和效率。这些新一代的CNN可能包括更深的网络结构、更复杂的连接模式（如残差连接）、或者专门针对图像识别和处理任务优化的新型层。
视觉变换器（Vision transformers）:
- 视觉变换器是受自然语言处理中变换器模型启发的神经网络架构。它们使用自注意力机制来处理图像，能够捕捉图像内长距离依赖关系。这种架构在处理图像分类、对象检测和语义分割等任务中显示出了巨大潜力。
自监督学习（Self-supervised learning, SSL）:
- 自监督学习是一种训练策略，它不依赖于标注数据，而是利用数据本身的结构来生成训练信号。在病理学图像分析中，SSL可以通过各种方式实现，例如通过图像的增强、图像的不同部分之间的预测任务，或者通过学习图像的高级特征表示。

3-4：特征描述

上下文感知（Context aware）:
- 指的是模型能够理解和利用图像中的空间关系和上下文信息。在病理学中，这意味着模型不仅识别单个细胞或组织的特征，还能理解它们在组织中的位置和相互关系。
层次化（Hierarchical）:
- 层次化模型能够处理不同尺度的图像信息，从像素级别到整个组织切片。这种模型通常包含多个处理层次，每个层次关注不同级别的特征，从而能够捕捉从局部细节到整体模式的信息。
可解释和可解释的（Interpretable and explainable）:
- 可解释性是指模型的决策过程和结果能够被人类理解和解释。在病理学中，这尤其重要，因为医生和研究人员需要理解模型是如何做出诊断或预测的，以便信任和验证其结果。
先验知识整合（Prior knowledge incorporation）:
- 指的是在模型设计和训练过程中整合病理学和医学领域的先验知识。这可以帮助模型更好地理解和解释数据，提高模型的准确性和可靠性。
对领域变化的鲁棒性（Robust to domain shifts）:
- 指的是模型能够在不同的数据分布和环境条件下保持性能，即使在面对与训练数据不同的新数据时也能做出准确的预测。在病理学中，这可能涉及到处理不同医院、不同设备或不同病理技术产生的图像。

3-5：预测器

下一代图神经网络（Next-generation GNNs）:
- 图神经网络（GNNs）是专门设计来处理图结构数据的神经网络，非常适合于建模细胞之间复杂的相互作用和组织结构。
- 下一代GNNs可能会包括更高效的图卷积方法、更好的处理大规模图的算法，或者更高级的图注意力机制。
可扩展的变换器（Scalable transformers）:
- 变换器模型，尤其是自注意力机制，已经在自然语言处理领域取得了巨大成功。
- 在病理学图像分析中，可扩展的变换器可以处理更大的图像数据集，并且能够捕捉图像内部的长距离依赖关系。
新的聚合方案（New aggregation schemes）:
- 在处理诸如全切片图像这样的大规模数据时，需要有效的聚合策略来整合局部特征并生成全局表示。
- 新的聚合方案可能包括更复杂的池化操作、注意力加权的聚合，或者基于图的聚合方法，以更好地捕捉局部特征和整体上下文。
端到端学习与特征提取器（End-to-end learning with feature extractor）:
- 端到端学习是指从输入数据直接到最终预测结果的整个处理流程在一个统一的模型中完成。在计算病理学中，这意味着模型将包括一个特征提取器（如CNN或GNN），它能够从病理图像中提取有用的特征，然后这些特征被用于训练一个分类器或预测器。
- 这种策略的优势在于可以自动化整个特征工程和模型训练过程，减少手动调整和优化的需要，同时保持模型的灵活性和适应性。

3-6：临床结局

治疗反应（Treatment response）:
- 利用病理图像来预测患者对特定治疗的反应。
- 这可能包括评估肿瘤对化疗、放疗、免疫疗法或其他治疗方式的敏感性。
药物发现（Drug discovery）:
- 通过分析病理数据来识别新的药物靶点或生物标志物，加速药物的开发过程。
- 这涉及到从组织样本中识别出与疾病相关的特定生物途径或蛋白质。
生物标志物发现（Biomarker discovery）:
- 识别可以从病理图像中提取的生物标志物，这些标志物可以用于疾病的早期诊断、预后评估或治疗反应监测。
生存预测（Survival prediction）:
- 预测患者的生存率和生存时间，这通常涉及到分析病理图像中的各种特征，如肿瘤大小、细胞形态、组织结构等，以及它们与患者生存结果之间的关系。
病理概念的定量分析（Quantitative analysis of pathology concepts）:
- 指的是使用定量方法来分析和解释病理图像中的特定特征，如细胞大小、形状、染色强度等。这种分析可以帮助病理学家和研究人员更好地理解图像特征与疾病状态之间的关系。

四、医学AI公司

这一部分总共分析三家公司，前两家公司的部分产品，我们每天都会接触。

4-1：阿里巴巴（达摩院）

官网：https://damo.alibaba.com/?language=zh

在官网的研究布局板块，我们可以看到医疗AI这一板块。

技术方向包括基于深度学习的医学图像分割、检测与分类、医学图像配准计算机视觉医学应用、医疗数据挖掘分析等。研究内容涉及多种高发肿瘤和重大慢性疾病以及神经性退化性疾病的AI智能筛查、精准诊断、治疗方案预后优化，病人跟踪随访等生命全流程的医疗人工智能技术和临床解决方案研发。

在Nature Medicine, Nature Communications, Annals of Surgery, Radiology, Briefings Bioinform, Clinical Cancer Research, IEEE TMI, MedIA等顶级临床期刊和技术期刊上发表多篇有影响力的论文；

截至目前，医疗AI产品已成功对接落地30家以上的国内外顶级医疗影像合作伙伴，构建智能医疗健康生态，落地医疗机构数达1000+家，近两年已经为全球2600+万病人次提供智能化医疗健康服务。

与医学相关最新资讯

通过简单的检索，我们会发现达摩院目前与医学AI相关的资讯暂时还都停留在我们前面介绍的Nat Med。

有一点我是可以肯定的，那就是他们还在持续收纳人才，研发新的模型，因为他们团队有人在我的交流群内发过宣传资料。

PS：21世纪，是属于高端交叉学科人才的世纪，加油吧各位。

4-2：腾讯（AI实验室）

官网：https://ai.tencent.com/ailab/zh/index

初步翻阅了一下官网，腾讯只是在关于板块，一笔带过了医疗AI部分的内容，感觉没有阿里那么重视。

或者说，阿里和腾讯的侧重点不一样，后者可能更重视基础医学的研究？

但是，腾讯这么大体量的公司，怎么可能放过医学AI这个风口。

其实不止腾讯，还有传统医疗器械的龙头企业迈瑞，早在2015年就开始布局。

腾讯健康

今天不写这篇推文，我是真不知道腾讯在医学AI方面已经走了这么远了。

腾讯觅影·数智医疗影像平台(Tencent Aimis Medical Imaging Platform of Digital Intelligence) 依托腾讯云存储和技术能力，致力于将数字医疗影像数据进行云端管理和应用。同时，在云端搭载人工智能分析能力，为医学影像、医学检验的客户提供产、学、研、管一体化的解决方案，将智慧医疗、降本增效触达更多客户。