浙大上交联合阿里腾讯,共同构建医学AI领域的顶尖科研+商业团队|个人观点·24-09-17

news2024/9/21 21:45:12

小罗碎碎念

昨晚锻炼时,我想着是时候对推文的内容做一些改进了——既能通过写推文来锻炼自己写paper的能力,也希望凭借自己一点微弱的影响力,去带动更多的人加入医学AI的队伍中

这一期推文系统且深度的分析一下,国内哪些学者在医学AI领域发表过30+以上的文献,看完这篇推文,你大概能清楚什么样的团队才能做出杰出的成果。

同时,无论是保研/考研、申博、博后入站、青椒入职甚至是找工作,这篇推文都会对你们有帮助,可以快速的让你们了解国内医学AI实力较强的团队有哪些。

这期推文还有一个很有意思的点,在作者单位中出现了三家公司,并且有两家直接出现在一作或者通讯的重要位置:

  1. 阿里巴巴(达摩院)
  2. 腾讯(AI实验室)
  3. 赛维森科技

在这里插入图片描述


推文目录

  • 一、团队分析
  • 二、课题方向
  • 三、未来趋势
  • 四、医学AI公司

一、团队分析

1-1:作者数量

今天选取的四篇文章中,除了中山大学Tianxin Lin团队发表的Nat Med全部是国内作者,其余三篇均属于跨国合作的课题。

Tianxin Lin这篇文献也很有意思,虽然不和国外合作,但是他和公司合作(赛维森,广州,广东),稍后我也会做一个详细分析。

image-20240917103307481

我们再来看一下这四篇文章的作者总数,最少的19个,最多的达到35个。


1-2:作者单位

由于四篇文献的一作和通讯数量太多了,所以我放在两张图展示。

(做标记的代表国内通讯)

除了第一篇文献是和哈佛共同通讯以外,其余的三篇文献都是国内的通讯。

(做标记的代表国内通讯)


1-3:通讯背景

既然已经写到这了,不如我们再深度挖一挖通讯作者们的背景。

image-20240917114755613

列这张表主要有两个目的:

  1. 激励与小罗一样的青年学者,向领域内优秀的人看齐,争取未来再上一个平台。
  2. 提醒那些身处头部单位,但是觉得医学AI没有未来的前辈们,不妨和自己身边同层次的人多交流一下,也许态度会有改观。时代从未被某一项技术取代,后来者居上的,一直都是掌握新技术的同行。

二、课题方向

无论我们身处哪一个研究领域,有一问题经常听到或者被问到——这个领域未来的发展趋势是什么?有一个言论经常被谈及——(无论方向是否新颖)这个方向都被做烂了,没有什么好做的了,别卷了

我们可以通过这四篇顶刊,结合发表时间、数据量以及解决的临床问题,来看看当前的一个趋势

image-20240917132642560

首先是数据量,即便面向的临床问题不一样,但是肉眼可见的数据量增长。这是一个好消息,为什么呢?因为数据量不可能无限增长,最后要落实到临床的话,我们更加关注的是小数据量如何取得同样好的效果

现在再来看看临床问题,Nature的那篇文章,属于一个基础模型,所以收集的数据量很大,衔接的下游任务也很多,例如:

  1. 预测肿瘤起源
  2. 预测癌症样本的基因突变状态、IDH状态和MSI状态

例如识别肿瘤区域


2024年的那篇Nat Med和2023年的那篇Lancet Oncology,其实研究的临床问题最后都可以归为一个点——肿瘤的转移——一个是研究未知原发部位(转移了才会谈原发)的肿瘤起源,一个是研究肿瘤淋巴结的转移。

肿瘤在人体器官内的转移示意图


2023年上交和达摩院发表的那篇Nat Med,当时引起了很大的关注,我在和其他人交流时也多次提到过这篇文章。

某个课题组请我过去交流时准备的PPT

在上图的右侧,我解释了PANDA模型的命名缘由,左侧则是大致介绍了一下模型的三个阶段:胰腺定位、病变检测和病变亚型分类。

这个模型挺有意思的,训练阶段采用了监督学习,使用的数据是对比增强的CT,并且还用WSI来辅助打标签,提升模型在胰腺定位方面的效能。

为什么要这样做呢?原因很简单,日常的检测中,非对比增强的数据更多(患者更容易采用这种方式),但是效果没有对比增强CT的数据好,所以试图降低医学检测的门槛。

百度健康:CT平扫没问题还要做增强吗?


三、未来趋势

前面做了很多铺垫,现在来说说大家关心的问题——病理AI未来的发展趋势是什么?

2024年9月11日,JCO发了一篇EDITORIALS,探讨了一个问题——病理AI是精准医学的未来吗?

https://ascopubs.org/doi/10.1200/JCO-24-01271

答案是肯定的,所以掌握了病理AI的发展趋势,也就掌握了精准医疗的发展趋势。


3-1:具体的方向

这几天偶尔会有两三个博士和我吐槽,总结一下就是,我一篇推文让他们中秋和国庆都没有了(没办法,重大专项10.14开始提交系统)。

无论是他们写这次的重大专项标书,又或者明年三月的国自然标书,亟需解决的问题都是不可避免的。

https://www.nature.com/articles/s44222-023-00096-8


3-2:数据

  1. 多机构(Multi-institutional):
    • 指的是数据来源于不同的医疗机构和研究中心。这种多样性有助于提高研究结果的普适性和可靠性,因为它减少了单一数据源可能带来的偏差。
  2. 合成(Synthetic):
    • 合成数据是通过模拟或算法生成的数据,用于补充真实数据集。在病理学中,合成数据可以用来增强模型的泛化能力,尤其是在某些罕见疾病或条件的数据难以获得时。
  3. 种族、年龄、性别(Ethnicity, age, gender):
    • 强调在数据收集和策划过程中考虑这些因素的重要性,以确保数据集能够反映不同人群的特征,从而提高研究的公平性和普适性。
  4. 案例检索(Case retrieval):
    • 指的是能够从大量数据中检索特定病例的能力。这对于病理学家和研究人员来说是一个重要的工具,可以帮助他们找到具有特定特征或条件的病例进行研究。
  5. 电子医疗记录(Electronic medical records, EHR):
    • 电子医疗记录包含了患者的详细医疗历史和相关信息,如诊断、治疗、实验室测试结果等。这些数据可以与病理图像结合使用,以提供更全面的疾病分析。
  6. 多重成像(Multiplex imaging):
    • 多重成像技术可以在单个组织样本中同时检测多个生物标志物。这种技术可以提供关于肿瘤微环境复杂性的详细信息,有助于病理诊断和生物标志物的发现。
  7. 三维/纵向病理学(3D/longitudinal pathology):
    • 三维病理学涉及对组织样本进行三维重建和分析,而纵向病理学则关注疾病随时间的发展。这些方法可以提供更深入的组织结构和疾病进程的理解。

这些数据来源和类型的结合使用,可以极大地推动计算病理学在疾病诊断、预后预测、生物标志物发现和药物开发等方面的研究和应用。


3-3:特征提取

  1. 下一代卷积神经网络(Next-generation CNNs):

    • 指的是对传统卷积神经网络(CNNs)的改进或新型设计,以提高模型的性能和效率。这些新一代的CNN可能包括更深的网络结构、更复杂的连接模式(如残差连接)、或者专门针对图像识别和处理任务优化的新型层。
  2. 视觉变换器(Vision transformers):

    • 视觉变换器是受自然语言处理中变换器模型启发的神经网络架构。它们使用自注意力机制来处理图像,能够捕捉图像内长距离依赖关系。这种架构在处理图像分类、对象检测和语义分割等任务中显示出了巨大潜力。
  3. 自监督学习(Self-supervised learning, SSL):

    • 自监督学习是一种训练策略,它不依赖于标注数据,而是利用数据本身的结构来生成训练信号。在病理学图像分析中,SSL可以通过各种方式实现,例如通过图像的增强、图像的不同部分之间的预测任务,或者通过学习图像的高级特征表示。

3-4:特征描述

  1. 上下文感知(Context aware):

    • 指的是模型能够理解和利用图像中的空间关系和上下文信息。在病理学中,这意味着模型不仅识别单个细胞或组织的特征,还能理解它们在组织中的位置和相互关系。
  2. 层次化(Hierarchical):

    • 层次化模型能够处理不同尺度的图像信息,从像素级别到整个组织切片。这种模型通常包含多个处理层次,每个层次关注不同级别的特征,从而能够捕捉从局部细节到整体模式的信息。
  3. 可解释和可解释的(Interpretable and explainable):

    • 可解释性是指模型的决策过程和结果能够被人类理解和解释。在病理学中,这尤其重要,因为医生和研究人员需要理解模型是如何做出诊断或预测的,以便信任和验证其结果。
  4. 先验知识整合(Prior knowledge incorporation):

    • 指的是在模型设计和训练过程中整合病理学和医学领域的先验知识。这可以帮助模型更好地理解和解释数据,提高模型的准确性和可靠性。
  5. 对领域变化的鲁棒性(Robust to domain shifts):

    • 指的是模型能够在不同的数据分布和环境条件下保持性能,即使在面对与训练数据不同的新数据时也能做出准确的预测。在病理学中,这可能涉及到处理不同医院、不同设备或不同病理技术产生的图像。

3-5:预测器

  1. 下一代图神经网络(Next-generation GNNs):

    • 图神经网络(GNNs)是专门设计来处理图结构数据的神经网络,非常适合于建模细胞之间复杂的相互作用和组织结构。
    • 下一代GNNs可能会包括更高效的图卷积方法、更好的处理大规模图的算法,或者更高级的图注意力机制。
  2. 可扩展的变换器(Scalable transformers):

    • 变换器模型,尤其是自注意力机制,已经在自然语言处理领域取得了巨大成功。
    • 在病理学图像分析中,可扩展的变换器可以处理更大的图像数据集,并且能够捕捉图像内部的长距离依赖关系。
  3. 新的聚合方案(New aggregation schemes):

    • 在处理诸如全切片图像这样的大规模数据时,需要有效的聚合策略来整合局部特征并生成全局表示。
    • 新的聚合方案可能包括更复杂的池化操作、注意力加权的聚合,或者基于图的聚合方法,以更好地捕捉局部特征和整体上下文。
  4. 端到端学习与特征提取器(End-to-end learning with feature extractor):

    • 端到端学习是指从输入数据直接到最终预测结果的整个处理流程在一个统一的模型中完成。在计算病理学中,这意味着模型将包括一个特征提取器(如CNN或GNN),它能够从病理图像中提取有用的特征,然后这些特征被用于训练一个分类器或预测器。
    • 这种策略的优势在于可以自动化整个特征工程和模型训练过程,减少手动调整和优化的需要,同时保持模型的灵活性和适应性。

3-6:临床结局

  1. 治疗反应(Treatment response):

    • 利用病理图像来预测患者对特定治疗的反应。
    • 这可能包括评估肿瘤对化疗、放疗、免疫疗法或其他治疗方式的敏感性。
  2. 药物发现(Drug discovery):

    • 通过分析病理数据来识别新的药物靶点或生物标志物,加速药物的开发过程。
    • 这涉及到从组织样本中识别出与疾病相关的特定生物途径或蛋白质。
  3. 生物标志物发现(Biomarker discovery):

    • 识别可以从病理图像中提取的生物标志物,这些标志物可以用于疾病的早期诊断、预后评估或治疗反应监测。
  4. 生存预测(Survival prediction):

    • 预测患者的生存率和生存时间,这通常涉及到分析病理图像中的各种特征,如肿瘤大小、细胞形态、组织结构等,以及它们与患者生存结果之间的关系。
  5. 病理概念的定量分析(Quantitative analysis of pathology concepts):

    • 指的是使用定量方法来分析和解释病理图像中的特定特征,如细胞大小、形状、染色强度等。这种分析可以帮助病理学家和研究人员更好地理解图像特征与疾病状态之间的关系。

四、医学AI公司

这一部分总共分析三家公司,前两家公司的部分产品,我们每天都会接触。

4-1:阿里巴巴(达摩院)

官网:https://damo.alibaba.com/?language=zh

在官网的研究布局板块,我们可以看到医疗AI这一板块。

image-20240917162714542

技术方向包括基于深度学习的医学图像分割、检测与分类、医学图像配准计算机视觉医学应用、医疗数据挖掘分析等。研究内容涉及多种高发肿瘤和重大慢性疾病以及神经性退化性疾病的AI智能筛查、精准诊断、治疗方案预后优化,病人跟踪随访等生命全流程的医疗人工智能技术和临床解决方案研发。

在Nature Medicine, Nature Communications, Annals of Surgery, Radiology, Briefings Bioinform, Clinical Cancer Research, IEEE TMI, MedIA等顶级临床期刊和技术期刊上发表多篇有影响力的论文;

截至目前,医疗AI产品已成功对接落地30家以上的国内外顶级医疗影像合作伙伴,构建智能医疗健康生态,落地医疗机构数达1000+家,近两年已经为全球2600+万病人次提供智能化医疗健康服务。


与医学相关最新资讯

通过简单的检索,我们会发现达摩院目前与医学AI相关的资讯暂时还都停留在我们前面介绍的Nat Med。

image-20240917163109671

有一点我是可以肯定的,那就是他们还在持续收纳人才,研发新的模型,因为他们团队有人在我的交流群内发过宣传资料。

PS:21世纪,是属于高端交叉学科人才的世纪,加油吧各位。


4-2:腾讯(AI实验室)

官网:https://ai.tencent.com/ailab/zh/index

初步翻阅了一下官网,腾讯只是在关于板块,一笔带过了医疗AI部分的内容,感觉没有阿里那么重视。

image-20240917170116755

或者说,阿里和腾讯的侧重点不一样,后者可能更重视基础医学的研究?

image-20240917170324923

但是,腾讯这么大体量的公司,怎么可能放过医学AI这个风口。

https://baijiahao.baidu.com/s?id=1809357519546543396&wfr=spider&for=pc

其实不止腾讯,还有传统医疗器械的龙头企业迈瑞,早在2015年就开始布局。

https://www.nbd.com.cn/articles/2024-09-11/3553971.html


腾讯健康

今天不写这篇推文,我是真不知道腾讯在医学AI方面已经走了这么远了。

https://healthcare.tencent.com/

腾讯觅影·数智医疗影像平台(Tencent Aimis Medical Imaging Platform of Digital Intelligence) 依托腾讯云存储和技术能力,致力于将数字医疗影像数据进行云端管理和应用。同时,在云端搭载人工智能分析能力,为医学影像、医学检验的客户提供产、学、研、管一体化的解决方案,将智慧医疗、降本增效触达更多客户。

img

腾讯觅影·数智医疗影像平台由觅影影像云提供多模态医学影像云端存储和应用,并面向患者提供云胶片服务。针对有科研诉求的企业、院校,通过开放实验平台的算力、资源开展AI模型训练,并最终实现将成熟AI应用于临床场景的目标。

同时,可将开放实验平台的实验数据用于临床示教实训体系,以提升临床人员的实操技能。目前,青光眼AI、肺炎AI已获得国家药品监督管理局颁发的III类医疗器械注册许可证,并开放被觅影影像云调阅。

img

腾讯觅影数字病理解决方案基于腾讯云的一体化服务,支持病理切片扫描后的存储、分析、检索等功能,全面提升 病理科运营效率和经济效益。

image-20240917171511842


4-3:赛维森科技

官网:https://www.cellsvision.com/#product

不知道陈董会不会看到这篇推文,我建议和阿里以及腾讯对标一下,也搞一个视频,宣传一下公司理念,介绍一下核心技术,这样比我直接标黄更容易给客户留下印象。

image-20240917172310369


产品介绍

这一部分我只分析病理相关的——组织学辅助诊断。

  1. 宫颈活检辅助诊断模块

  2. 胃活检辅助诊断模块

  3. 膀胱癌淋巴转移辅助诊断模块(对应前文分析的那篇Nat Med)

  4. 免疫组化定量分析模块


在快要退出官网的时候,我差点遗漏了下面这个信息。

image-20240917173627177

本来想体验一下,但是并没有提供病理图像的处理软件,另外我单纯从一个顾客的角度去看待这个网页设计,总觉得有点在妨碍我了解他们的产品,希望后续采集一批意见,集中优化一下吧。


这期推文就到这里了,断断续续写了很久,总算是写完了,我们下期见!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2142678.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux基础开发环境(git的使用)

1.账号注册 git 只是一个工具,要想实现便捷的代码管理,就需要借助第三方平台进行操作,当然第三平台也是基于git 开发的 github 与 gitee 代码托管平台有很多,这里我们首选 Github ,理由很简单,全球开发者…

算法题之回文子串

回文子串 给你一个字符串 s ,请你统计并返回这个字符串中 回文子串 的数目。 回文字符串 是正着读和倒过来读一样的字符串。 子字符串 是字符串中的由连续字符组成的一个序列。 示例 1: 输入:s "abc" 输出:3 解释…

C++ 带约束的Ceres形状拟合

C 带约束的Ceres形状拟合 一、Ceres Solver1.定义问题2. 添加残差AddResidualBlockAutoDiffCostFunction 3. 配置求解器4. 求解5. 检查结果 二、基于Ceres的最佳拟合残差结构体拟合主函数 三、带约束的Ceres拟合残差设计拟合区间限定 四、拟合结果bestminmax 五、完整代码 对Ce…

RocksDB系列一:基本概念

0 引言 RocksDB 是 Facebook 基于 Google 的 LevelDB 代码库于 2012 年创建的高性能持久化键值存储引擎。它针对 SSD 的特定特性进行了优化,目标是大规模(分布式)应用,并被设计为嵌入在更高层次应用中的库组件。RocksDB应用范围很…

【Python百日进阶-Web开发-音频】Day711 - 光谱表示 librosa.stft 短时傅里叶变换

文章目录 一、光谱表示 Spectral representations1.1 librosa.stft1.1.1 语法与参数1.1.2 示例 一、光谱表示 Spectral representations 1.1 librosa.stft https://librosa.org/doc/latest/generated/librosa.stft.html 1.1.1 语法与参数 librosa.stft(y, *, n_fft2048, ho…

智能机巢+无人机:自动化巡检技术详解

智能机巢与无人机的结合,在自动化巡检领域展现出了巨大的潜力和优势。以下是对这一技术的详细解析: 一、智能机巢概述 智能机巢,也被称为无人机机场或无人机机巢,是专门为无人机提供停靠、充电、维护等服务的智能化设施。它不仅…

加密与安全_优雅存储二要素(AES-256-GCM )

文章目录 什么是二要素如何保护二要素(姓名和身份证)加密算法分类场景选择算法选择AES - ECB 模式 (不推荐)AES - CBC 模式 (推荐)GCM(Galois/Counter Mode)AES-256-GCM简介AES-256-GCM工作原理安全优势 应用场景其他模式 和 敏感…

LeetcodeTop100 刷题总结(一)

LeetCode 热题 100:https://leetcode.cn/studyplan/top-100-liked/ 文章目录 一、哈希1. 两数之和49. 字母异位词分组128. 最长连续序列 二、双指针283. 移动零11. 盛水最多的容器15. 三数之和42. 接雨水(待完成) 三、滑动窗口3. 无重复字符的…

TCADE--基于迁移成分分析和差分进化的多目标多任务优化

TCADE–基于迁移成分分析和差分进化的多目标多任务优化 title: Multitasking multiobjective optimization based on transfer component analysis author: Ziyu Hua, Yulin Li, Hao Sun, Xuemin Ma. journal: Information Sciences (Ins)…

最优化理论与自动驾驶(十):纯跟踪算法原理、公式及代码演示

纯跟踪算法(Pure Pursuit Algorithm)是一种用于路径跟踪的几何控制算法,广泛应用于自动驾驶、机器人导航等领域。其基本思想是通过选择预定路径上的目标点(预瞄点),并控制转向角,使车辆不断逼近…

用于稀疏自适应深度细化的掩码空间传播网络 CVPR2024

目录 Masked Spatial Propagation Network for Sparsity-Adaptive Depth Refinement (CVPR 2024)用于稀疏自适应深度细化的掩码空间传播网络1 介绍2 算法流程2.1 问题建模2.2 Guidance Network2.3 MSPN 模块 3 实验结果3.1 稀疏度自适应深度细化对比试验…

COMDEL电源CX2500S RF13.56MHZ RF GENERATOR手侧

COMDEL电源CX2500S RF13.56MHZ RF GENERATOR手侧

如何让虚拟机的服务被主机访问

当我们在虚拟机上写了一个服务器,在宿主机访问时,出现无法访问的情况。这可能是虚拟机网络的设置问题。 查看虚拟机防火墙是否关闭 在终端输入: systemctl status firewalld 如果是active就说明防火墙是开启的,需要关闭。 输入…

高级I/O知识分享【epoll || Reactor ET,LT模式】

博客主页:花果山~程序猿-CSDN博客 文章分栏:Linux_花果山~程序猿的博客-CSDN博客 关注我一起学习,一起进步,一起探索编程的无限可能吧!让我们一起努力,一起成长! 目录 一,接口 epo…

SpringBoot 消息队列RabbitMQ 消息可靠性 数据持久化 与 LazyQueue

介绍 在默认情况下,RabbitMQ会将接收到的信息保存在内存中以降低消息收发的延迟 一旦MO宕机,内存中的消息会丢失内存空间有限,当消费者故障或处理过慢时,会导致消息积压,引发MQ阻塞 在消息队列运行的过程中&#xf…

LeetCode 815.公交路线(BFS广搜 + 建图)(中秋快乐啊)

给你一个数组 routes ,表示一系列公交线路,其中每个 routes[i] 表示一条公交线路,第 i 辆公交车将会在上面循环行驶。 例如,路线 routes[0] [1, 5, 7] 表示第 0 辆公交车会一直按序列 1 -> 5 -> 7 -> 1 -> 5 -> …

物理感知扩散的 3D 分子生成模型 - PIDiff 评测

PIDiff 是一个针对蛋白质口袋特异性的、物理感知扩散的 3D 分子生成模型,通过考虑蛋白质-配体结合的物理化学原理来生成分子,在原理上,生成的分子可以实现蛋白-小分子的自由能最小。 一、背景介绍 PIDiff 来源于延世大学计算机科学系的 Sang…

vue2基础系列教程之v-model及面试高频问题

v-model是表单组件里面的核心知识点&#xff0c;这个指令给我们写表单业务带来了很大的方便。 元素标签上的 v-model 指令用于双向绑定数据,它是一个语法糖&#xff0c;可以用于代替 v-bind:value 和 input 例如&#xff1a;<input v-model"message" placeholder…

VTD激光雷达(6)——06_OptiX_Variables

文章目录 前言一、总结 前言 感谢VTD官方学习资料 一、 1、 总结 学海无涯回头是岸

curl格式化json之jq工具?

jq 是一个轻量级的命令行工具&#xff0c;用于解析、操作和格式化 JSON 数据。它类似于 sed 或 awk&#xff0c;但专门用于处理 JSON 格式。使用 jq&#xff0c;你可以从复杂的 JSON 数据中提取所需的信息&#xff0c;格式化输出&#xff0c;进行数据筛选&#xff0c;甚至修改 …