(Research)深度迁移学习使循环肿瘤细胞的病变追踪成为可能

news2024/9/25 15:27:44

Tips:
深度迁移学习使循环肿瘤细胞的病变追踪成为可能
(Nat Commun),原文链接: https://pubmed.ncbi.nlm.nih.gov/36509761/
摘要:
CTC做为液体活检中最重要的一个目标,如果能够对 CTC 进行溯源那么就能够实现肿瘤的早期的精准筛查。单细胞测序技术,作为目前最强大的细胞表征鉴定技术,如果能够和 CTC 进行结合,那么就能够实现CTC 溯源。本文基于回顾性研究设计了一种 CTC-Tracer的深度学习模型,实现了对 CTC 进行精准分类,使得肿瘤早期筛查和诊断成为了可能。

CTC 和 CTC-Tracer

CTC 导读

循环肿瘤细胞 (CTC) 是从原发肿瘤和/或转移性病灶中分离出来的细胞,是肿瘤的转移性前体细胞。

CTC的脱落方式目前在主要认为有两种:

  • 主动脱落,肿瘤细胞在微环境和自身转录本变化引起的 EMT 转换或侵袭血管壁导致的脱落,并进入血液循环
  • 被动脱落,由于外科手术或者穿刺造成的细胞脱落,使得 CTC 迅速的浸润血液循环(这种被动脱落的肿瘤细胞大概率无法在血液免疫环境中长期存活,因此会出现术后短时间内 CTC 数量暴增,而在术后几天体后便无法检测到 CTC)

参考文献:Circulating tumor cell isolation for cancer diagnosis and prognosis

早期 CTC 的数量检测和定位是实现实现对肿瘤早期诊断、发展和转移的无创监测的基石。但是,由于不同肿瘤之间的异质性太强,以及 CTC 在血液中浓度实在太低,使得精准溯源这件事情变得难以实现。

令人感到遗憾的是,作为液体活检基石的 CTC。目前无论是在临床实践还是基础研究上,都仅限于 CTC 的检测、计数以及少数的特异性靶点上,这使得 CTC 的研究和临床应用举步维艰。因此,CTC 的鉴定、表征和大规模的分析是目前CTC 在临床应用上必须突破的技术难题。

单细胞 RNA 测序技术作为目前最强大的在细胞水平的异质性分析技术,已经被广泛的用于各种癌症研究。目前已经存在的大规模肿瘤单细胞测序数据,使CTC 鉴定和表征分析成为了可能。但是,由于缺乏 CTC scRNA-seq 分析领域的数据积累和先验知识,目前仍难以从 scRNA-seq 组学数据中获取 CTC 的组织发生信息。考虑到 CTCs 与原发性癌组织分离,将 CTCs 映射到原发性癌细胞图谱是基于 CTCs 的病灶追踪的替代策略。但是,尽管来自相同病灶的癌细胞具有相似的癌症特异性生物标志物,但患者之间始终存在异质性,并且主动脱落的 CTC 不同于原发性癌细胞。因此,CTC 和原发性癌细胞之间的各种差异带来了额外的技术问题。

但是,迁移学习给我们提供了一种新的视角,Domain Adaptation (DA) 方法能够帮助
将单细胞组织测序数据应用于 CTC 数据。本文基于Domain Adaptation构建了CTC-Tracer 的无监督深度迁移学习模型,实现 CTC 的精准分类。具体来说,CTC-Tracer 以从血液样本中分离出的 CTC 的 scRNA-seq 表达谱作为输入,旨在准确识别 CTC 并追踪其病变来源,还可以检测其相对于病变细胞的表达变化

CTC-Tracer示意图

模型架构很简单,首先将输入的数据(底部图 1)进行 embedding(底部图 2)。然后将 embedding vector 进行 align(底部图 3)。最后进行标签匹配(底部图 4)。

在实现 CTC 溯源之前,由于考虑到血液中的 CTC 数量太少。即便通过富集的方法,将血细胞浓缩到 1000个细胞,CTC 的数量仍然少的一匹。可想而知,CTC 的纯度是直接影响到溯源的准确率,甚至是可行性。因此,本文集成了一个背景去除器——即一个二元的分类器,主要的作用是将血细胞和 CTC 进行精准的分离,该分离器的准确率达到 100%,AUC 值接近 1。
CTC-Tracer 能够正确区分 CTC 和血细胞
使用背景去除器将 CTC 从血液中分离出来后,导入CTC-Tracer实现细胞分类。
CTC-Tracer 对黑色素瘤 (Mel) 的平均准确率为 100% (SD = 0.00),对肝细胞癌 (HCC) 的准确率为 100% (SD = 0.00),对乳腺癌 (BRCA) 的平均准确率为 92% (SD = 0.00) ) ,对前列腺癌 (PC)的平均准确率为 95% (SD = 0.00) 。
域矫正后 CTC 溯源的可视化结果

CTC-Tracer的局限性

文章提到的局限性

  • According to the sensitivity analysis, we may need to collect at least 30 cells per dataset for a relatively stable and accurate prediction
    根据敏感性分析,如果要进行溯源,CTC 的个数应该要超过 30个,模型才能稳定
    输入的 CTC 个数和模型稳定性关系
  • based on the pre-trained model, the affection of the number of target-domain samples is relieved in CTC-Tracer, and reasonable accuracy (>90%) could be achieved with only a few cells (1–5 cells) in transductive learning mode
    但是呢,如果使用预训练模型的话,只需 1-5个细胞就能够进行 CTC 溯源
    预训练模型与 CTC 个数对模型准确率的影响

结语

这篇文章总体思路非常值得借鉴,并且作者并没有强调他的模型能够直接使用在 CTC 溯源,只是强调了使用单细胞测序和深度学习能够使得困扰精准肿瘤学已久的重要问题——CTC 溯源成为了可能。
但是,理论和实际相差甚远,这篇文章存在着两个极为致命的问题,使得我们虽然看见了 CTC 溯源的可能性,但是路途还是非常的遥远。在这项研究中,使用的数据都是经过高度浓缩提纯后的 CTC 数据,虽然模型中集成了背景去除器(准确率达到 100%)。这 100%的准确率并不能让读者非常激动的原因,在于背景数据是掺入的数据,数据的批次效应,必然使得准确率极高。此外,高度浓缩的 CTC 在临床实操上是不切实际的(实验室场景还是有可能的),因为 CTC 溯源的主要应用场景就是早期诊断(排除掉一些转移灶不知道原发灶的情况),早期诊断的样本,很大概率都是正常人,正常人的 CTC 个数少的可怜,这种高度浓缩的 CTC 很有可能根本就富集不出 CTC。此外,在本研究中,预训练的数据源过于的单一,且数据量真的太少了,难免会让人怀疑是否过拟合,理论上这么少的数据应该使用循环和交叉验证,只需证明这个流程没有问题即可,完全没有必要过度的强调准确率。
总之,这篇文章还是有改进的地方,但是整个大体方向和思路非常值得借鉴。

Others

Date: Dec. 29, 2022

please contact with me via the following ways:
E-mail :yuansh3354@163.com

Best Regards,
Yuan Sh, MD (ORCID: 0000-0002-6028-0185)

Github: https://github.com/yuansh3354

1Fujian Medical University. No. 1 Xue Yuan Road,University Town, 350122 FuZhou Fujian, China
2National Center for Nanoscience and Technology (NCNST). No.11 ZhongGuanCun BeiYiTiao, 100190 Beijing, China

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/127468.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mediasoup create/connect WebRtcTransport 流程分析

一. 前言 在这篇博客中我们介绍了 mediasoup-demo 启动流程与信令交互,关键信令包括 getRouterRtpCapabilites,join, createWebRtcTransport, connectWebRtcTransport, produce,本文将介绍 createWebRtcTransport 和 connectRtcTransport 的流…

为远程MySQL数据库配置固定的公网TCP地址【内网穿透】

在上篇文章中, 我们成功实现了在公网环境下远程连接内网MySQL数据库。但由于使用的免费的cpolar内网穿透,其所生成的公网地址为随机临时地址,24小时内会发生变化,对于需要长期远程访问的用户来讲非常不方便。因此,本篇…

华为云CDN加速服务,让企业用户上网“走高速”

如今CDN技术在互联网项目中越来越被广泛应用,虽然大多数人对于CDN并不熟悉,但其实我们的日常生活中的看新闻、看直播、网上购物等,都在无形之中跟CDN息息相关。 华为云CDN是通过部署广泛的节点服务器,将源站内容分发给靠近用户的智…

【修改】对“C语言实现轰炸代码”进行修改和完善

场景: 使用C语言实现“轰炸”效果,就是多条重复表情或信息的发送;使用场景是在QQ上面。 问题描述 1.不兼容,对于VS2022或者其他VS编译器无法实现效果。 2.代码能正常运行但无法弹出窗口进行发信息。 原因分析: 1.不…

力扣 2032. 至少在两个数组中出现的值

题目 给你三个整数数组 nums1、nums2 和 nums3 ,请你构造并返回一个 元素各不相同的 数组,且由 至少 在 两个 数组中出现的所有值组成。数组中的元素可以按 任意 顺序排列。 示例 输入:nums1 [1,1,3,2], nums2 [2,3], nums3 [3] 输出&a…

Day843.CompletableFuture -Java 并发编程实战

CompletableFuture Hi,我是阿昌,今天学习记录的是关于CompletableFuture的内容。 前面不止一次提到,用多线程优化性能,其实不过就是将串行操作变成并行操作。 如果仔细观察,还会发现在串行转换成并行的过程中&#…

堆树和堆排序

一、堆树 1、定义 堆树的定义如下: (1)堆树是一颗完全二叉树。 (2)堆树的每一个结点值都大于等于或者小于等于其左右子结点的值。 (3)堆树中每个结点的子树都是堆树。为什么是大于等于或者小于…

一口气讲透Redis分布式缓存、秒杀 + 思维导图

一、分布式缓存 1、单点Redis的问题 1、数据丢失问题 Redis数据持久化。 2、并发能力问题 大家主从集群,实现读写分离。 3、故障恢复问题 利用Redis哨兵,实现健康检测和自动恢复。 4、存储能力问题 搭建分片集群,利用插槽机制实现动…

【Linux 常用监控指标总结】

1. Linux运维基础采集项 做运维,不怕出问题,怕的是出了问题,抓不到现场,两眼摸黑。所以,依靠强大的监控系统,收集尽可能多的指标,意义重大。但哪些指标才是有意义的呢,本着从实践中…

【JavaScript】定时器详解

文章目录【JavaScript】定时器详解一. 定时器分类二. 定时器的使用三. 案例:实现抽奖效果样式一样式二【JavaScript】定时器详解 一. 定时器分类 延迟定时器 setTimeout(function(){}, 毫秒数)作用:隔一段时间之后执行 间隔定时器 setInterval(functio…

【UE4 第一人称射击游戏】18-添加角色换弹时的动作

上一篇: 【UE4 第一人称射击游戏】17-重写换弹逻辑 本篇效果: 步骤: 1.打开“SWAT_AnimBP”,在动画图表中,添加一个名为“Reloading”的状态 完善过渡规则的连线 双击打开“Reloading”,添加换弹动画 2…

Spring Security 401 问题解决

背景 : 微服务接口调用的时候报错,原来有一个rest服务用的不多,平时用的都是一些基础的服务,然后客户需要我们开放一个外部接口给他们,然后我寻思着就在这里面写接口。然后调用的时候就报如下的错。 后面跟踪源码发现 …

window上完全卸载oracle

Window上彻底卸载oracle 关闭oracle服务-----开始----->设置----->控制面板----->管理工具----->服务----->停止所有Oracle服务。 卸载软件------开始------所有程序------Oracle - OraDb11g_home1------Oracle 安装产品-----…

传统CV算法——边缘检测

文章目录传统CV算法-边缘检测第一章 概述1. **边缘检测概述**1.1 **认识边缘**1.2 **边缘检测的概念**1.3 **边缘检测的基本方法**1.4 **边缘检测算子的概念**1.5 **常见的边缘检测算子**2. **用梯度算子实现边缘检测的原理**2.1 **认识梯度算子**2.2 **梯度的衡量**2.3 **使用…

3D打印机的调平问题

快打完第五批料了,也算是有一些仅限于PLA以及PLA+耗材心得 3D打印机调平的简易方式有哪些? 在3D打印机中,打印平台作为模型的承载平台,如果有偏差,那么在后期的打印中,必然会导致细节的出现差…

[从零开始]用python制作识图翻译器·一

AlsoEasy-RecognitionTranslator前言需求分析应用场景需求提取需求补充竞品分析QQ识图百度翻译UU翻译器小结功能实现前言 这是我的毕设作品。当时玩了《人狼村之谜》觉得很惊艳,所以想玩一下该社的别的作品:《D.M.L.C.》。但是苦于没有熟肉,自…

vue2中使用VantUI

Vant 是一个轻量、可靠的移动端组件库 目前 Vant 官方提供了 Vue 2 版本、Vue 3 版本和微信小程序版本,并由社区团队维护 React 版本和支付宝小程序版本。 Vant 2 - Mobile UI Components built on Vue 第一步:安装该组件库 在现有项目中使用 Vant 时&a…

Azure 深入浅出[3]: 如何在MS Visio里面画专业的Azure技术架构图?

1.前言 笔者最近在研究Azure,需要画Azure的技术架构图;画Azure架构图的方法很多,有在线的工具,有基于Azure的PPT模板,同时也有笔者这样选择用最传统的微软的工具:MS Visio来绘图。那么在MS Visio里面如何绘…

设计模式六大原则

设计模式六大原则 1.单⼀职责( ⼀个类和⽅法只做⼀件事 ) 不遵守单一职责原则 模拟不同用户观看视频,先一把梭哈,所有用户观看视频的服务全部都写道一块 public class ApiTest {public static void main(String[] args) {VideoUserService service …

干货丨FPGA零基础学习,入门必看!

看到不少同学后台进行提问:FPGA如何入门?怎么学习?其实对于新人来说,FPGA的学习需要了解的东西还是非常多,下面IC修真院就带大家一起来了解一下吧。 FPGA简介 FPGA普遍用于实现数字电路模块,用户可对FPGA…