人工智能辅助药物发现(4)药物重定位

news2024/9/25 9:36:57

目录

  • 药物重定位概述
  • 药物重定位数据库
  • 表示学习
    • 基于序列的表示学习
    • 基于图的表示学习
  • 药物重定位深度学习
    • 以靶点为中心
    • 以疾病为中心
  • 药物重定位的应用

药物重定位概述

新药物的研发投资巨大,周期漫长。从获批准的临床药物中有效识别新的适应药物在药物发现中起到重要作用,可以绕过开发一个治疗性药物所需的多项批准前测试,这个过程被称为药物重定位。

药物重定位数据库

现有的数据库存储了来自不同系列化合物的潜在细胞靶点。例如,KEGG数据库,包含了来自基因,蛋白质,生物途径和人类疾病的大规模分子数据集。DrugBank将详细的药物信息和相应的靶点结合,共计13791个药物条目。药物重定位涉及化学,药物-靶点相互作用数据。

表示学习

深度学习的性能很大程度上体现在有效的数据表示上。这意味着可以让一个系统使用一套技术自动从原始数据中提取特征或发现分类所需的表示,这被称为表示学习。目前,用于药物重定位的表示学习分为基于序列的方法和基于图的方法。

基于序列的表示学习

基于序列的表示方法可以克服部分现有的蛋白质结构数据的局限性和昂贵的分子对接模拟需求。现有的蛋白质和化合物序列可以推进药物重定位。
fig1

  • 图1:药物的表示。

对于分子化合物,常用1D序列SMILES表示(图1a)。受到NLP中预训练语言模型的启发,Mol2vec被提出并被认为是最具有代表性的方法,它将化合物分子的子结构视为单词,化合物视为句子,使用Word2vec生成化合物的embedding(向量组成的矩阵)。

此外,分子指纹,比如圆形指纹,可以表示为二进制向量(图1b),以此高维稀疏向量作为输入,可以得到化合物的embedding(一个低维向量)。

fig2

  • 图2:蛋白质的表示。

对于蛋白质,蛋白质序列一般由20种标准氨基酸构成,每个氨基酸都可以通过one-hot进行编码(图2a)。该矩阵同样可以被word2vec表示。

此外,蛋白质可以用2D距离图表示(图2b),它计算3D蛋白质结构中所有可能的氨基酸残基对之间的距离。

基于序列的表示方法没有考虑蛋白质的3D结构信息。DeepMind开发的AlphaFold系统发布了基于序列的蛋白质3D结构预测结果。

基于图的表示学习

对于化合物,SMILES可以通过RDKit转换为分子图(graph结构),并将分子图中的原子和键分别表示为图中的顶点和边。对于蛋白质,可以将蛋白质的各种非氢原子表示为蛋白质图的顶点。然后用GNN提取节点的特征表示。

药物重定位深度学习

药物重定位模型分为:以靶点为中心(预测药物-靶点相互作用)和以疾病为中心(预测药物-疾病相互作用)。

以靶点为中心

卷积运算可用于处理不同长度的氨基酸序列,并捕获在药物-靶点相互作用(DTI)预测中起到关键作用的局部残基的模式。DTI预测可以利用化合物-蛋白质相互作用(CPI)数据。DTI预测可以使用之前描述的CPI预测模型。

以疾病为中心

识别药物-疾病对之间的相互作用是以疾病为中心的药物重定位关键步骤。现有方法大致分为基于相似性和基于网络。

  • 已有很多方法被用于计算药物和疾病之间的相似性。这些方法通过将药物-疾病特征与已知的药物-疾病关联结合。
  • 基于网络的方法结合生物网络的图信息进行重定位。该方法以知识图谱嵌入研究为主。

药物重定位的应用

以COVID-19为例,说明药物重定位在对抗COVID-19中起到的加速治疗作用。

从SARS-CoV-2病毒→宿主蛋白→蛋白相互作用的角度来看,经批准的针对特定人类蛋白或靶点的药物可能为COVID-19提供潜在的宿主靶向治疗。

尽管现有可用的疫苗,但目前尚无有效的COVID-19治疗方法。针对COVID-19大流行,Belyaeva等人提出一个基于自编码器的平台,该平台集成了可用的转录组学,蛋白质组学和结构数据。作者强调将丝氨酸和酪氨酸激酶作为潜在靶点,并确定了三种候选药物(多沙普蓝,达沙替尼,利巴韦林)。

除了针对COVID-19的宿主靶向疗法,专门针对SARS-CoV-2病毒蛋白的抗病毒药物重定位也是一种疗法。例如,SARS-CoV-2的主蛋白酶(Mpro)是最有利的药物靶点之一。现有研究已经确定了71个候选的SARS-CoV-2 Mpro共价键抑制剂。

这些研究表明,深度学习在识别用于COVID-19的可重新利用药物(包括靶向宿主疗法抗病毒疗法)具有潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/175964.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

cc123 靶场测试笔记

1.cc123 靶场介绍本靶场存在四个 flag 把下载到的虚拟机环境导入到虚拟机,本靶场需要把网络环境配置好。1.1.网络示意图2. 信息收集2.1.主机发现sudo netdiscover -i eth0 -r 192.168.0.0/242.2.masscan 端口扫描sudo masscan -p 1-65535 192.168.1.102 --rate10002…

Elasticsearch7.8.0版本高级查询—— 高亮查询文档

目录一、初始化文档数据二、高亮查询文档2.1、概述2.2、示例一、初始化文档数据 在 Postman 中,向 ES 服务器发 POST 请求 :http://localhost:9200/user/_doc/1,请求体内容为: { "name":"zhangsan", "ag…

<Python的文件>——《Python》

目录 1.文件 1.1 文件是什么 1.2 文件路径 1.3 文件操作 1.3.1 打开文件 1.3.2 关闭文件 1.3.3 写文件 1.3.4 读文件 1.3.5 关于中文的处理 1.4 使用上下文管理器 1.文件 1.1 文件是什么 变量是把数据保存到内存中. 如果程序重启/主机重启, 内存中的数据就会丢失.…

23种设计模式(十八)——组合模式【数据结构】

文章目录 意图什么时候使用组合真实世界类比组合模式的实现组合模式的优缺点亦称: 对象树、Object Tree、Composite 意图 有时又叫作整体-部分(Part-Whole)模式,是一种将对象组合成树状的层次结构的模式,用来表示“整体-部分”的关系,使用户对单个对象和组合对象具有一致…

【并发编程】Executor线程池

一、线程 1.线程 线程是调度CPU资源的最小单位。java线程与OS线程保持1:1映射关系,也就是说,一个Java线程也会在操作系统里有一个对应线程。 2.线程的生命周期 NEW,新建 RUNNABLE,运行 BLOCKED,阻塞 WAITING,等待 TIMED_WAITING,超时等待 TERMINATED…

超级完整的 Git 下载、安装与配置

Git的下载、安装与配置 一、git下载安装 1、访问git官方下载网址,点击这里,然后根据自己的电脑系统,下载对应的安装包: 2、在淘宝镜像网站 下载对应的安装包: 注: 如果由于官网下载速度过于缓慢&#xff…

String 有趣简单的编程题

String 有趣简单的编程题 每博一文案 师父说: 世上没有真正的感同身受,也没有谁能完全做到将心比心,我们一路走来。 慢慢的学会了收敛情绪,越成熟越沉默,有些人,背负沉重的压力,却从来不敢说累&#xff0c…

[python刷题模板] 树的直径/换根DP

[python刷题模板] 树的直径/换根DP 一、 算法&数据结构1. 描述2. 复杂度分析3. 常见应用4. 常用优化二、 模板代码1. 单纯询问树的直径值2. 求出树的直径两端搞事情3. 换根DP求树的直径(大炮打蚊子,别这么做,只是用来帮助理解换根DP)4. 换根dp求特定…

UDS诊断系列介绍14-2F服务

本文框架1. 系列介绍1.1 2F服务概述2. 2F服务请求与应答2.1 2F服务请求2.2 2F服务正响应2.3 2F服务否定响应3. 2F诊断使用示例4. Autosar系列文章快速链接1. 系列介绍 UDS(Unified Diagnostic Services)协议,即统一的诊断服务,是…

学习记录667@项目管理之项目人力资源管理

什么是项目人力资源管理 项目人力资源管理包括编制人力资源管理计划、组建项目团队、建设项目团队与管理项目团队的各个过程,不但要求充分发挥参与项目的个人的作用,还包括充分发挥所有与项目有关的人员-----项目负责人、客户、为项目做出贡献的个人及其…

[QMT]04-在QMT之外调用xtquant直接编写策略

背景希望不用在QMT软件里面憋屈地写代码,想使用pychar、vscode、notepad等IDE编写python代码,因为有代码提示、补全。这完全没问题!QMT简直是为个人量化交易者量身打造的神器,它支持以上想法。QMT这个东东基本是由两部分组成的&am…

1. 深度学习简介|计算机视觉简介|得分函数|损失函数作用|前向传播整体流程

文章目录深度学习简介计算机视觉简介k近邻算法得分函数损失函数作用前向传播整体流程机器学习是一个大块,其中就包含着深度学习,计算机视觉等 机器学习的流程: 数据获取特征工程建立模型评估与应用 深度学习简介 深度学习通过特征学习进行…

力扣sql简单篇练习(四)

力扣sql简单篇练习(四) 1 超过五名学生的课 1.1 题目内容 1.1.1 基本题目信息 1.1.2 示例输入输出 1.2 示例sql语句 SELECT class FROM Courses GROUP BY class HAVING count(student)>51.3 运行截图 2 超过经理收入的员工 2.1 题目内容 2.1.1 基本题目信息 2.1.2 示例…

零信任-发展历程及概念(1)

零信任发展历程 2010 Forrester约翰金德维格正式提出零信任概念 2013 CSA成立软件定义边界SDP工作组,次年发布SDP标准规范1.0 2017 Gartner正式提出“CARTA”零信任模型 2018 Forrester发表零信任扩展模型ZTX 2019 Gartner发布零信任网络(ZTNA)云安…

String 与 StringBuffer 与 StringBuilder 各自的妙用

String 与 StringBuffer 与 StringBuilder 各自的妙用 每博一文案 我从未见过,一个早起,勤奋,谨慎,诚实的人,抱怨命运不好的。 最完美的状态,不是你从不失误,而是你从没放弃成长。没人能把你变…

【SpringMVC】看完这篇简单理解并入门SpringMVC:通过入门案例举例子的方式快速理解

SpringMVC简介1.什么是MVC2.什么是SpringMVC3.SpringMVC的特点4.入门案例1.准备工作2.配置web.xml3.创建请求控制器4.创建SpringMVC的配置文件5.测试HelloWorld6.总结1.什么是MVC MVC是一种软件架构的思想,将软件按照模型、视图、控制器来划分 M:Model&…

【Java】比较器 Comparator Comparable

一、背景 我们在使用 Collections.sort() 对链表进行排序(或者使用 Arrays.sort() 对数组进行排序)时,常常需要根据不同情况自定义排序规则。比如:当我们存储学生对象时,我们需要按照学生年龄进行排序,这时…

树状数组(Binary Indexed Tree (B.I.T))

树状数组 树状数组 (Binary Indexed Tree(B.I.T), Fenwick Tree) 是一个查询和修改复杂度都为 log(n) 的数据结构。 「前缀和查询」与「单点更新」 直接前驱:c[i] 的直接前驱为 c[i - lowbid(i)],即 c[i] 左侧紧邻的子树的根。 直接后继:c[i…

财务精度:BigInteger 与 BigDecimal

财务精度:BigInteger 与 BigDecimal 每博一文案 师父说: 人这一辈子,真地好难。 有些人,好着好着,忽然就变陌生了,有些手,牵着牵着,瞬间就放开了,有些路,走着走着&#…

算法练习笔记——栈的常用方法以及算法练习

栈学习常用方法介绍力扣练习力扣 20. 有效的括号力扣 32. 最长有效括号常用方法介绍 Stack<Character> characters new Stack<>();//判断栈是否为空boolean empty characters.empty();//将a压入栈底&#xff0c;同时也返回aCharacter push characters.push(a);/…