佛罗里达大学利用神经网络,解密 GPCR-G 蛋白偶联选择性

news2024/12/24 8:20:10

内容一览:G 蛋白偶联受体 (GPCRs) 是一种将细胞膜外的刺激,传递到细胞膜内的跨膜蛋白,广泛参与到人体生理活动当中。近日,佛罗里达大学的研究者测定了 GPCRs 和 G 蛋白的结合选择性,并开发了预测二者选择性的算法,对这一选择性的结构基础进行了研究。
关键词:GPCR 神经网络 药物研发

作者 | 雪菜

编辑 | 三羊

G 蛋白偶联受体 (GPCRs) 是一种将细胞膜外的刺激传递到细胞膜内的跨膜蛋白。通过激活细胞膜内的 G 蛋白及其下游信号通路,GPCRs 能够广泛参与到发育、免疫、激素调节和神经活动等重要生理活动中。

G 蛋白由 Gα、Gβ 和 Gγ 亚基组成,其多样性决定了 GPCRs 信号反应的多样性。人类基因组共编码了 16 个 Gα 亚基,分为 4 个亚家族 Gαi/o、Gαq、Gαs 和 Gα12/13。G 蛋白决定了下游的信号通路,进而决定了细胞反应。因此,GPCRs 和 G 蛋白的选择性结合是理解生物体信号系统的关键。

学界一度认为 GPCRs 只会与单个 G 蛋白偶联,进而从功能上将 GPCRs 对应划分为 4 种。然而近期研究者发现,大多数 GPCRs 会与多个 G 蛋白偶联,以激活复杂细胞反应。一对一的分类模式已经不足以描述 GPCRs 和 G 蛋白的偶联关系,然而 GPCRs-G 蛋白的选择性机制又暂不明晰。

为此,佛罗里达大学的研究者使用动力学测量和生物发光共振能量转移 (BRET) 技术,测定了 GPCRs 对 G 蛋白的鸟苷酸交换因子,以分析二者的选择性结合。据此,研究人员以 GPCRs 对 G 蛋白的偏好对其分类,建立了包括不同哺乳动物的 124 种 GPCRs 的粗粒度模型。随后,开发了一个预测 GPCRs-G 蛋白选择性的算法,研究了选择性的结构基础。相关成果已发表在 「Cell Reports」。

这一成果已发表于「Cell Reports」

论文链接:

https://doi.org/10.1016/j.celrep.2023.113173

01 BRET:GPCRs-G 蛋白选择性量化

为了量化检测 GPCRs-G 蛋白选择性,研究人员使用 BRET 技术在活体细胞中测量了 G 蛋白的活性。

实时检测 G 蛋白活性的 BRET 技术

随后,研究人员在胆囊收缩素 Ⅱ 型受体 (CCKBR) 上进行了验证。响应振幅 (Amplitude) 结果表明,CCKBR 可以激活 Gαi/o、Gαq、Gα15 和 Gα12/13 家族的 G 蛋白,且激活水平差距不大,但无法激活 Gαs 家族的蛋白。

而基于激活率 (Activation Rate) 的结果清晰表明,CCKBR 对 Gαq 家族激活效果最好,随后才是 Gαi/o、Gα15 和 Gα12/13,这说明基于激活率的 BRET 技术可以捕获到不同 G 蛋白活性之间的细微差异。

基于振幅的 BRET 结果 (C) 及基于激活率的 BRET 结果 (D)

据此,研究人员测量了 124 种 GPCRs 和 G 蛋白的选择性,作为本研究的数据集。

B 类 GPCRs 与 G 蛋白的选择性测量结果

02 模型构建:二元分类神经网络

上述结果表明,基于激活率的 BRET 技术能够对上百种 GPCRs 与 G 蛋白的选择性进行区分。基于这一结果,研究人员开发了一种基于机器学习的 A 类 GPCRs-G 蛋白选择性预测算法。

算法的任务包括两个:

1、针对 GPCRs 的偶联性,判断某种 GPCR 能否与 G 蛋白偶联,即振幅 >0%;

2、针对 GPCRs 的选择性,判断某个 GPCR-G 蛋白偶联体能够迅速激活,即激活率 >30%。

机器学习算法的概念图

每个 GPCR 和不同家族的 G 蛋白的偶联都是一个分类问题,因此每个任务可以设计为 5 个二元分类。据此,研究人员设计了 10 个神经网络分类器处理这些任务。神经网络由两个全连接层(分别为 128 个和 16 个神经元)、一个压平层 (Flattening Layer)、三个全连接层(分别为 128 个、32 个和 4 个神经元)以及一个输出层(1 个神经元)组成,内层由校正线性单元 (ReLU) 激活,最后进行批量归一化。输出层通过 sigmoid 函数激活。

由于数据量有限,在假设决定 G 蛋白选择性的序列在进化过程中相对保守的前提下,为每种 GPCR 增加了 50 个同源序列,进行数据扩充。在模型中部署序列嵌入协议,使用无监督深度学习模型描述蛋白质残基在特定环境中的属性。

神经网络的输入是大小为 B*30*1024 的张量。其中第一维度是 batch size (B=32),第二维度是残基数量 (30),第三维度为每个氨基酸残基预训练序列嵌入的大小 (1024)。

模型对振幅和激活率预测的平均 AUROC 均为 0.85,说明模型对两项指标的预测均有较好的性能。其中,对 Gs 家族蛋白预测最佳,AUROC 分别为 0.89 和 0.95。然而,对于 Gα15 和 Gα12/13 家族的蛋白,模型没有展现出明显的学习能力。

振幅 (C) 和激活率 (D) 预测的 ROC 曲线

03 GPCRs-Gα 蛋白选择性的机制解密

BRET 实验和机器学习为破解 GPCRs-G 蛋白选择性的结构基础提供了解决方案。基于此,研究人员调查了可用的 GPCRs-G 蛋白复合物,并对 33 个 A 类受体进行了分析,找到了决定 A 类 GPCRs-Gα 蛋白选择性的结构。

研究人员调查了 GPCRs-Gα 蛋白的残基网络,结果显示 GPCRs 面向细胞质的所有结构均不同程度地参与到了与 Gα 蛋白的结合当中。同样的,Gα 蛋白中也有 13 个结构与 GPCRs-Gα 蛋白的结合相关,其中 C 端的 α-螺旋 (H5) 参与程度最高。

GPCRs 和 Gα 蛋白不同结构元素的交互

对于普遍的 GPCRs-Gα 偶联,GPCRs 使用 ICL2、H8 和大部分 TM 残基与 Gα 蛋白相连。其中,绝大多数结构主要与 H5 相连,而 ICL2 的连接更为广泛。

GPCRs 与 Gαi/o 和 Gαq 家族的蛋白偶联模式类似,唯一的区别在于 GPCRs 与前者的连接严重依赖 TM6,而与后者的连接则不需要。GPCRs 与 Gαs 的连接当中,ICL2 和 ICL3 的份额大幅减少,而更依赖 TM3 和 TM5。上述结果说明,对于不同家族的 Gα 蛋白而言,其与 GPCRs 的连接依赖于不同的结构。

进一步的,结合 GPCRs-G 蛋白的选择性顺序,调查特定结构对不同家族 Gα 蛋白的影响。首先,判断与 Gαi/o 结合的 GPCRs 能否与 Gα15 结合,并对比二者残基网络的差异。与前者相比,GPCRs 与后者的连接切断了 ICL3 和 H4 的联系,弱化了 ICL2-H5 的交互,强化了 TM4-HN 和 ICL2-s2s3 的连接。这说明 ICL2 与其他残基的联系可能是与 Gαi/o 或 Gα15 相连的 GPCRs 的主要区别。

GPCRs 只与 Gαi/o 连接的残基网络 (J) 和 GPCRs 与 Gα15/Gαi/o 相连的残基网络 (K)

同样的,对比了 GPCRs 与 Gαs 和 Gαi/o 结合的残基网络之后,结果显示 ICL1 和 TM5 之间的联系是二者的主要区别。

上述结果说明,BRET 和机器学习能够对 GPCRs-G 蛋白结合的蛋白残基网络进行分析,进而找到二者选择性的结构基础,为 GPCRs 的研究提供了新方法。

04 AI-GPCR:96.4% 的未探索区域

过去十年间,AI 和机器学习在 GPCR 领域的应用比例稳步提升。2022 年,有 3.6% 的 GPCR 相关论文中提到了 AI 相关方法。

GPCR 相关论文中提及 AI 的比例

鉴于 AI 在 GPCR 药物研究中的应用的不断增加,对应的算法也不断被开发。对于分类问题,最常用的算法是传统机器学习领域的常用算法,如 scikit-learn 库中的算法,包括支持向量机 (SVM)、决策树、梯度提升机和 k-近邻算法等。

对于数值结果,如蛋白-配体结合的亲和力等,常用回归算法求解,如多元线性回归、支持向量机和深度学习网络等。

最近的成果多使用多层感知器、卷积神经网络 (CNN) 等深度学习算法进行预测。随着深度学习生成算法的发展,蛋白质配体和结构设计愈发高效和准确。生成对抗性网络 (Generative Adversarial Network)、循环神经网络 (Recurrent Neural Network)、强化学习等算法可以利用向量空间的自动构造和自适应度量来探索更大的生成空间。

AI 在 GPCR 药物研发各阶段的作用

因此,这些算法可以产生更多具有所需功能的配体,或是更准确地预测未知蛋白质的结构,如 AlphaFold2。虽然 AlphaFold2 等模型并不专用于预测 GPCR 的结构,但仍可以高效准确地预测 GPCR 的结构。此外,无监督或自监督深度学习也在药物发现重崭露头角。

可见,AI-GPCR 可能是未来药物研发的新方向,但同时也为我们留下了 96.4% 的未知区域。在高效分类和精准预测的算法帮助下,人们能够对 GPCR 的偶联机制有更清晰的了解,为生物医学的发展注入新动能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1284163.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

kubernetes监控GPA安装部署

本文在于指导如何对k8s的监控GPA(Grafana,prometheus以及alertmanager)进行安装部署。 1. 介绍 Prometheus 在真正部署Prometheus之前,应了解一下Prometheus的各个组件之间的关系及作用: 1)MertricServer:是k8s集群…

朋友圈7大黄金发圈时间

众所周知,朋友圈运营是私域运营必不可少的重要环节。 因为做好朋友圈运营,能够打造形成高质量、高价值的私域流量,加快实现用户成交。 那么如何形成一个吸粉又吸金的人设,做出高质量的朋友圈发圈内容呢? 那么如何确保能…

SSM整合(注解版)

SSM 整合是指将学习的 Spring,SpringMVC,MyBatis 进行整合,来进行项目的开发。 1 项目基本的配置类 1.1 Spring 配置类 这个配置类主要是管理 Service 中的 bean,controller 层的 bean 对象是 SpringMVC 管理的 package cn.ed…

二极管:二极管的基本原理

一、认识导体、绝缘体、半导体 什么是导体? 导体 conductor ,是指电阻率很小,且容易传导电流的物质。导体中存在大量可自由移动的带电粒子,也称为载流子。在外电场的作用下,载流子作定向运动,形成电流。 …

安装配置JDK1.8

JDK1.8的下载及配置 1.进入甲骨文官网甲骨文官网往下翻找到java8并且点击windows. 2.下载Java8必须登录账号 3下载完后点击进入安装,直接下一步就可以,记住这个路径。 4.右击我的电脑进入环境配置,新增变量。 CLASSPATH .;%JAVAHOME%\lib;…

3.C程序编译步骤

目录 1 预处理 2 编译 3 汇编 4 链接 5 文件大小情况 依次执行下面4个步骤 预处理 将所有头文件展开,比如stdio.h等,展开就相当于把stdio.h中的所有代码粘贴到你的代码里。将所有的宏文件展开,像stdio.h是官方定义的头文件&#x…

C# - Opencv应用(3) 之矩阵Mat使用[图像截取粘贴、ROI操作、位运算、数学计算]

C# - Opencv应用(3) 之矩阵Mat使用[图像截取粘贴、ROI操作、位运算、数学计算] 图像读取,大小、截取、位运算图像ROI操作:粘贴赋值、滤波图像数学计算部分结果如下: 1.图像读取,大小、截取、位运算 //图…

计算机辅助药物设计AIDD-小分子-蛋白质|分子生成|蛋白质配体相互作用预测

文章目录 计算机辅助药物设计AIDD【小分子专题】AIDD概述及药物综合数据库学习机器学习辅助药物设计图神经网络辅助药物设计自然语言处理辅助药物设计药物设计与分子生成 计算机辅助药物设计【蛋白质专题】蛋白质数据结构激酶-Kinase相似性学习基于序列的蛋白质属性预测基于结构…

解决xshell连接诶树莓派中文乱码的问题

系统版本 解决办法 在根目录下找到 /etc/profile 修改profile文件,添加以下两行.以便重启之后也能生效: export LANGzh_CN.utf8 export LC_ALLzh_CN.utf8注意: /etc/profile的修改需要root权限才能修改! 在xshell的编码格式改为UTF-8

一次性客户的笔记总结

创建一次性客户,系统会给出一个客户编码; 每次记账的时候,在录入过账码及客户编码后,点击回车,都需要录入这个客户的详细信息(比如 客户名称等) 一次性客户的信息存储在BSEC表中,这种…

飞致云1panel + 雷池WAF

可能有许多人都有这个需求:为自己的个人站点套上WAF,增加安全性,本文将介绍如何将1panel面板深度结合长亭雷池防火墙,实现为个人站点套上WAF并且自动续签ssl证书。 前提条件: 服务器IP已绑定域名 完整的1panel环境 …

springboot简单集成上传和下载(带页面)

来学习一下文件上传和下载 一、页面开发 整体思路 登录页 主页 二、库表设计 SET FOREIGN_KEY_CHECKS0;-- ---------------------------- -- Table structure for t_files -- ---------------------------- DROP TABLE IF EXISTS t_files; CREATE TABLE t_files (id int(11) N…

【五分钟】熟练使用numpy.cumsum()函数(干货!!!)

引言 numpy.cumsum()函数用于计算输入数组的累积和。当输入是多维数组时,numpy.cumsum()函数可以沿着指定轴计算累积和。 计算一维数组的累计和 代码如下: # 计算一维数组的累计和 tmp_array np.ones((4,), dtypenp.uint8) # [1, 1, 1, 1] print(&…

java--接口概述

1.认识接口 ①java提供了一个关键字interface,用这个关键字我们可以定义出一个特殊的结构:接口。 ②注意:接口不能创建对象;接口是用来被类实现(implements)的,实现接口的类称为实现类。 ③一个类可以实现多个接口(接…

1、Spring基础概念总结

Spring概述: Spring体系结构 IOC的概念和作用 耦合指的是对象之间的依赖关系,耦合越小越好 以jdbc为例 通过反射来注册驱动,那么会造成驱动名称写死在程序当中,这种结果显然是不太合理的通过配置文件的形式可以解决这种耦合问…

微服务--一篇入门kubernets

Kubernetes 1. Kubernetes介绍1.1 应用部署方式演变1.2 kubernetes简介1.3 kubernetes组件1.4 kubernetes概念 2. kubernetes集群环境搭建2.1 前置知识点2.2 kubeadm 部署方式介绍2.3 安装要求2.4 最终目标2.5 准备环境2.6 系统初始化2.6.1 设置系统主机名以及 Host 文件的相互…

成为AI产品经理——模型稳定性评估(PSI)

一、PSI作用 稳定性是指模型性能的稳定程度。 上线前需要进行模型的稳定性评估,是否达到上线标准。 上线后需要进行模型的稳定性的观测,判断模型是否需要迭代。 稳定度指标(population stability index ,PSI)。通过PSI指标,我们可以获得不…

Python类型注解必备利器:typing模块解读指南

更多资料获取 📚 个人网站:ipengtao.com 在Python 3.5版本后引入的typing模块为Python的静态类型注解提供了支持。这个模块在增强代码可读性和维护性方面提供了帮助。本文将深入探讨typing模块,介绍其基本概念、常用类型注解以及使用示例&am…

ssm农业信息管理系统源码和论文

摘 要 网络的广泛应用给生活带来了十分的便利。所以把农业信息管理与现在网络相结合,利用java技术建设农业信息管理系统,实现农业信息管理的信息化。则对于进一步提高农业信息管理发展,丰富农业信息管理经验能起到不少的促进作用。 农业信息…

JVM 运行时内存(三)

Java 堆从 GC 的角度还可以细分为: 新生代(Eden 区、From Survivor 区和 To Survivor 区)和老年代。 1. 新生代 是用来存放新生的对象。一般占据堆的 1/3 空间。由于频繁创建对象,所以新生代会频繁触发MinorGC 进行垃圾回收。新生代又分为 Eden 区、ServivorFrom、…