基于构效关系模型的药物设计(QSAR)

news2024/9/20 8:42:48

基于构效关系模型的药物设计(QSAR)

定量构效关系(QSAR,Quantitative Structure-Activity Relationship)分析是指利用理论计算和统计分析工具来研究系列化合物结构(包括二维分子结构、三维分子结构和电子结构)与其生物效应(如药物的活性、毒性、药效学性质、药代动力学参数和生物利用度等)之间的定量关系。
它是药物研究中的一个重要理论计算方法和常用手段。例如:

定量构效关系QSAR—揭示一组化合物的生物活性与其分子结构特征之间的相互关系,以数学模型表达和概括出量变规律,以此设计新的化合物
活性 = f (分子或片断性质) 活性=f(分子或片断性质) 活性=f(分子或片断性质)

3D-QSAR的基本流程

COMFA(Comparative Molecular Field Analysis):比较分子场分析


基本假设:
药物与受体之间只有非键相互作用,没有形成共价键药物活性与立体场和(或)静电场的改变相关

COMSIA(Comparative Molecular Similarity Indices Analysis):比较分子相似因子分析法

作为COMFA的拓展:
除立体场和静电场外,还考虑氢键场疏水场,这两种作用对药物活性有重要影响改变分子场能函数,克服COMFA计算分子场时在某些格点出现显著变化的缺点由于力场考虑更全面,三维构效模型更优。
A F , k q ( j ) = ∑ i w probe,k  w i k e − α r i q 2 A_{F, k}^q(j)=\sum_i w_{\text {probe,k }} w_{i k} e^{-\alpha r_{i q}^2} AF,kq(j)=iwprobe,k wikeαriq2

基于构效关系模型的药物设计(QSAR)


3D-QSAR的优缺点
√不必知道靶点的结构 ×预测仅限于由训练集包络的空间之内
√不必输入实验测定或理论计算的理化参 ×不能可靠地预测出原模型范围之外的数值取代基结构
√给出可视图易于解释QSAR结果 ×分析的准确性取决于采用的空间结构
√不限于研究相似分子结构,只须有相同的药效团以相似的方式与靶点作用
√可预测新分子的活性,而不必先合成

COMFA/COMSIA流程


以Imatinib类似物为例构建COMFA与COMSIA模型
数据集基本要求及基本处理

口 化合物的活性值应跨越2-3个数量级
口 化合物在不同数量级上分布均匀
口 训练集分子数目最少为10个,一般15个或以上
口 活性值转化为对数值,一般使用pIC50

设置默认路径:File--->Set--->Default Directory

分子准备

数据集优化:Tasks--->LigPrep模块

点击左侧分子目录,可选中优化后的分子,并显示在窗口

分子叠合:点击Tasks--->Structure Alignment--->Ligand Alignment,打开Ligand Alignment对话框

分子叠合方法概述:
Ligand Alignment,指基于柔性形状的分子叠合该方法用ConfGen进行配体构象搜索。之后由ConfGen生成的构象并选择与参考配体重叠最好的构象,依次与参考配体对齐;Common scaffold alignment(requires Phase license),指基于公共骨架的叠合,有三种模式:
Largest common Bemis-Murcko scaffold使用包含完整环和连接环的1inkers的最大的公共骨架。勾选Use fuzzy matching(使用模糊匹配),表示将所有的非氢原子等同对待,但要区分键的类型(单键、双键、三键、芳香键)。
Maximum common substructure使用所有配体中最大的公共子结构。这比Bemis-Murcko scaffold更普遍,因为它不限于环和linkers
SMARTS使用指定的SMARTS模式。可以将SMARTS模式输入或粘贴到文本框中,或者通过单击Get from selection从工作区原子选择中生成SMARTS模式。即我们可以自定义公共骨架进行叠合;如我们在工作区中通过按住Ctrl选择我们自定义的公、共骨架,然后点击Get from Selection按钮即可;

3D-QSAR模型构建:

step 1. 分子导入
点击Tasks—>输入qsar–>选择3D Field-Based,打开Field-Based QSAR面板

分子导入




导入分子

构建训练集和测试集



点击Build后,出现Build Field-Based Model

模型结果分析


q 2 q^2 q2(Cross-validated r2cv):交叉验证系数,用于评价模型的主要参数
q 2 > 0.50 q^2>0.50 q2>0.50:有统计显著性的预测模型
q 2 > 0.4 q^2>0.4 q2>0.4:可以考虑使用该模型
q 2 < 0 q^2<0 q2<0:模型预测能力低于以均值预测能力
此处,我们选择第4个模型进行后续分析

3DQSAR的统计参数

ColumnDescription
#Factors偏最小二乘回归模型中的因子数。
SD回归的标准差。这是拟合的活性值的RMS误差,分布在n-m-1个自由度(n个配体,m个PLS因子)上。
R^2回归的标准差。这是拟合的活性值的RMS误差,分布在n-m-1个自由度(n个配体,m个PLS因子)上。
R^2 CV回归的R值(决定系数)。例如,0.80的值意味着模型占观测活动数据方差的80%。R始终在0和1之间。
R^2 Scramble使用扰乱活动构建的一系列模型的R平均值。衡量分子场能够拟合随机数据的程度。低值意味着模型不能拟合随机数据,但高值只意味着变量集相当完整,可以拟合任何东西。
Stability模型预测对训练集组成变化的稳定性。最大值为1。高值表示模型对训练集中的遗漏不敏感。稳定性值低于R-值表示过度拟合。
F模型方差与观测到的活动方差之比。模型方差分布在m个自由度上,活性方差分布在n-m-1个自由度(n个配体,mPLS因子)上。F的大值表明回归具有更大的统计学意义。
P将F作为卡方分布的比率处理时的显著性水平。值越小表示置信度越高。P值为0.05意味着F在95%的水平上是显著的。
RMSE测试集预测中的均方根误差。
Q^2预测活动的Q值。直接类似于R平方,但基于测试集预测。如果误差的方差大于观察到的方差,Q可以取负值
Pearson-r测试集预测活动与观察活动之间相关性的Pearson-r值。



预测值和实际值的相关性

训练集:预测值和实际值的相关性(调整参数根据活性大小区分颜色)

测试集:预测值和实际值的相关性(调整参数根据活性大小区分颜色)





3D-QSAR模型提供了五个场的场信息,分别为:

  • 立体场(Steric)
  • 静电场(Electrostatic)
  • 疏水场(Hydrophobic)
  • 氢键供体场(HbondDonor)
  • 氢键受体场(Hbond Acceptor)

等势能图解读


  • 黄绿色块表示立体场等势能图:
    • 绿色表示该处引入大基团即增大体积会增加活性
    • 黄色表示该处引入小基团即减小体积有利于提高活性

  • 红蓝色块表示静电场等势能图:
    • 蓝色表示增加正电荷有利于增强活性
    • 红色表示增加负电荷有利于增强活性




模型调整策略

  1. 能量优化:更改优化的参数比如立场、梯度、优化次数,添加电荷的类型等
  2. 能量优化是为了尽可能接近化合物的活性构象,因此可以将化合物与靶点蛋白对接,取其对接构象
  3. 分子叠合:模型的优劣很大程度取决于叠合的好坏,因此需要尝试不同的叠合方式,必要时可删除不合适的分子

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/449004.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Latex数学公式排版

文章目录 Latex使用最佳方式&#xff1a;读官方文档Latex中的字符数学公式排版1.引入宏包:2.公式排版基础3.数学符号(1).希腊字母(2).指数,上下标,导数(3).分式和根式(4).关系符(5).算符(6).巨算符(7).箭头 Latex使用 最佳方式&#xff1a;读官方文档 The not so short intro…

案例分析:真实案例对“引用类型”的思考

在一个风和日丽的早上&#xff0c;我刚坐到工位上&#xff0c;正准备美美的享受早餐时&#xff0c;我的测试小兄弟杨过火急火燎的来找我说&#xff1a;“小米&#xff0c;不好了&#xff0c;运营童鞋反馈&#xff0c;咱们商城小程序金刚区的新店专区&#xff0c;新开的店铺无法…

mac上 qt与mysql的连接问题

经过两天的折磨和挣扎&#xff0c;将Mac上QT与mysql数据库链接问题的解决做一个梳理&#xff0c;以防忘记&#xff0c;并供他人借鉴&#xff1b; 环境版本&#xff1a;Mac10.14&#xff0c;MySQL5.7.24&#xff0c;Qt5.14.2 首先我重新下载安装了Qt&#xff08;安装了源码&am…

Hadoop课程笔记

Hadoop笔记 nn和sn的区别 nn有inprogress&#xff0c;sn没有&#xff0c;隔一段时间sn会拉取nn上的fsi和edits进行合并然后返回给nnnn和dn 序列化和反序列化 当需要将内存中对象从一个服务器传输到另一个服务器的时候&#xff0c;将内存中的对象写进磁盘&#xff08;序列化&am…

python知识点总结(国家一级假勤奋大学生整理)

python知识点总结 0. 持续更新~1. print不加end自动加回车自动换行2. eval()提取值3. 三双引号字符串中可以包含换行符&#xff0c;制表符以及其他特殊字符4. 字符串不能修改5. 用in 或 not in判断字串是否在母串中6. 网上做题print慎用‘&#xff0c;’会产生不该有的空格7. i…

职场规则实录(不要成全别人,恶心自己)

即使我们因为做出某种决定失去了某些东西,但这并不一定意味着这个决定是错误的。相反,很多时候,即使我们面临诸多风险,我们也要冒险去做出决定,因为在这种风险中可能存在着丰富的机会和收获。就像投资一样,就算我们的投资并没有获得预期的收益,但这并不代表这个投资是错…

Linux 性能优化大全!

性能指标 高并发和响应快对应着性能优化的两个核心指标&#xff1a;吞吐和延时 应用负载角度&#xff1a;直接影响了产品终端的用户体验 系统资源角度&#xff1a;资源使用率、饱和度等 性能问题的本质就是系统资源已经到达瓶颈&#xff0c;但请求的处理还不够快&#xff0…

【超算/先进计算学习】日报5

目录 今日已完成任务列表遇到的问题及解决方案任务完成详细笔记程序性能分析程序流程分析程序静态分析工具 understand程序性能动态分析工具 gprof-使用方式程序性能动态分析工具 gprof-输出结果详解程序性能动态分析工具 gropf-函数调用关系图程序动态分支辅助方式-计时函数其…

git版本控制

git版本控制 time&#xff1a;2023-04-18 版本控制 集中式版本控制 多人协作开发 创建仓库 使用当前目录作为 Git 仓库&#xff0c;我们只需使它初始化。 git init使用我们指定目录作为Git仓库。 git init newrepo克隆远程仓库 git clone https://gitee.com/zhang-min…

银行数字化转型导师坚鹏:银行数字化创新应用与案例分析

银行数字化创新应用与案例分析 课程背景&#xff1a; 很多银行存在以下问题&#xff1a; 不知道如何进行数字化创新&#xff1f; 不知道金融科技在银行业的重要应用&#xff1f; 不清楚银行同业的数字化创新有哪些案例&#xff1f; 课程特色&#xff1a; 用独特视角…

在C上++ -- 函数重载与引用

一、函数重载 函数重载&#xff1a;是函数的一种特殊情况&#xff0c;C允许在同一作用域中声明几个功能类似的同名函数&#xff0c;这 些同名函数的形参列表(参数个数 或 类型 或 类型顺序)不同&#xff0c;常用来处理实现功能类似数据类型 不同的问题。 简单来说&#xff1a…

点云处理及三维重建软件(Point Cloud Viewer, PCV)的设计与实现

GitHub 地址&#xff1a;point-cloud-viewer 文章目录 使用教程以及相关工具库Step 1 搭建环境Step 2 使用Cmake构建工程Step3 使用VS 编写code并编译执行 点云处理及三维重建软件(PCV)的设计与实现一&#xff0c; 软件总体设计1.1 软件设计流程需求分析总体设计技术选型详细设…

【RestFul系列】RestFul学习笔记

目录 一、REST定义 二、REST架构的主要原则 三、RESTful介绍 1、资源&#xff08;Resources&#xff09; 2、 表现层&#xff08;Representation&#xff09; 3、 状态转化&#xff08;State Transfer&#xff09; 四、RESTful的使用 1、RESTful资源操作 2、接口示例&…

verilog设计实现8b-10b编码器包括3b4b,5b6b 及modelsim仿真

下面是8b10b编码器的设计步骤。 确定数据输入和输出接口。例如,您需要确定8位并行数据输入和10位串行数据输出。 计算数据带宽。这与芯片中可用的时钟速度密切相关。 选择编码表。根据应用选择最佳编码表,8b10b编码器至少应使用一张编码表。详细了解和选择编码表有利于改善编…

图的存储及基本操作总结(邻接矩阵、邻接表)及C/C++代码实现

文章目录 前言一、邻接矩阵1.概念2.图像示例3. 代码实现注意邻接矩阵的特点 二、邻接表1.概念2.图像示例3.代码实现邻接表的特点 前言 图是一种比较复杂的数据结构&#xff0c;每个结点之间可以有多种关系。 所以&#xff0c;一个图可以呈现出千奇百怪的形式。 对于不同的形式…

使用FFMPEG库将YUV编码为H264

准备 ffmpeg 4.4 p准备一段yuv420p的格式的视频原始数据 这里我们使用命令直接提取 ffmpeg -i .\beautlWorld.mp4 -pixel_format yuv420p -s 1280x720 yuv420p_1280x720.yuv 编码流程 大致可以分为以下几步&#xff1a; 1.初始化编码器并设置参数 2.初始化AVPacket和AVFr…

【Java基础 1】Java 环境搭建

&#x1f34a; 欢迎加入社区&#xff0c;寒冬更应该抱团学习&#xff1a;Java社区 &#x1f4c6; 最近更新&#xff1a;2023年4月22日 文章目录 1 java发展史及特点1.1 发展史1.2 Java 特点1.2.1 可以做什么&#xff1f;1.2.2 特性 2 Java 跨平台原理2.1 两种核心机制2.2 JVM…

Activiti入门

目录 一、了解工作流 1、什么是工作流 2、工作流引擎 3、常见工作流引擎 4、Activiti7概述 4.1、Activiti介绍 4.2、建模语言BPMN 4.3、Activiti使用流程 一、了解工作流 1、什么是工作流 工作流&#xff08;Workflow&#xff09;&#xff0c;就是通过计算机对业务流…

SSeg总体思路

1&#xff1a;在train中加载train和test数据集。 2&#xff1a;指定数据集为kitti&#xff0c;确定训练验证的batchsize。 3&#xff1a;提前定义好数据预处理&#xff0c;首先是几何变换&#xff0c;包括随机裁切等。 4&#xff1a;然后是外观变换&#xff0c;包括高斯滤波…

计算同列排斥力的一种可能方法

假设神经网络同列数字之间有一种排斥力&#xff0c;且这种排斥力也与距离的平方成反比。设0是环境&#xff0c;1是粒子&#xff0c;则两个1之间的排斥力就是距离平方的倒数。 考虑任意遥远的两个粒子之间都有排斥力&#xff0c;可以得到同列排斥力的计算方法为 如计算"01…