教程学习:AutoQSAR

news2024/9/29 5:34:16

教程和练习文件从软件官网下载

内容:

1、拷贝教程提供的练习文件素材:

在软件的help中选择需要的教程,点击Copy to,可以将教程需要的文件拷贝到指定的文件夹里。点击Browse可以进行预览。

2、建立一个数值型的QSAR模型评估结合亲和力:

这个练习演示了如何用AutoQSAR面板来设置、建立、介绍和应用与FactoXa结合的一系列同源配体的QSAR模型。

FactoXa(也称为Factor Xa)是一种蛋白酶,属于凝血系统中的血浆蛋白。
它是凝血级联反应中的重要组成部分,起着关键的生理功能,
主要功能是将凝血级联反应中的凝血因子X(Factor X)转化为凝血酶(thrombin)。
凝血酶进一步将纤维蛋白原转化为纤维蛋白,使血液凝固。

2.1、准备QSAR建模的数据:

在使用数据之前,Maestro Project Table将会被使用来处理以uM为单位结合结合亲和力数据。

  • 单位的转换,IC50、EC50这些数据,多是以uM为单位,需要取对数转换为自由能标度。
  • 建议将数据集分隔成75%的训练集和25%的验证集。
  • 确保数据集大小合理。
  • 配体应该提供2D或3D结构,每个配体具有单一电离和互变异构状态。训练集、验证集和预测集中分子的状态应该保持一致。

操作:

点击File>Import Structures

 导入Fxa_1z6e+train.maegz文件

点击window>project Table

 这里IC50,半数抑制率的单位是浓度uM(1uM\L),教程里将其转化为mol\L并取对数。

点击Execute执行,获得pIC50的新结合能属性,点击close关闭Calculator。

2.2、建立QSAR模型:

点击Tasks>AutoQsar

点击run运行 ,任务开始后,run按钮左侧的图标开始旋转。

在window>job Monitor里可动态监测任务的状态。

 状态说明任务已经执行完成了。任务完成后,我们得到一个qzip文件,这个就使建立好的模型。

将其导入到AutoQSAR面板中的View model and make prediction。

2.3、对建立的模型进行检查:

 这个模型名字说明,是用KPLS算法(一种偏最小二乘回归的扩展)拟合molprint2D指纹,在第38次对数据集进行分割(分为训练集和学习集)时候获得的。

molprint2D(fingerprint)是一种分子描述符(descriptor)或指纹方法,
用于表示化学分子的结构特征。molprint2D指纹是基于分子的二维结构信息生成的。
不同的软件工具和编程库提供了molprint2D指纹的计算和应用功能,
如RDKit、ChemAxon等。

在Report Details中可以对模型进行可视化

 2.4、用建立的模型对未知分子进行预测:

导入预测的分子的操纵

点击File>Import Structures
Files of type选择Maestro
在Options中确保Import all structures and Replace Workspace被选择。
打开教程提供的fxa_predict.maegz

选中导入的所有分子

打开Tasks里的AtuoQSAR,操作如下图:

 等待任务完成。

2.5、对预测结果进行分析:

导入预测好的fxa_prediction-out.mae.gz文件,选中导入的所有小分子

打开Project Table面板,点击Plot>New Scatter Plot

X轴选择Binding Affinity,Y轴选择Pred fxa affinity(由AutoQSAR计算得到)

设置Color by --> fxa affinity Domain Alert,Color map --> Winter(blue-green).

选择Best fit line选项,得到图片:

预警报化合物(Alert compounds)是指具有潜在毒性、危险性或不良效应的化合物
,可以通过特定的结构或功能团来进行识别和警示。
这些结构或功能团通常与已知的毒性或不良反应相关联。

预警报化合物通常基于已知的毒性数据、结构-活性关系和毒理学知识进行开发和验证。
一些常见的预警报结构或功能团包括:

烷基化合物:具有高脂溶性、高毒性或致癌性的长碳链烷基化合物。

酚类化合物:具有毒性、过敏性或肝毒性的酚类结构。

烯醇类化合物:具有不稳定性、反应性或肝毒性的烯醇结构。

亲电芳香族化合物:具有致突变性、致畸形性或致癌性的芳香族化合物。

羧酸类化合物:具有肝毒性、肾毒性或免疫毒性的羧酸结构。

需要注意的是,预警报化合物并不代表一定具有毒性或不良效应,而只是作为可能的指示物,
需要进一步评估和确认。对于具体的化学品评估和风险评估,综合考虑多种因素,
包括毒性数据、剂量效应关系、曝露情况和用途等,才能做出准确的评估和决策。

去掉错误的小分子(绿色点,表示Alert compounds),再重新作图:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/737597.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

msvcr120.dll找不到是什么原因,怎样修复

msvcr120.dll的定义 msvcr120.dll是微软Visual C Redistributable软件包中的一个动态链接库文件。它是Microsoft Visual 所需的一个重要组件。这个文件主要用于支持和管理C语言编写的应用程序的运行。它包含了许多C的运行库函数和类,以便应用程序能够正常运行和调用…

2023-07-10:Kafka如何做到消息不丢失?

2023-07-10:Kafka如何做到消息不丢失? 答案2023-07-10: Kafka采用多种机制来确保消息的不丢失,其中包括副本机制、ISR(In-Sync Replicas)机制以及ACK机制等。 1.副本机制 Kafka通过副本机制来确保消息不…

【ElasticSearch】ES自动补全查询与Java接口实现

文章目录 1、安装拼音分词器2、自定义分词器3、completion suggester查询4、hotel索引库更新5、代码修改6、RestAPI实现自动补全7、需求:搜索框实现自动补全 自动补全就是当用户在搜索框输入字符时,我们应该提示出与该字符有关的搜索项。 1、安装拼音分词…

“小程序化”,一种创新的超级App开发模式

超级App是一种集成了多个功能和服务的移动应用程序,它在一个平台上提供了广泛的服务和体验。超级App通常具有大量的用户群体和高度活跃的用户社区,通过提供便利、多样化的功能,吸引用户在一个应用中完成多个任务和满足多个需求。 与传统的单…

postgresql 数据库 重建索引 所需时间测试

postgresql 数据库 重建索引 所需时间测试 文章目录 postgresql 数据库 重建索引 所需时间测试前言测试前准备重建索引前数据库状态测试计划重建索引命令测试开始1.先对表2进行测试2. 表3测试3. 表1测试 🌈后记 前言 众所周知,postgresql数据库使用久了…

【业务功能篇42】ThreadPoolTaskExecutor多线程处理耗时较高的数据接口

业务场景:当前业务模块中,有个查询产品直通率接口,随着数据量的递增,百万级数据,并且需要并表的情况下,那么返回数据就会开始变慢,而在数据层方面,已经比较难去做进一步的sql优化&am…

一致性哈希算法小结

在实际生产应用中,经常会设置多台服务器共同组成一个集成对外提供服务,为了确保合理的分配来自客户端的请求,我们会采取负载均衡的策略。例如采用「轮询」的方式让每个节点都能公平的接收到请求;采用「加权轮询」的方式让硬件配置…

MySQL-MySQL分组查询每组最新的一条数据

方法一: 1055 - Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘se_jck的博客-CSDN博客 这个错误是由于 MySQL 的新版本中默认开启了ONLY_FULL_GROUP_BY模式,即在 GROUP BY 语句中的 SELECT 列表中&am…

[MMDetection]测试模型

以下是基于MMdetection3.10版本 1、简单测试模型 测试模型一般使用tools中的test.py,一般使用方式 python tools/test.py config文件路径 权重文件路径 可以通过--show 来以gui展示检测结果 python tools/test.py config文件路径 权重文件路径 --show 可以通过--s…

【Linux】部署Prometheus + Grafana简介、监控及设置告警详细操作(多种方式安装,亲测无问题)

🍁博主简介 🏅云计算领域优质创作者   🏅华为云开发者社区专家博主   🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 文章目录 一、环境准备二、部署 Prometheus&am…

优思学院|精益管理入门书籍有哪些推荐?

精益管理是一门易学难精的学问,如果对其基本原则了解不正确,可能会误入歧途,不但不能发挥精益工具的威力,甚至会令企业走向错误的方向,反带来更多的浪费和捐失。以下将介绍几本经典的书籍,可以让你有效地、…

python简单使用【mac-ide:pycharm】

小白实用快捷键记录 一、Mac下安装并配置python3开发环境二、python学习三、pycharm常用快捷键记录 一、Mac下安装并配置python3开发环境 点我查看python及pycharm下载安装、环境配置 二、python学习 不是很推荐,想系统学习的同学可以做个参考: Pytho…

排序之玩转qsort函数——【C语言】

说起排序,我们会想起许多算法,在之前的博客中我也写到过,比如:冒泡排序法、快速排序法、选择排序法等等。其实在C语言中一直有一个可以将数组中的内容进行排序的函数且功能完善内容齐全的库函数——qsort函数。今天就让我们来探索…

OpenPCDet系列 | 8.2 nuScenes数据集的eval流程

0. eval转换的目标 模型的训练和测试过程输出结果是不一样的,对于训练过程是为了构建损失函数来进行训练,而对于测试过程是为了对object进行预测生成预测内容。下面以VoxelNeX检测器的类代码可见,training和testing将会输出两个内容。 clas…

C++数据结构笔记(7)——队列的顺序结构实现

1.队列&#xff0c;和现实生活中的规则类似&#xff0c;先进先出 2.队尾只允许元素进入&#xff0c;队头只允许元素退出 3.用数组来实现队列的顺序存储&#xff0c;无论哪一段都可以作为队头或者队尾 SeqQueue.h头文件 #ifndef SEQQUEUE_H #define SEQQUEUE_H #include<…

仿大众点评项目 —— Day02【优惠券秒杀、分布式锁】

❤ 作者主页&#xff1a;欢迎来到我的技术博客&#x1f60e; ❀ 个人介绍&#xff1a;大家好&#xff0c;本人热衷于Java后端开发&#xff0c;欢迎来交流学习哦&#xff01;(&#xffe3;▽&#xffe3;)~* &#x1f34a; 如果文章对您有帮助&#xff0c;记得关注、点赞、收藏、…

Java字符串类

string类的理解(以JDK8为例说明) 1.1的声明 public final class String implements java.io.Serializable&#xff0c; Comparable<String>&#xff0c; CharSequence final:String是不可被继承的 Serializable:可序列化的接口。凡是实现此接口的类的对象就可以通过…

建筑施工脚手架安全技术统一标准

为统一建筑施工脚手架设计、施工、使用及管理&#xff0c;做到技术先进、安全适用、经济合理&#xff0c;制定本标准。 本标准适用于房屋建筑工程和市政工程施工用脚手架的设计、施工、使用及管理。 建筑施工脚手架的设计、施工、使用及管理&#xff0c;除应符合本标准外&…

第一百零二天学习记录:数据结构与算法基础:初识数据结构与算法

管理系统模型&#xff08;仓库管理系统&#xff09;—顺序表 操作对象之间的关系&#xff1a;线性关系 数据结构&#xff1a;线性数据结构、线性表 &#xff08;例如&#xff1a;学生成绩管理系统、人事管理系统、仓库管理系统、通讯录等。&#xff09; 操作对象&#xff1a;若…

OWASP 定义的大模型应用最常见的10个关键安全问题

7月15日之前入驻华为云&#xff0c;可参与Check抽奖活动&#xff0c;抽奖活动在文末 1. 《OWASP 大模型应用最常见的10个关键安全问题》项目简介&#xff08;OWASP TOP10 LLMs Project&#xff09; *OWASP Top 10 for Large Language Model Applications OWASP 大模型应用程序…