计算机辅助药物设计AIDD-小分子-蛋白质|分子生成|蛋白质配体相互作用预测

news2024/12/24 10:28:23

文章目录

  • 计算机辅助药物设计AIDD【小分子专题】
    • AIDD概述及药物综合数据库学习
    • 机器学习辅助药物设计
    • 图神经网络辅助药物设计
    • 自然语言处理辅助药物设计
    • 药物设计与分子生成
  • 计算机辅助药物设计【蛋白质专题】
    • 蛋白质数据结构
    • 激酶-Kinase相似性学习
    • 基于序列的蛋白质属性预测
    • 基于结构的蛋白质属性预测
    • 蛋白质-配体相互作用预测PLI

计算机辅助药物设计AIDD【小分子专题】

AIDD概述及药物综合数据库学习

  1. 人工智能辅助药物设计AIDD概述
  2. 安装环境
    1. anaconda
    2. vscode
    3. 虚拟环境
  3. 第三方库基本使用方法
    1. numpy (数据计算工具)
    2. pandas (数据清洗工具)
    3. matplotlib (结果可视化绘图工具)
    4. requests (数据库爬虫工具)
  4. 多种药物综合数据库的获取方式
    1. KEGG(requests爬虫)
    2. Chebi(libChEBIpy)
    3. PubChem(pubchempy / requests)
    4. ChEMBL(chembl_webresource_client)
    5. BiGG(curl)
  5. DeepChem集成MoleculeNet数据库介绍及下载

机器学习辅助药物设计

  1. 机器学习理论知识

    1. 机器学习种类:
      1. 监督学习
      2. 无监督学习
      3. 强化学习
    2. 典型机器学习方法
      1. 决策树
      2. 支持向量机
      3. 朴素贝叶斯
      4. 神经网络
      5. 卷积神经网络
    3. 模型的评估与验证:准确率、精确率、召回率、F1分数、ROC曲线、AUC计算,平均绝对误差、均方差、R2分数、可释方差分数,交叉验证等
    4. sklearn工具包基本使用
  2. rdkit工具包的基本使用

  3. RDKit安装

    1. 化合物编码方式和化合物相似性理论知识
    2. 基于RDKit的分子读写
    3. 基于RDKit的分子绘制
    4. 基于RDKit的分子指纹与分子描述符
    5. 基于RDKit的化合物相似性与子结构
    6. 基于 RDKit 与 Python3 的构象与 RMSD 计算
  4. 项目实战

    1. 基于 Pytorch 和 RDKit 建立 QSAR 模型
    2. 基于 scikit-learn 将 pytorch 用于 QSAR 模型构建
    3. 项目实战1:基于ADME和Ro5的分子筛选
    4. 项目实战2:基于化合物相似性的配体筛选
    5. 项目实战3:基于化合物相似性的分子聚类
    6. 项目实战4: 基于机器学习的生物活性预测
    7. 项目实战5:基于机器学习的分子毒性预测

图神经网络辅助药物设计

  1. 图神经网络基础知识
    1. 框架介绍: PyG,DGL,TorchDrug
    2. 图神经网络消息传递机制
    3. 图神经网络数据集设计
    4. 图神经网络节点预测、图预测任务和边预测任务实战
  2. 项目实战1:基于图神经网络的分子毒性预测
    1. SMILES分子数据集构建PyG图数据集
    2. 基于GNN进行分子毒性预测
  3. 项目实战2:基于图神经网络的蛋白质-配体相互作用预测
    1. 蛋白质分子图形化,构建PyG图数据集
    2. 基于GIN进行网络搭建及相互作用预测

自然语言处理辅助药物设计

  1. 自然语言处理概述
    1. 文本类语言的向量表示方法
    2. Encoder-Decoder模型
    3. 循环神经网络模型
    4. Seq2seq模型
    5. Attention注意力机制
    6. Transformer模型
  2. 项目实战
    1. 基于无监督的Seq2Seq模型进行分子表示学习
    2. 基于Transformer模型的反应表示方法
    3. 基于自然语言处理的反应分类任务
    4. 基于BERT模型的反应产量预测任务

药物设计与分子生成

  1. 分子生成模型概述
    1. 循环神经网络RNN
    2. 变分自动编码器VAE
    3. 生成对抗网络GAN
    4. 强化学习RL
  2. 基于RDKit提取反应规则预测分子生成
    1. 基于 RDKit 处理化学信息学中的反应方程式
    2. 基于 RDKit 绘制化学反应
    3. 基于 RDKit 和 SMARTS 的化学反应处理
    4. 基于RDKit的化学反应指纹与化学反应相似度计算
    5. 基于 RDKit 通过 SMARTS 定义反应模式来生成反应产物
  3. 基于深度学习的分子生成
    1. 基于图数据的小分子化合物生成模型
    2. 基于MolGAN的分子生成
    3. 分子合成可行性评估

计算机辅助药物设计【蛋白质专题】

蛋白质数据结构

  1. 数据库介绍与相关数据爬取
    1. PDB数据库
    2. UniProt数据库
    3. KLIFS数据库
  2. 【基于RDKit的蛋白质基本操作】
    1. 基于 RDKit 的氨基酸序列转换为 SMILES
    2. 基于 RDKit 的肽和核酸序列转换分子 Mol 对象
    3. 多肽 HELM 字符串格式与分子 Mol 格式间的转换
    4. 从 ChEMBL 数据库提取大分子 HELM 单体(XML 转换为 DataFrame 并搜索部分结构)
    5. 基于RDKit的药效团特征与可视化
  3. 【基于RDKit的药效团处理】
    1. RDKit 中的药效团特征
    2. RDKit:可视化药效团(Pharmacophore)
    3. RDKit | 基于 RDKit 从分子中提取 3D 药效团特征
    4. RDKit | 基于 RDKit 计算 3D 药效团指纹
  4. 【基于RDKit的骨架 (Scaffold)】
    1. RDKit | 基于 RDKit 操纵分子结构(骨架转换)
    2. RDKit:化合物骨架分析(基于 Python3)
  5. 【基于RDKit的片段 (Fragments)处理】
    1. RDKit 中的 RECAP 进行分子裂解
    2. RDKit:基于 RECAP 生成片段
    3. RDKit | 可视化重要片段
    4. RDKit | 基于片段的分子生成(骨架 A + 骨架 B)
    5. RDKit | 基于多片段的分子生成(骨架 A + 骨架 B + 骨架 C)

激酶-Kinase相似性学习

  1. 激酶基本理论介绍
  2. Kinase相似性:序列
  3. Kinase相似性:Kinase口袋(KiSSim指纹)
  4. Kinase相似性:交互指纹
  5. Kinase相似性:配体配置文件
  6. Kinase相似性:比较不同的view

基于序列的蛋白质属性预测

  1. 多重序列对比
  2. 基于蛋白质序列的深度学习和机器学习任务
  3. 预测突变对TEM-1β-内酰胺酶蛋白的影响
  4. 基于蛋白质的二级结构预测残基的属性
  5. 通过蛋白质的溶化温度预测蛋白质的稳定性

基于结构的蛋白质属性预测

  1. 蛋白质结构数据处理
  2. 基于RDKit的蛋白质动态图构建
  3. 基于几何感知关系图神经网络(GearNet)及其边缘消息传递的扩展(GearNet-Edge)的蛋白质结构表示模型

蛋白质-配体相互作用预测PLI

  1. 结合位点相似性和脱靶预测
  2. 结合位点预测
  3. 蛋白质-配体对接
  4. 蛋白质-配体相互作用
  5. NGLView高级教程
  6. 分子动力学模拟
  7. 分析分子动力学模拟
  8. 基于图神经网络的蛋白质-配体相互作用预测(分类任务)
  9. 基于机器学习的分子对接来预测蛋白质-配体的结合亲和力(回归任务)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1284155.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决xshell连接诶树莓派中文乱码的问题

系统版本 解决办法 在根目录下找到 /etc/profile 修改profile文件,添加以下两行.以便重启之后也能生效: export LANGzh_CN.utf8 export LC_ALLzh_CN.utf8注意: /etc/profile的修改需要root权限才能修改! 在xshell的编码格式改为UTF-8

一次性客户的笔记总结

创建一次性客户,系统会给出一个客户编码; 每次记账的时候,在录入过账码及客户编码后,点击回车,都需要录入这个客户的详细信息(比如 客户名称等) 一次性客户的信息存储在BSEC表中,这种…

飞致云1panel + 雷池WAF

可能有许多人都有这个需求:为自己的个人站点套上WAF,增加安全性,本文将介绍如何将1panel面板深度结合长亭雷池防火墙,实现为个人站点套上WAF并且自动续签ssl证书。 前提条件: 服务器IP已绑定域名 完整的1panel环境 …

springboot简单集成上传和下载(带页面)

来学习一下文件上传和下载 一、页面开发 整体思路 登录页 主页 二、库表设计 SET FOREIGN_KEY_CHECKS0;-- ---------------------------- -- Table structure for t_files -- ---------------------------- DROP TABLE IF EXISTS t_files; CREATE TABLE t_files (id int(11) N…

【五分钟】熟练使用numpy.cumsum()函数(干货!!!)

引言 numpy.cumsum()函数用于计算输入数组的累积和。当输入是多维数组时,numpy.cumsum()函数可以沿着指定轴计算累积和。 计算一维数组的累计和 代码如下: # 计算一维数组的累计和 tmp_array np.ones((4,), dtypenp.uint8) # [1, 1, 1, 1] print(&…

java--接口概述

1.认识接口 ①java提供了一个关键字interface,用这个关键字我们可以定义出一个特殊的结构:接口。 ②注意:接口不能创建对象;接口是用来被类实现(implements)的,实现接口的类称为实现类。 ③一个类可以实现多个接口(接…

1、Spring基础概念总结

Spring概述: Spring体系结构 IOC的概念和作用 耦合指的是对象之间的依赖关系,耦合越小越好 以jdbc为例 通过反射来注册驱动,那么会造成驱动名称写死在程序当中,这种结果显然是不太合理的通过配置文件的形式可以解决这种耦合问…

微服务--一篇入门kubernets

Kubernetes 1. Kubernetes介绍1.1 应用部署方式演变1.2 kubernetes简介1.3 kubernetes组件1.4 kubernetes概念 2. kubernetes集群环境搭建2.1 前置知识点2.2 kubeadm 部署方式介绍2.3 安装要求2.4 最终目标2.5 准备环境2.6 系统初始化2.6.1 设置系统主机名以及 Host 文件的相互…

成为AI产品经理——模型稳定性评估(PSI)

一、PSI作用 稳定性是指模型性能的稳定程度。 上线前需要进行模型的稳定性评估,是否达到上线标准。 上线后需要进行模型的稳定性的观测,判断模型是否需要迭代。 稳定度指标(population stability index ,PSI)。通过PSI指标,我们可以获得不…

Python类型注解必备利器:typing模块解读指南

更多资料获取 📚 个人网站:ipengtao.com 在Python 3.5版本后引入的typing模块为Python的静态类型注解提供了支持。这个模块在增强代码可读性和维护性方面提供了帮助。本文将深入探讨typing模块,介绍其基本概念、常用类型注解以及使用示例&am…

ssm农业信息管理系统源码和论文

摘 要 网络的广泛应用给生活带来了十分的便利。所以把农业信息管理与现在网络相结合,利用java技术建设农业信息管理系统,实现农业信息管理的信息化。则对于进一步提高农业信息管理发展,丰富农业信息管理经验能起到不少的促进作用。 农业信息…

JVM 运行时内存(三)

Java 堆从 GC 的角度还可以细分为: 新生代(Eden 区、From Survivor 区和 To Survivor 区)和老年代。 1. 新生代 是用来存放新生的对象。一般占据堆的 1/3 空间。由于频繁创建对象,所以新生代会频繁触发MinorGC 进行垃圾回收。新生代又分为 Eden 区、ServivorFrom、…

分享全球顶尖的AIGC文生图资源

1 引言 人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。文生图技术作为AIGC的一个重要分支,展现了人工智能在视觉创作领域的巨大潜力。发展至今已经有很多AI文生图平台,这是一次革命性的突破&#xf…

详解Hotspot的经典7种垃圾收集器原理特点与组合搭配

# 详解Hotspot的经典7种垃圾收集器原理特点与组合搭配 HotSpot共有7种垃圾收集器,3个新生代垃圾收集器,3个老年代垃圾收集器,以及G1,一共构成7种可供选择的垃圾收集器组合。 新生代与老年代垃圾收集器之间形成6种组合&#xff0c…

代码写完直接调试!IDEA插件还能这么用

IDEA是一款功能强大的集成开发环境(IDE),它可以帮助开发人员更加高效地编写、调试和部署软件应用程序。我们在编写完接口代码后需要进行接口调试等操作,一般需要打开额外的调试工具。 今天给大家介绍一款IDEA插件:Api…

Apache Sqoop使用

1. Sqoop介绍 Apache Sqoop 是在 Hadoop 生态体系和 RDBMS 体系之间传送数据的一种工具。 Sqoop 工作机制是将导入或导出命令翻译成 mapreduce 程序来实现。在翻译出的 mapreduce 中主要是对 inputformat 和 outputformat 进行定制。 Hadoop 生态系统包括:HDFS、Hi…

单片机系统

我们来看单片机 的例子,读者可能会担心单片机(又称MCU,或微控制器) 过于专业而无法理解。完全没必要!在这里我们仅借它谈论一下有关时间的话题,顺带提一下单片机系统的概念。 单片机顾名思义是集成到一个芯…

【五分钟】熟练使用numpy的histogram函数(干货!!!)

histogram函数重要参数详解 def histogram(a, bins10, rangeNone, normedNone, weightsNone, densityNone):...位置参数a: The histogram is computed over the flattened array.(源码对参数a的解释) 从源码对参数a的解释来看,参…

[树莓派3B+][内核版本6.1]的linux内核编译+替换 (超详细)

学习Linux的内核编译,我使用的是x86 64位的18.04的ubuntu-linux虚拟机: 目录 树莓派的Linux内核源码安装 操作系统的启动过程 & Bootloader 单片机裸机:C51,STM32 X86,Intel:windows 嵌入式产品:…

深圳市左下右上百度坐标

爬取百度POI的时候,别人的代码中有提到左下,右上坐标,但是没有说从哪里来,而且还是百度的坐标。 经纬度:左下角,右上角:113.529103,37.444122;115.486183,38.768031 墨卡托坐标:左下角,右上角:12638139.45,…