Rdkit|SMARTS语言应用

news2024/11/16 22:26:53

github:地址

文章目录

  • Rdkit|SMARTS语言应用
    • 子结构搜索HasSubstructMatch(patt)
    • 得到子结构序列`GetSubstructMatch`
    • 删除子结构`AllChem.DeleteSubstructs(m,patt)`
    • 取代基替换`AllChem.ReplaceSubstructs(m, patt, rep)`
    • 显示核心结构
    • 显示侧链结构 `Chem.ReplaceCore`
    • 分子拆分
      • Mol本身为多个分子组成
      • 通过分子键拆分骨架`Chem.FragmentOnBonds`
    • Murcho分解`MurckoScaffold.GetScaffoldForMol`
    • 參考

Rdkit|SMARTS语言应用

from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem import Draw
from rdkit.Chem.Scaffolds import MurckoScaffold

mol = Chem.MolFromSmiles("c1ccc(OC)cc1OC")
Chem.Draw.MolToImage(mol, size=(300,300))

子结构搜索HasSubstructMatch(patt)

  • quer:需要检索的片段
  • recursionPossible: (可选)
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

patt = Chem.MolFromSmarts("OC") # # 导入甲氧基子结构
flag = mol.HasSubstructMatch(patt)
if flag:
    print("molecu m contains group -OCH3")
else:
    print("molecu m don't contain group -OCH3")

得到子结构序列GetSubstructMatch

  • query: 需要查询的分子
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

smiles_list= ['CCCCC', 'CCNOCC', 'CSCCNC', 'COOCCNS', 'CSNNSP', 'CCCCS']
mol_list = [Chem.MolFromSmiles(x) for x in smiles_list]
Chem.Draw.MolsToGridImage(mol_list)

## 匹配特定模式的分子
query = Chem.MolFromSmarts('C*C')
match_list = [mol.GetSubstructMatch(query) for mol in mol_list]
print(match_list)
Chem.Draw.MolsToGridImage(mols=mol_list, highlightAtomLists=match_list, molsPerRow=3)

删除子结构AllChem.DeleteSubstructs(m,patt)

  • mol: 需要修饰的分子
  • query: 要用作子结构查询的分子
  • onlyFrags: (可选)如果设置了此切换,则只有在查询匹配原子所在的整个片段时,才会删除原子。默认值为0(删除原子,无论整个片段是否匹配)
  • useChirality:(可选)使用手性匹配子结构查询

del_mol = AllChem.DeleteSubstructs(mol, patt)
mols = [mol, del_mol]
Draw.MolsToGridImage(mols, molsPerRow=4, subImgSize=(200,200),legends=['' for x in mols])

取代基替换AllChem.ReplaceSubstructs(m, patt, rep)

  • mol: 待修饰的分子
  • query: 要用作子结构查询的分子
  • replacement: 用作替代物的分子
  • replaceAll: (可选)如果设置了此切换,则所有子结构匹配,查询将被替换为单个结果,否则每个结果都将包含单独的替代品。
  • replacementConnectionPoint: (可选)应该与之建立键的置换中原子的索引。
  • useChirality: (可选)使用手性匹配子结构查询

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]

for r in repsmis:
    r_mol = Chem.MolFromSmarts(r)
    res = AllChem.ReplaceSubstructs(mol, patt, r_mol)
    mols.extend(res)
    
smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]

for r in repsmis:
    r_mol = Chem.MolFromSmarts(r)
    res = AllChem.ReplaceSubstructs(mol, patt, r_mol, replaceAll=1)
    mols.extend(res)
    
smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

显示核心结构

Chem.ReplaceSidechains(m1,core) : 我们需要定义分子对象,骨架分子; 然后执行ReplaceSidechains函数,删除侧链就能得到骨架可视化。

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • useChirality: (可选)使用手性匹配子结构查询

mol = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceSidechains(mol,core)
Draw.MolToImage(tmp, size=(250,250))

显示侧链结构 Chem.ReplaceCore

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • matches: mol.GetSubstractMatch(…)返回的类型的匹配向量
  • replaceDummies: 切换替换与查询中的虚设匹配的原子
  • labelByIndex: 切换使用连接到的核心原子的索引标记连接点伪原子。
  • requireDummyMatch: 如果分子的侧链连接在没有用假人标记的点上,它将被拒绝(返回“None”)

m1 = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceCore(m1, core, labelByIndex=True)
print(tmp)
print(Chem.MolToSmiles(tmp))
Draw.MolToImage(tmp,size=(250,250))

分子拆分

Mol本身为多个分子组成

  • mol: 要使用的分子
  • asMols: 可选)如果提供了这一点并且为真,则碎片将作为分子而不是原子id返回。
  • sanitizeFrags: (可选)如果提供了这一点并且是真的,则碎片分子将在返回之前进行净化。
  • frags:(可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时结果将为mol.GetNumAtoms()长,并且将包含每个Atom的片段分配
  • fragsMolAtomMapping: (可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时的结果将是numFrags long,并且每个条目都将包含该片段中原子的索引:[(0,1,2,3),(4,5)]

rs = Chem.GetMolFrags(tmp, asMols=True)
print(len(rs))  # 2
smi0 = Chem.MolToSmiles(rs[0])
print(smi0)  # *CCBr
smi1 = Chem.MolToSmiles(rs[1])
print(smi1)  # [5*]C(=O)O

通过分子键拆分骨架Chem.FragmentOnBonds

  • mol:需要修饰的分子
  • bondIndices: 需要破坏键的索引
  • addDummies:切换虚设原子的添加以指示键断裂的位置
  • dummyLabels:用于提供用于假人的标签。每对中的第一个元素是用于替换键的beginAtom的伪元素的标签,第二个元素是用来替换键的endAtom的伪对象的标签。如果未提供,则用原子索引标记假人。
  • bondTypes: 用于提供在片段和虚设原子之间使用的键类型。如果未提供,则默认为单个。
  • cutsPerAtom: 用于返回在每个原子上进行的切割次数。

smi='C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N'
m = Chem.MolFromSmiles(smi)
Draw.MolToImage(m)

submols = m.GetSubstructMatches(Chem.MolFromSmarts('[!R][R]')) # R表示环上的原子,即匹配环上和非环上的原子
bonds_id = [m.GetBondBetweenAtoms(x,y).GetIdx() for x, y in submols] # 找到这两个原子之间的键
frags = Chem.FragmentOnBonds(m,bonds_id) # 切割得到碎片
smis= Chem.MolToSmiles(frags)
smis = smis.split('.')
mols=[m]
for smi in smis:
    mols.append(Chem.MolFromSmiles(smi))
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(300,300),legends=['' for x in mols], useSVG=True)

Murcho分解MurckoScaffold.GetScaffoldForMol

把分子中环结构提取出来,然后保留连接环结构的最少的键,如果该结构上的原子是双键连接,则保留双键,得到的结构称为Murcho骨架

m = Chem.MolFromSmiles('C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N')
tmp = MurckoScaffold.GetScaffoldForMol(m)
Draw.MolsToImage([m, tmp])

參考

https://blog.csdn.net/qq_36801966/article/details/106564664

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/728650.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue transition标签用法

transition标签 是Vue的内置动画标签,在插入/更新/移除DOM元素时,在合适的时候给元素添加样式类名(配合css样式使用,实现动画效果) 注意: 1.transition标签只能包含一个元素;如果里面写了多个…

如何从零开始学习自动化测试?终于找到靠谱的教程了

目录 前言 测试基础 Python基础 selenium appium requests unittest 项目实战: 总结: 前言 最近有几个小伙伴在后台给安静私信说,如何学习自动化,不知道如何入手?在网上看的资料都是乱七八糟的,每…

接口返回慢 图片加载失败问题

该图片是通过后端接口返回picUrl来给img的src赋值 但是后端接口响应较慢 导致html加载完 data也没赋到值 图片加载裂开 解决办法&#xff1a;img标签添加error事件获取错误信息回调 <img v-if"certificateUrl" :src"certificateUrl" class"certif…

三星强势进军车用半导体,2025年开始提供8英寸氮化镓代工服务

根据来自韩国商业报导的消息&#xff0c;三星电子最近在美国和韩国两地举办了一个专门针对行业人士的论坛&#xff0c;旨在展示2023年的三星晶圆代工技术。在这次活动中&#xff0c;三星宣布将在2025年开始提供面向消费者、数据中心及汽车应用的8英寸氮化镓&#xff08;GaN&…

如何关闭电脑自动更新

文章目录 前言Win10操作第一种&#xff1a;停止Windows Update第二种&#xff1a; 更新和安全暂停更新xxx天 Win11操作总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 关闭有关闭的好处&#xff1b;更新有更新的好处。谨慎操作&#xff01; 1、如…

123.【SpringBoot 源码刨析B】

SpringBoot-核心功能 (三)、SpringBoot核心功能1.配置文件1.1、properties1.2、yaml(1).yaml 简介(2).yaml 基本语法(3).数据类型(4).示列 1.3、配置提示 2.WEB 开发1.SpringMVC自动配置概览2.简单功能分析(1).静态资源访问&#xff08;1.1&#xff09;.静态资源目录&#xff0…

CentOS7安装后不能复制解决方案

CentOS7安装后无法使用鼠标选中&#xff0c;复制问题解决 yum命令安装gpm &#xff1a; yum install gpm* 运行systemctl enable gpm.servicere 添加到后台服务 启动&#xff1a; systemctl start gpm.service 查看启动状态: systemctl status gpm.service CentOS7服务使…

自制游戏引擎之shader预编译

shader预编译为二进制,在程序运行时候加载,可以提升性能,节省启动时间. 1. 采用google shaderc预编译与加载shader 1.1 下载代码 https://github.com/google/shaderc third_party文件里需要放依赖的第三方 因为电脑访问google的问题,无法通过shaderc-2023.4\utils\git-sync-de…

雅特力 AT32F437 配置RT-Thread 以太网(UDP/TCP Server)

好记性不如烂笔头&#xff0c;既然不够聪明&#xff0c;就乖乖的做笔记&#xff0c;温故而知新。 本文档用于本人对知识点的梳理和记录。 雅特力 AT32F437 配置RT-Thread 以太网(UDP/TCP Server) 目录 一、前言 二、ENV配置 三、结语 一、前言 ENV版本&#xff1a;v1.3.5 rt-…

【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(一)

论文&#xff1a;https://arxiv.53yu.com/pdf/2302.05543 代码&#xff1a;https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了&#xff0c;此篇是第一篇&#xff0c;摘录了一些论文内容。ControlNet 的原理极为朴实无华&#xff08;对每个block添加…

软件设计模式与体系结构-设计模式-行为型软件设计模式-状态模式

五、状态模式 概念 与策略模式类似&#xff0c;状态模式将不同状态下的行为封装在不同的类中&#xff0c;每个类代表一个状态 状态模式的组成 Context&#xff1a;定义了与客户程序的接口&#xff0c;它保持了一个concreteState的代表现在状态的实例State&#xff1a;定义了…

怎么用转转大师工具旋转PDF文件页面

有时候我们会在网上下载一下PDF格式文件&#xff0c;下载的PDF文件中可能会出现页面倒过来的情况&#xff0c;遇到这种情况我们需要先将PDF文件旋转到正确的角度才能继续阅读使用&#xff0c;那么有哪些方法可以快速旋转PDF页面呢&#xff1f; 可以使用转转大师工具快速旋转PD…

【知识产权-01】知识产权建设之专利那些事

在当今信息爆炸的时代&#xff0c;知识产权的保护变得尤为重要。专利是知识产权的一种重要形式&#xff0c;它是创新和发明的重要保护手段。几张图片向大家介绍专利的审查流程、不同方式的审查周期、专利检索以及技术交底书的基本知识&#xff0c;方便大家查阅。 审查流程 审查…

JavaWeb——HTTPS的加密流程

目录 一、使用对称加密 1、定义 2、加密/解密过程 二、使用非对称加密 1、对称加密弱点 2、非对称加密过程 &#xff08;1&#xff09;、定义 &#xff08;2&#xff09;、加密/解密过程 三、使用证书加密 1、非对称加密弱点 2、使用证书加密过程 &#xff08;1&am…

k8s概念介绍

目录 一 整体架构和组件基本概念 1.1 组件 1.1.1 master节点 1.1.2 node节点 1.1.3 附加组件 二 资源和对象 2.1 资源分类 2.2 元数据资源 Horizontal Pod Autoscaler&#xff08;HPA&#xff09; PodTemplate LimitRange 2.3 集群资源 namespace Node ClusterRo…

树状数组详解

问题引入 为了做到对区间的快速查询&#xff0c;可能你会想到前缀和来优化这个查询&#xff0c;这样区间查询的话是O(1)的复杂度。但如果发生了单点更新&#xff0c;在之后的所有前缀和都要更新&#xff0c;修改的时间复杂度是O(n)&#xff0c;并不能解决问题。 线段树 为了避…

自动化构建工具(Makefile/make)

什么是自动化构建工具 俗话说,会不会写Makefile可以从侧面表达出一个人是否具有完成大型项目的能力。试想一下&#xff0c;一个工程里面有数不尽的源文件&#xff0c;按照各自的&#xff0c;模块&#xff0c;类型放在不同的目录中&#xff0c;如果我要要去编译这个源文件&…

【真题解析】系统集成项目管理工程师 2021 年上半年真题卷(案例分析)

本文为系统集成项目管理工程师考试(软考) 2021 年上半年真题&#xff08;全国卷&#xff09;&#xff0c;包含答案与详细解析。考试共分为两科&#xff0c;成绩均 ≥45 即可通过考试&#xff1a; 综合知识&#xff08;选择题 75 道&#xff0c;75分&#xff09;案例分析&#x…

FEW-SHOT CLASS INCREMENTAL LEARNING

Few-shot class-incremental learning (FSCIL) Neural Collaps有以下四个性质&#xff1a; 在第t个session的时候优化 其中&#xff0c;

研究人员发现新的Linux内核 “StackRot “特权升级漏洞

报道称&#xff0c;Linux内核中出现了一个新的安全漏洞&#xff0c;可能允许用户在目标主机上获得更高的权限。 该漏洞被称为StackRot&#xff08;CVE-2023-3269&#xff0c;CVSS评分&#xff1a;7.8&#xff09;&#xff0c;影响Linux 6.1至6.4版本。迄今为止&#xff0c;没有…