P450Rdb: CYP450数据库--地表最强系列--文献精读24

news2024/11/29 1:37:43
P450Rdb: A manually curated database of reactions catalyzed by cytochrome P450 enzymes

P450Rdb: 一个人工整理的细胞色素P450酶催化反应数据库

http://www.cellknowledge.com.cn/p450rdb/

还有一篇类似CYP450综述-20年-地表最强系列-文献精读-4

要点:
  • P450Rdb 汇编了一个包含超过1600种由P450酶催化的反应的综合目录。

  • P450Rdb 收集了来自200多个物种的590多种P450酶。

  • P450Rdb 根据化学反应类型和反应位点系统地组织了所有反应。

  • P450Rdb 提供了一个关于P450酶及其相关反应的用户友好界面。

  • P450Rdb 有助于合成生物学、药理学和化学工业的研究。

摘要
引言

细胞色素P450酶(P450s)被公认为世界上最具多样性的催化剂,在所有生物界的众多生物代谢和生物合成过程中发挥着至关重要的作用。尽管数据库中有大量的P450基因(超过300,000个),但只有少部分(不到0.2%)经过功能表征。

目标

为了提供一个包含丰富P450酶及其对应反应信息的便捷平台,我们介绍了P450Rdb数据库,这是一个人工整理的资源,汇编了文献支持的由P450酶催化的反应。

方法

所有P450酶和反应均通过文献和已知数据库人工整理。随后,将P450反应根据其化学反应类型和位点进行组织和分类。网站使用HTML和PHP语言开发,数据存储使用MySQL服务器。

结果

当前版本的P450Rdb目录包含超过1600种反应,涉及200多种物种的590多种P450酶。此外,它提供了一个用户友好界面,包含全面的信息,使用户能够轻松查询、浏览和分析P450酶及其对应的反应。P450Rdb可免费访问,网址为:Home。

结论

我们相信,这个数据库将显著促进P450酶的结构和功能研究,从而推动天然产物合成、药物工程、生物技术应用、农业和作物改良以及化学工业领域的进步。

关键词

细胞色素P450酶 反应 底物 产物 数据库

引言

细胞色素P450(CYP,P450s)是一类使用血红素作为辅因子以催化单加氧酶反应的超家族酶。它们存在于所有生物界,包括植物、动物、真菌、原生生物、细菌、古菌,甚至病毒中[1],[2]。在这些酶中,植物P450s相比于动物和微生物已发生了显著的多样化[3],[4]。它们在植物界内表现出广泛的丰度和功能多样性,在天然产物的生物合成途径中起着关键作用,为植物的可塑性提供了分子基础[3],[5]。

累积的研究表明,P450s具有显著的催化能力,能够促进超过20种氧化还原反应类型,包括羟基化、亚砜化、氧化、环氧化、脱羧和环化[6]。这些反应涉及各种底物和产物,包括萜类、生物碱、脂肪酸、类固醇、抗生素和外来物质,使P450s成为自然界最具多样性的生物催化剂[7],[8],[9]。在体内,P450s在细胞代谢、天然产物的生物合成与降解、药物和环境污染物的代谢以及植物的化学防御中发挥着重要作用[3],[10],[11],[12],[13]。由于其多样的催化能力,P450s在合成生物学、生物技术和农业应用、药物、环境修复和环境监测以及化学工业中引起了极大的兴趣[14],[15],[16],[17],[18],[19],[20],[21]。

近年来,“组学”技术和合成生物学的进步对P450s的识别和功能解释作出了重大贡献[22],[23],[24]。然而,某些挑战仍然存在,如晶体结构的识别、异源活性的增强和酶工程[25],[26],[27],[28]。此外,虽然已经开发了许多数据库来记录、管理和分析大量的P450s数据(表S1),如细胞色素P450主页[29]、人类细胞色素P450(CYP)等位基因命名委员会主页[30]、P450含有系统目录[31]、拟南芥P450数据库[32]、SuperCYP数据库[33]、昆虫P450网站(http://p450.antibes.inra.fr/)、PROMISE中的P450(http://metallo.scripps.edu/PROMISE/P450.html)、真菌细胞色素P450数据库[34]、细胞色素P450工程数据库[35]、PCPD数据库[36]和植物细胞色素P450数据库[3],一些综述文章也总结了与P450相关的知识,包括其蛋白质结构、功能、相关催化反应以及与药物的相互作用(表S2)[37],[38],[39],[40]。这些资源已经识别并收集了超过30万个P450基因,但其中功能表征的不到0.2%[41],[42],[43]。

最近,专注于植物P450s催化功能的数据库已经出现,例如PCPD数据库[36]收集了181个植物P450s及其序列、结构和反应信息,来源于文献和其他数据库。植物细胞色素P450数据库根据文献来源提供了一个已知能代谢一种或多种底物的CYPs的广泛汇编[3]。这些资源为植物P450s的功能解释和合成生物学提供了重要的参考数据。然而,据我们所知,仍然缺乏一个专门的资源来存储和整合所有生物体的P450s的催化功能和反应。在此,我们介绍了P450Rdb数据库,这是一个人工整理的资源,重点关注文献支持的由P450酶催化的反应。当前版本的P450Rdb记录了超过590个P450s,超过1600种反应(图1a)。我们希望通过这个数据库提供一个包含丰富信息的便捷界面,以加速天然产物合成和药理学研究(图1b)。

图1. P450Rdb的数据和网站。 a. 数据库中597个P450酶的系统发育树。 b. P450Rdb网站的主页。

材料和方法
数据收集

所有P450酶和反应都通过文献(截至2023年4月之前)和两个已知数据库(包括PCPD数据库和TriForC数据库)人工整理(图2)。最初,通过使用“P450”、“CYPs”、“细胞色素P450”、“单加氧酶”、“反应”和“P450酶”等关键词在PubMed、bioRxiv和Google Scholar上进行综合搜索。检索到的文献随后由专家整理人员进行初步检查,以消除误报文献。只有实验支持的由P450酶催化的反应才被包括在P450反应数据库中。收集的条目经过至少两位独立专家整理人员的严格评估和双重检查。任何出现的差异都通过与第三位专家整理人员讨论来解决,以确保达成共识。此外,P450反应数据库还整合了来自PCPD数据库的181个反应[36]和来自TriForC数据库的228个反应[45]。

图2. P450Rdb的数据收集、组织和注释。

组织

首先,我们根据化学反应类型将所有反应分为六类:氧化反应、还原反应、氧化还原反应、结合反应、分解反应和取代反应(图2)。氧化反应是指分子、原子或离子在化学反应中失去电子。相反,还原反应是指反应物获得电子。在氧化还原反应中,反应的一部分通过获得电子降低其氧化数,而另一部分则通过失去电子发生氧化。结合反应是指两个底物结合形成一个单一产物的过程。另一方面,分解反应是指一个单一反应物分解成两个或更多产物的过程。最后,取代反应是指分子中的一个原子、离子或原子团被另一个原子、离子或原子团替换的过程。此外,除了考虑化学反应类型外,我们还根据涉及的具体反应位点对反应进行了区分(图2)。这些位点包括功能基团如单键CH3、单键CH、单键NH和化学键如单键CH-CH、单键CH-OH、单键CH-Br。总共,我们识别了41个不同的反应位点,以全面分类所有反应。

注释

为了在各种文献来源中提到的P450酶和化合物(底物/产物)之间建立一致性,我们使用了权威参考数据库进行映射(图2)。所有的P450酶都映射到UniProt数据库(Uniprot ID)[46]和NCBI基因数据库(Entrez ID)[47],底物/产物则映射到PubChem数据库(PubChem CID和SID)[48]。关于P450酶的详细信息,我们从UniProt数据库获取蛋白质名称、物种信息和序列。考虑到许多P450酶缺乏实验验证的晶体结构,我们还提供了访问AlphaFold数据库中预测蛋白质结构的超链接。关于底物/产物的详细信息,我们从PubChem数据库收集了相应的分子式、Smiles表示法和结构。这些全面的映射和从权威资源获取的数据确保了数据库中信息的标准化和可靠性。

架构

首先,我们采用HTML + CSS + JavaScript框架进行前端网页开发(图3)。这三种编程语言相互协作,为用户提供清晰的内容、简洁的界面和丰富的交互应用。网站采用的自响应布局也兼容PC和移动设备的不同场景。同时,我们采用PHP + MySQL架构进行后端开发,可以根据不同的前端访问请求运行不同的脚本,并动态生成相应的返回数据。这个过程具有高数据安全性和快速查询速度。此外,我们采用Smarty模板引擎来分离前端和后端,将逻辑程序与外部内容分离,方便后期管理和维护。平台的网络服务由EngineX(Nginx)提供。

图3. P450Rdb的架构。

结果
数据统计

当前版本的P450Rdb记录了1692个由同行评审文献支持、人工整理的反应,涉及890种化合物(底物/产物),来自200多种物种的597个P450s(图4a)。这些反应涉及1225种作为底物或产物的化合物,并由超过200种物种的P450s催化(图4a)。反应类型的分布如图4b所示,包括1507个氧化反应,82个还原反应,61个分解反应,29个结合反应和1个取代反应。图4c显示了反应位点的分布,突出显示大多数反应发生在CH3(519个条目)和CH2(486个条目)功能基团上。此外,超过100个反应发生在CH-CH键和芳香环的CH基团上。图4d显示了P450s的生物体分布,植物占P450s的半数以上(342/597),其次是微生物(137个P450s)和动物(118个P450s)。图4e展示了参与P450s催化反应的化合物分布,表明有836种产物和570种底物。值得注意的是,181种化合物既作为产物又作为底物。图4f展示了P450s的序列长度分布,超过80%的P450s的序列长度在450到550个氨基酸之间。

图4. P450Rdb的数据统计。a P450Rdb数据库的总体统计。b 反应类型的分布。c 反应位点的分布。d P450s的生物体分布。e 化合物的分布。f P450s的序列长度分布。

数据查询和结果展示

P450Rdb提供了一个用户友好的网页界面,允许用户轻松查询P450s及其催化的反应。导航栏提供了快速访问各个页面的选项,包括“搜索”、“Blast”、“浏览”、“下载”和“统计”。P450Rdb的“搜索”页面提供了两种搜索选项:“蛋白质搜索”,用户可以输入P450符号/Entrez ID/UniProt ID;以及“化合物搜索”,用户可以输入底物或产物名称/PubChem CID/分子式。“结果”页面的搜索结果总结在一个表格中(图5)。通过点击“更多”,用户可以在“详细信息”页面访问特定蛋白质条目的详细信息。“详细信息”页面提供了与反应和P450s相关的全面信息,包括参与反应的P450蛋白质的详细信息(如“P450符号”、“P450名称”、“基因ID”、“UniProt IDs”、“物种”、“Txid”、“P450蛋白质结构”和“蛋白质序列”)、反应信息(包括“反应类型”、“反应位点”和方程式)、底物/产物信息(如“底物/产物名称”、“底物/产物化学式”、“底物/产物PubChem CID”、“底物/产物PubChem SID”、“底物/产物Smiles”和“底物/产物结构”)以及与条目相关的参考文献(包括“PMIDs”、“标题”、“期刊”和发表年份)。此外,P450Rdb还提供了一个Blast网络服务器用于序列相似性搜索。用户可以在查询窗口输入查询的P450蛋白质(Blastp)或核苷酸(Blastx)序列。“结果”表格显示了Blast软件的三个指标(相似性、E值、比对得分)以帮助用户评估序列的相似性。总之,P450Rdb提供了一个全面且用户友好的平台,用于查询P450s及其反应,方便用户高效获取相关信息。

图5. P450Rdb的搜索页面、结果页面和详细信息页面。

Blast安装及使用-Blast+2.14.0(bioinfomatics tools-001)

“浏览”、“下载”、“统计”、“帮助”和“提交”页面

P450Rdb提供了“浏览”页面,通过选择特定的物种、反应类型和反应位点,帮助快速浏览某一类别的反应和P450s。然后,用户可以通过点击“结果”表中的每个条目来查询详细信息。“下载”页面使用户能够轻松下载P450s、反应、化合物列表和序列数据(fasta文件),用于非营利目的。“统计”页面使用各种统计图形展示最新版本P450Rdb中的详细数据。“帮助”页面为用户提供逐步教程,指导用户操作、查询和浏览P450Rdb数据库。此外,P450Rdb的收集不可避免地未能涵盖所有由P450s催化的反应。因此,我们提供了一个“提交”界面,以确保研究人员可以提交未记录在数据库中的新的P450s催化反应。

讨论

P450Rdb提供了一个宝贵的平台,用于存储、整合和分析P450s及其对应的反应,以加速P450s的识别和应用研究。然而,它仍然存在一些局限性。首先,由于大多数记录的P450s缺乏明确的酶动力学实验,P450Rdb不包括酶的动力学常数,如Km、Ks和Kcat。其次,数据库不提供与P450s催化反应相关的具体条件的信息。这是因为大多数研究主要集中在P450s的识别和生物功能表征上,而没有深入探讨催化反应的详细信息。

尽管如此,我们致力于通过不断积累P450s及其反应的新功能证据和成果来解决这些局限性。我们将定期更新P450Rdb,通过收集文献中的P450s及其对应的反应。此外,我们将努力收集关于动力学常数和相关反应条件的信息,以扩展数据库的覆盖范围。此外,我们还计划通过收集和整合涉及P450s的生物合成途径,扩大P450Rdb的范围,从而促进与P450s相关的功能解释和合成生物学研究。

结论

总而言之,P450Rdb目前记录了超过1600个反应,涉及来自200多种物种(包括植物、动物、真菌、细菌和古菌)的约600个P450s。同时,它提供了一个便捷的界面,包含大量信息,帮助查询、浏览和分析P450s及其对应的反应。我们相信,这个数据库可以大大促进P450s的结构和功能研究,并有助于合成生物学、生物制药、环境科学和酶工程的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1825168.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Postman简介

目录 1.概述 2.诞生背景 3.历史版本 4.安装和卸载 5.菜单和菜单项 6.使用 7.应用场景 8.示例 8.1.简单的GET请求 8.2.POST请求提交数据 8.3.查询参数 9.未来展望 10.总结 1.概述 Postman是一款用于API开发、测试和文档管理的综合性工具。允许开发者和测试人员创建…

1.PyQt6库和工具库QTDesigner安装

1.安装PyQT6和pyqt6-tools 1. PyQt6库是PyQt的开发库 2.pyqt6-tool时QTDesigner设计器工具支持库 pip install PyQt6 pip install pyqt6-tools 2.在Pycharm中配置外部工具QTDesigner和PYGIC 配置外部工具QTDesigner 1. QTDesigner是QT界面设计器 2.打开Pycharm->Settin…

牛客仓鼠的鸡蛋

分析一下判断语句 如果能放就输出位置 不能放就输出-1 不能放的条件是最大值小于要放的鸡蛋数量,线段树维护最大值 放的位置用线段树二分 每个篮子不能放超过k堆鸡蛋,记录一下每个篮子放的次数,次数等于k后给最大值附上0即可 // Proble…

Python连接Redis(简单连接、连接池连接、存取数据示例)

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

【2024最新精简版】MyBatis面试篇

文章目录 mybatis内部实现过程mybatis延迟加载请说说MyBatis的工作原理mybatis接口里的方法,参数不同时能重载吗mybatis分页插件的原理是什么?mybatis的一级、二级缓存👍mybatis如何实现多表查询mybatis如何实现批量插入👍mybatis动态SQL标签…

【最新鸿蒙应用开发】——关于鸿蒙MVVM模式的理解

MVVM模式 MVVM(Model-View-ViewModel)是一种软件设计模式,主要用于分离应用程序的用户界面(UI)和业务逻辑。这种模式可以帮助开发者更高效地开发和管理复杂的用户界面。 程序的状态数据通常包含了数组、对象&#xff0…

Linux内存从0到1学习笔记(8.15 MMU/IOMMU/SMMU概览)

一, 什么是MMU? MMU(Memory Management Unit 内存管理单元),即内存管理单元,是计算机硬件中的一个重要组件,主要负责处理中央处理器(CPU)的内存访问请求。 其工作原理如下: 当程序发出内存访问请求,包括读取或写入操作以及逻辑地址(虚拟地址)。然后,MMU根据页表…

自动化测试git的使用

git是一款分布式的配置管理工具。本文主要讲git如何在自动化测试中安装,上传及拉取下载代码。 1 、git 介绍 每天早上到公司,从公司的git服务器上下载最新的代码,白天在最新的代码基础上,编写新的代码,下班时把“代码…

[Java基本语法] 异常

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏:🍕 Collection与数据结构 (92平均质量分)https://blog.csdn.net/2301_80050796/category_12621348.html?spm1001.2014.3001.5482 🧀线程与…

Linux 内核 (十二)进程间通讯 之 消息队列

前言 这个系列的上一篇介绍了进程间通讯关于管道相关的内容及代码实例,本章要介绍关于消息队列相关的内容. 消息队列交互图示 函数原型 #include <sys/msg.h> #include <sys/ipc.h> //创建 or 打开队列 成功返回队列ID,失败返回-1 int msgget(key_t key,int fla…

探索AIGC与3D技术的融合:从图像到可探索的3D动态场景

随着人工智能和计算机图形技术的飞速发展,AIGC(人工智能生成内容)与3D技术的结合正在为我们打开一扇全新的创意之门。最近,我深入研究了几个令人兴奋的AIGC+3D方案,它们不仅展示了从单张图片或文本提示生成3D点云的强大能力,还进一步实现了AI虚拟试穿和生成高保真3D数字人…

Qt信号槽的回调机制

问&#xff1a;Qt强大的地方在哪里&#xff1f; 答&#xff1a;跨平台、信号槽。。。 问&#xff1a;信号槽是什么&#xff1f; 答&#xff1a;回调函数 问&#xff1a;怎么个回调法子 答&#xff1a;。。。 成果 信号槽本身实现过程是有些复杂的&#xff0c;所以本人参考…

CDN绕过技术

DNS域名信息收集 简介 Dns域名信息的手机&#xff0c;需要收集域名对应IP&#xff0c;域名注册人&#xff0c;DNS记录&#xff0c;子域名等一系列与域名相关的信息。 Cdn技术简介 Cdn是一个内容分发网络&#xff0c;类似于dns服务器一样&#xff0c;用户发送数据直接发送到…

AI Assistant 2024 震撼登场:AI补全功能惊艳来袭,替换GitHub Copilot Chat最友好的方式!

哈喽!欢迎来到程序视点。 前言 在之前的文章中&#xff0c;我们提到过“JetBrains 2024.1 中&#xff0c;AI Assistant 插件已被解绑&#xff0c;现在作为单独的插件在 JetBrains IDE 中可用”。 这一变化的驱动力是&#xff0c;需要在使用 AI 驱动的技术时提供更大的决策灵活…

【C语言习题】30.使用指针打印数组内容

文章目录 作业标题作业内容2.解题思路3.具体代码 作业标题 使用指针打印数组内容 作业内容 写一个函数打印arr数组的内容&#xff0c;不使用数组下标&#xff0c;使用指针。 arr是一个整形一维数组。 2.解题思路 先定义一个数组&#xff0c;使用指针打印数组内容那就是说我们…

linux驱动学习(八)之内核定制与裁剪

一、内核的配置 1) 把相关硬件平台的配置文件拷贝给.config 2) 执行make menuconfig命令 关于内核配置说明:Arrow keys navigate the menu. 方向键对菜单有效<Enter> selects submenus --->. 如果有该符号"--->",则按Enter表示进入子菜单Highlighted …

可视化图表:如此高颜值柱状图,其实简单配置就能实现。

这不又有某个boss给我图截图一些柱状性图表&#xff0c;说他们的前端觉得很难&#xff0c;说了一堆技术术语&#xff0c;他也不懂&#xff0c;截图我看到后&#xff0c;就给了他一个网址&#xff0c;马上就解决了。 在这里给大家摘录出几个比较有特色的柱状图出来&#xff0c;让…

【网络安全学习】使用Kali做渗透情报收集-01-<域名信息主机信息>

1.收集开源情报 开源情报(Open Source Intelligence&#xff0c;OSINT)是指从各种公开的渠道中寻找和获取有价值的信息 如&#xff1a;互联网、媒体、社交网络、公共数据库等开源情报具有以下特点&#xff1a; - 丰富性&#xff1a;开源情报涵盖了各种类型和领域的信息 - 可…

香橙派鲲鹏Pro(orange pi kunpeng) 开箱测试,和在娱乐功能(电视盒子),深度机器学习应用方面的测试报告

摘要 对Orange Pi kunpeng这个开发板进行综合评测&#xff0c;特别关注其作为电视盒子的性能以及在深度学习应用中的算力和稳定性。通过一个月的测试&#xff0c;我们评估了其硬件性能、软件兼容性、用户体验和实际应用潜力 引言 5月份&#xff0c;我收到了csdn 对Orange P…

论文阅读笔记:Instance-Aware Dynamic Neural Network Quantization

论文阅读笔记&#xff1a;Instance-Aware Dynamic Neural Network Quantization 1 背景2 创新点3 方法4 模块4.1 网络量化4.2 动态量化4.3 用于动态量化的位控制器4.4 优化 5 效果 论文&#xff1a;https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_Instance-Aware_…