【QIIME2】细菌16s数据库_Greengenes

news2024/9/21 18:38:47

文章目录

  • 下载Greengenes数据库
  • 在QIIME2中使用
    • 导入QIIME2中
    • 提取引用读取
    • 训练分类器
    • 测试分类器
    • 导出结果
    • 生成可视化文件

由于Bugbase功能注释时,输入的OTU表需经Greengenes注释(且由于时间原因须是第一版),故尝试使用Greengenes对16S进行注释

下载Greengenes数据库

下载地址:
https://ftp.microbio.me/greengenes_release/gg_13_8_otus/taxonomy/

在QIIME2中使用

导入QIIME2中

time qiime tools import \
  --type 'FeatureData[Sequence]' \
  --input-path 99_otus.fasta \
  --output-path 99_otus.qza

time qiime tools import \
  --type 'FeatureData[Taxonomy]' \
  --input-format HeaderlessTSVTaxonomyFormat \
  --input-path 99_otu_taxonomy.txt \
  --output-path ref-taxonomy.qza

共耗时3min

提取引用读取

研究表明,当朴素贝叶斯分类器仅在测序的目标序列区域进行训练时,16S rRNA基因序列的分类学分类准确性会提高
以779F/1193R为例

time qiime feature-classifier extract-reads \
  --i-sequences 99_otus.qza \
  --p-f-primer AACMGGATTAGATACCCKG \
  --p-r-primer ACGTCATCCCCACCTTCC \
  --p-trunc-len 350 \
  --o-reads ref-seqs.qza

共耗时4min

训练分类器

现在,我们可以使用刚刚创建的参考读取和分类法,按如下方式训练朴素贝叶斯分类器

time qiime feature-classifier fit-classifier-naive-bayes \
  --i-reference-reads ref-seqs.qza \
  --i-reference-taxonomy ref-taxonomy.qza \
  --o-classifier classifier.qza

共耗时4min

测试分类器

最后,我们通过对代表性序列进行分类并可视化生成的分类分配来验证分类器是否正常工作。

time qiime feature-classifier classify-sklearn \
  --i-classifier classifier.qza \
  --i-reads rep-seqs.qza \
  --o-classification taxonomy.qza
## 耗时30min
time qiime metadata tabulate \
  --m-input-file taxonomy.qza \
  --o-visualization taxonomy.qzv
## 耗时1min

在这里插入图片描述

导出结果

taxaonomy里的taxnomy.tsv是输入文件之一,为后续分析做准备

qiime tools export --input-path taxonomy.qza --output-path taxonomy

生成可视化文件

物种注释的结果

time qiime metadata tabulate \
  --m-input-file taxonomy.qza \
  --o-visualization taxonomy.qzv

柱状累积图

time qiime taxa barplot \
  --i-table table.qza \
  --i-taxonomy taxonomy.qza \
  --m-metadata-file sample.tsv \
  --o-visualization taxa-bar-plots.qzv

导出结果

qiime tools export --input-path  taxa-bar-plots.qzv --output-path  taxa-bar-plots

参考:
[1]官方文档:使用 q2-feature-classifier 训练特征分类器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1967308.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

探索Python网络自动化的宝库:Paramiko的秘密

文章目录 探索Python网络自动化的宝库:Paramiko的秘密第一部分:背景介绍为什么选择Paramiko?Paramiko能做什么?接下来... 第二部分:Paramiko是什么?第三部分:如何安装Paramiko?第四部…

Java OOP世界之多态

多态的概念 通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。同一件事情,发生在不同对象身上,就会产生不同的结果。比如之前讲类和对象的时候举的猫狗的栗子,这…

代码随想录算法训练营第35天|01背包理论基础、01背包理论基础(滚动数组)、416. 分割等和子集

打卡Day35 1.01背包理论基础2.01背包理论基础(滚动数组)3.416. 分割等和子集 1.01背包理论基础 题目链接:01背包理论基础 文档讲解: 代码随想录 01背包: 有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是we…

Studying-代码随想录训练营day50| 图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础

第50天,图论开始!最后的刷题冲刺!💪(ง •_•)ง,编程语言:C 目录 图论理论基础 图的基本概念 图的种类 度 连通性 连通图(无向图概念) 强连通图(有向图概念&…

全局统一的异常处理方案

1. 在Common包中统一定义异常处理类 2. 在common包中定义异常拦截器 ExceptionHandler(BusinessException.class):表示要拦截的异常类型为BusinessException 3. 在自己的项目中使用这个全局异常拦截器 继承CommonControllerAdvice并且配上ControllerAd…

MySQL数据库-事务

一、什么是事务 1.概念 事务(Transaction):一个最小的不可再分的工作单元,一个事务对应一个完整的业务,一个完整的业务需要批量的DML(insert、update、delete)语句共同联合完成,事务只针对DML语句。 数据…

天气曲线echarts

1. 用多x轴实现日期&#xff0c;图标&#xff0c;控制定位固定显示高度 2.背景遮罩抛开echarts另外用div 3.设置grid的offset控制温度折线的范围 html <div class"right_bottom"><basicEchartsstyle"height: 400px; width: 1200px":option"c…

在Windows上用虚拟机安装统信UOS专业版教程

事情的起因 就是我想要一台华为电脑&#xff0c;然后上网搜索选购攻略。然后看到了一个新闻&#xff0c;就是英特尔&#xff0c;高通对华为停止供应&#xff0c;然后华为要研发自己的CPU操作系统 然后我也不了解&#xff0c;继续搜索&#xff0c;就好像是这个操作系统 统信UO…

【轨物推荐】康波、世界体系与创新范式:中国如何引爆新一轮产业革命

原创 邵宇、陈达飞 新财富 2019年12月31日 22:13 中美关系近两年备受关注&#xff0c;在诸多方面各方都已经形成了共识&#xff0c;但竞争博弈的结局富有争议性。当靠事物太近的时候&#xff0c;反而很难看清楚其面貌&#xff0c;使用康德拉季耶夫周期&#xff08;简称“康波”…

来自工业界的开源知识库 RAG 项目结构化文件解析方案比较

背景介绍 在过去实践 RAG 的过程中&#xff0c;深刻体会到 RAGFlow 提出的 "Quality in, quality out", 只有高质量的文件处理才能获得良好的 RAG 效果。 RAG 的第一步是对文件进行解析&#xff0c;由于 Embedding 和 LLM 模型的长度限制&#xff0c;往往需要将解析…

Python批量下载音乐功能

Python批量下载音乐功能 Python批量下载音乐,调用API接口,同时下载歌曲和歌词 先安排一下要用的模块&#xff0c;导入进来。 import re import json import requests目录结构 下载音乐 Awking_Class.pymusic.txt 文件文件写的是音乐名字,使用换行分割 new_music 注意这个 ne…

[极客大挑战 2019]Secret File-web

打开题目 查看源码 直接访问Archive_room.php 第二个页面是个点击框&#xff0c;这里bp抓包确认&#xff1b;若是直接SECRET&#xff0c;会跳到end.php 直接访问secr3t.php 代码审计一下 playload&#xff1a;secr3t.php?fileflag.php 改为php协议读取权限 secr3t.php?f…

CAPL使用结构体的方式组装一条DoIP车辆声明消息(方法1)

如果你参加过我的《CAPL编程系统性课程》,你就结构体类型天然就能表示报文结构,用结构体表示报文虽然麻烦,但灵活度更高。 我们今天试着用结构体类型表示DoIP车辆声明消息的DoIP报头,然后组装一条DoIP消息发送出去。 DoIP消息结构如下: DoIP车辆声明消息结构如下: /**…

SPSSAU | Power功效分析之线性回归

Power功效分析常用于实验研究时样本量的计算&#xff08;或功效值计算&#xff09;&#xff0c;如果是涉及线性回归相关的回归系数差异计算时&#xff0c;SPSSAU共提供三种情况时的Power功效分析&#xff0c;具体如下表格所述&#xff1a; 名词说明R 方值线性回归时R 方值或者…

大数据信用查询什么样的平台比较靠谱?

随着互联网的发展和普及&#xff0c;大数据技术逐渐应用到各行各业中&#xff0c;其中之一就是信用查询领域&#xff0c;大数据信用查询平台能够为用户提供全面、准确的大数据信用评估&#xff0c;然而&#xff0c;由于市场上出现了许多不同的大数据信用查询平台&#xff0c;我…

NICE Seminar(2022-1-23)基于进化优化的鲁棒区间搜索(华东理工大学堵威博士)

论文题目&#xff1a;Searching for Robustness Intervals in Evolutionary Robust Optimization 关于非支配解附近较高质量解搜集的工作。

DC-7靶机通关

今天咱们来学习第七个靶机&#xff01;&#xff01;&#xff01; 1实验环境 攻击机&#xff1a;kali2023.2 靶机&#xff1a;DC-7 2.1主机发现 2.2端口扫描 依旧是开了两个端口&#xff0c;一个 22 一个 80 &#xff01;&#xff01;&#xff01; 3.1查看对方网页 在这里我…

数据结构_study(六)

图 顶点的有穷非空集合和顶点之间边的集合 G(V,E)&#xff0c;G&#xff1a;图&#xff0c;V&#xff1a;顶点集合&#xff0c;E&#xff1a;边的集合 顶点&#xff1a;图中的数据元素&#xff0c;有穷&#xff0c;非空 边&#xff1a;顶点之间的逻辑关系&#xff0c;边集合…

如何编写一个多线程、非阻塞的python代码

一、【写在前面】 最近csdn每天写两篇文章有推广券&#xff0c;趁这个机会写一个python相关的文章吧。 一般我们的任务都可以分为计算密集型任务和IO密集型任务。 python因为全局GIL锁的存在&#xff0c;任何时候只有一个python线程在运行&#xff0c;所以说不能利用多核CPU…