16s功能注释Bugbase的安装使用--本地版

news2025/1/11 18:37:36

文章目录

  • 概述
  • 介绍
  • 下载安装程序
    • 下载并配置环境
    • 安装依赖R包并显示帮助
    • 运行示例数据
    • Bug及解决方法-☆
  • 使用
    • 输入文件准备-☆
      • 下载Greengenes数据库
      • 在QIIME2中操作
      • R语言操作
    • 运行Bugbase

概述

Bugbase依赖于Greegenes1与R

  • 但是R现已更新到4.4以上,安装R包时会不兼容
  • 且输入文件的ID 须为Greegenes ID,且与原ASV无对应

本文主要解决以上两问题,其他具体操作将略

介绍

BugBase是一种微生物组分析工具,可确定微生物组样本中存在的高级表型,可以基于OTU表和Mapping files,预测大量信息和比较,包括以下七方面:

  • 括革兰氏阳性(Gram Positive)
  • 革兰氏阴性(Gram Negative)
  • 生物膜形成(Biofilm Forming)
  • 致病性(Pathogenic)
  • 移动元件(Mobile Element Containing)
  • 氧需求(Oxygen Utilizing,包括Aerobic、Anaerobic、facultatively anaerobic)
  • 氧化胁迫耐受(Oxidative Stress Tolerant)

下载安装程序

下载并配置环境

cd ~/software
wget https://github.com/knights-lab/BugBase/archive/master.zip
mv master.zip BugBase.zip
unzip BugBase.zip
mv BugBase-master/ BugBase
# 此程序运行必须定义下面环境变量,根据实际目录修改
export BUGBASE_PATH=/home/yangzy/software/BugBase
export PATH=$PATH:/home/yangzy/software/BugBase/bin

安装依赖R包并显示帮助

run.bugbase.r -h # 安装了所有依赖包
# 以上R包如果已经安装,此步可跳过
# 每次运行都会重复安装10多个包近半小时

运行示例数据

# 运行演示数据
run.bugbase.r -i $BUGBASE_PATH/doc/data/HMP_s15.txt -m $BUGBASE_PATH/doc/data/HMP_map.txt -c HMPBODYSUBSITE -o output

运行中会显示运行内容如下

[1] "Loading Inputs..."
[1] "16S copy number normalizing OTU table..."
[1] "Predicting phenotypes..."
[1] "313 OTUs from the input table matched the 203452 available database OTUs"
[1] "Plotting thresholds..."
[1] "Plotting predictions..."
[1] "Plotting OTU contributions..."
[1] "BugBase analysis complete"

Bug及解决方法-☆

在这里插入图片描述
在这里插入图片描述
必需的’Matrix’包提示 needs R >= 4.4.0,
'biom’包报错是 installed before R 4.0.0: please re-install it
二者互相矛盾
###################################################################
最后解决方法——修改原始程序
修改后的程序可邮箱联系我获取
(yangziyi2001@126.com)
脚本原始是专门设置了一个位置存包,如果有其他版本遗留的会起冲突
将位置换了后运行成功
在这里插入图片描述

使用

在这里插入图片描述
输入文件:
OTU_table
BIOM 1.0, JSON格式
16S以GrennGenes为参考数据库 #过旧 但可用
宏基因组以IMG为参考
样本信息
第一列为样本

参数解释:
-i otu_table biom1.0格式文件
-m 样品信息表
-c 指定样品分组
-o 输出文件名称
-t 指定分类水平 1-7,默认门水平
-p 表型,特殊表型预测
-x 只输出预测表,不出图片
-T 阈值 0-1,可指定过滤阈值

输入文件准备-☆

使用QIIME2 与Greengenes数据库进行聚类比对

下载Greengenes数据库

下载地址:
https://ftp.microbio.me/greengenes_release/gg_13_8_otus/taxonomy/

在QIIME2中操作

激活QIIME2环境

conda activate qiime2-2023.5
97% 的 OTU fasta 文件(从 rep-set 文件夹)导入到 QIIME 2 中。
qiime tools import \
  --type 'FeatureData[Sequence]' \
  --input-path gg_13_8_otus/rep_set/97_otus.fasta \
  --output-path gg_97_otus.qza

使用cluster方法在 97% 的相似性阈值下对序列进行聚类。

qiime vsearch cluster-features-closed-reference \
  --i-sequences rep-seqs-dada2.qza \
  --i-table table-dada2.qza \
  --i-reference-sequences gg_97_otus.qza \
  --p-perc-identity 0.97 \
  --o-clustered-table table-cr-97.qza \
  --o-clustered-sequences rep-seqs-cr-97.qza \
  --o-unmatched-sequences unmatched-seqs \
  --verbose
  • 输入去重序列(rep-seqs-dada2.qza)和表格(table-dada2.qza)。
  • 使用预先建立的参考序列(gg_97_otus.qza)进行聚类。
  • 设置相似性阈值为97%(–p-perc-identity 0.97),即寻找97%序列相似性。
  • 输出聚类后的表格(table-cr-97.qza)和代表序列(rep-seqs-cr-97.qza)。
  • 将未匹配的序列输出到unmatched-seqs中。
  • 使用–verbose选项以获取详细输出信息。
    在这里插入图片描述

R语言操作

  • 输出的table-cr-97.qza和rep-seqs-cr-97.qza是具有Greengenes ID,没有OTU ID的
  • 将rep-seqs-cr-97.qza中的序列与之前rep-seqs.qza中的序列比对,将Greengenes ID和OTU ID号对应上,再通过ASV_contrast对应得到Greengenes ID_OTU_ASV_sequen表
  • 最后将dna-sequences.TAB.no-All.txt和feature-table-tax.txt合并,得到仅保留与ASV比对上的Greengenes ID的特征序列丰度表–>asv_table

运行Bugbase

run.bugbase.r -i $BUGBASE_PATH/doc/data/HMP_s15.txt -m $BUGBASE_PATH/doc/data/HMP_map.txt -c HMPBODYSUBSITE -o output

在这里插入图片描述
在这里插入图片描述

参考:
[1]16S预测细菌表型-bugbase:革兰氏阴阳、生物膜、致病力、移动元件、氧气消耗等…
[2]qiime2-to-BugBase

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035545.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【时时三省】(C语言基础)结构体初阶

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 结构体的声明 结构的基础知识: 结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量 数组: 是一组相同类型的元素的集合 结构体: 也是一些值得集合…

python-二进制?十进制?(赛氪OJ)

[题目描述] 给定两个十进制整数 : A,B。 你需要把它们的二进制形式以十进制的运算法则相加输出结果。 例如: A3 , B2的时候,A 的二进制表示是 : 11 , 𝐵B 的二进制表示是 10 ,你需要输出答案为 : 21。 输入格式…

基于 Flutter 从零开发一款产品(一)—— 跨端开发技术介绍

前言 相信很多开发者在学习技术的过程中,常常会陷入一种误区当中,就是学了很多技术理论知识,但是仍做不出什么产品出来,往往学了很多干货,但是并无实际的用处。其实,不论是做什么,我们都需要从…

嵌入式linux系统镜像制作day1

点击上方"蓝字"关注我们 01、前言 嵌入式设备(例如心电图检测仪,售票系统等)。尽管,嵌入式设备像那些智能手机一样,绝大多数都使用同样的硬件和软件,包括系统芯片SoC、储存、连接和多媒体接口、…

Could not find artifact net.sf.json-lib:json-lib:jar

一开始我改了maven的setting&#xff0c;由官网变为阿里云仓库&#xff0c;最后还是不行 <dependency><groupId>net.sf.json-lib</groupId><artifactId>json-lib</artifactId><version>2.0</version><classifier>jdk15</cl…

freeRTOS任务通知(Task Notifications)

目录 前言 一、任务通知概述 1.优势及限制 2.通知状态和通知值 二、任务通知的使用 两类函数 1.xTaskNotifyGive/ulTaskNotifyTake 2.xTaskNotify/xTaskNotifyWait 三、传输计数值代码示例 四、传输任意值代码示例 前言 所谓"任务通知"&#xff0c;你可以反…

螺旋矩阵 | LeetCode-59 | LeetCode-54 | 分类讨论

&#x1f64b;大家好&#xff01;我是毛毛张! &#x1f308;个人首页&#xff1a; 神马都会亿点点的毛毛张 &#x1f383;分类不好&#xff0c;这道题就做不出来&#xff01;&#x1f388; &#x1f4cc;LeetCode链接&#xff1a;59. 螺旋矩阵 II &#x1f4cc;LeetCode链接…

李晨晨的嵌入式学习 DAY25

今天对昨天的fork函数进行了补充&#xff0c;并且学习了exec函数 一&#xff0c;fork函数补充 1.open在fork之前 子进程会继承父进程已打开的相关信息&#xff0c;父子进程会影响同一个offset值 2.open在fork之后 父子进程各自有各自打开的文件信息&#xff0c;不相互影响 …

Luatos-lua For MacOSX

0x00 缘起 看到Luatos-soc-pc项目能够编译到MacOS平台并且运行&#xff0c;所以尝试编译&#xff1b;可是Apple Clang编译器太过于严格&#xff0c;导致编译不通过。遂换到gcc-11编译通过&#xff0c;虽然其中依旧会报错&#xff08;宏定义LUA_USE_MACOSX不起作用&#xff0c;导…

Linux驱动入门实验班——LED驱动(附百问网视频链接)

目录 一、确定引脚编号 二、编写思路 2.1驱动层 2.2应用层 三、源码 四、实现 课程链接 一、确定引脚编号 首先&#xff0c;可以在开发板上执行如下命令查看已经在使用的GPIO状态&#xff1a; cat /sys/kernel/debug/gpio 可以看到每个gpio都有对应的编号&#xff0c;…

岗位信息采集全攻略:两种方法快速获取招聘信息

摘要 本文将揭秘两大实战策略&#xff0c;助你在激烈的人才市场中迅速捕捉前程无忧上的宝贵岗位信息&#xff0c;无论是手动搜索还是利用现代技术手段&#xff0c;都能事半功倍&#xff0c;抢占先机。 正文 一、手动搜索的艺术&#xff1a;精准定位&#xff0c;深度挖掘 1.…

【网络】传输层TCP协议的报头和传输机制

目录 引言 报头和有效载荷 确认应答机制 超时重传机制 排序和去重 连接管理机制 个人主页&#xff1a;东洛的克莱斯韦克-CSDN博客 引言 TCP是传输层协议&#xff0c;全称传输控制协议。TCP报头中有丰富的字段以及协议本身会制定完善的策略来保证网络传输的可靠性。 TCP…

ICM-20948芯片详解(12)

接前一篇文章&#xff1a;ICM-20948芯片详解&#xff08;11&#xff09; 六、寄存器详解 2. USER BANK 0寄存器详述 &#xff08;56&#xff09;FIFO_EN_1 参考代码&#xff1a; 无。 &#xff08;57&#xff09;FIFO_EN_2 ACCEL_FIFO_EN 1 —— 以采样率将ACCEL-XOUT_H、…

haproxy实例

什么是haproxy Haproxy是一款提供高可用性&#xff0c;负载均衡以及基于tcp和http的的应用交付控制器的开源软件。它由法国人威利塔罗使用c语言开发的。它广泛用于管理和路由网络流量&#xff0c;并确保应用程序的高可用性和高性能。 haproxy的功能 提供第4层&#xff08;TCP层…

vulnhub系列:Hackademic.RTB1

vulnhub系列&#xff1a;Hackademic.RTB1 靶机下载 一、信息收集 nmap 扫描存活&#xff0c;根据 mac 地址寻找 IP nmap 192.168.23.0/24nmap 扫描端口&#xff0c;开放端口&#xff1a;22、80 nmap 192.168.23.143 -p- -Pn -sV -O访问80端口&#xff0c;页面发现 target …

DirectX修复工具解决问题:一步步教你排除常见错误

在日常使用电脑的过程中&#xff0c;许多用户可能会遇到与DirectX相关的问题&#xff0c;特别是在运行大型游戏或图形密集型应用程序时。这种情况下&#xff0c;选择一款合适的DirectX修复工具免费版来解决问题至关重要&#xff01; 我们将分享六款好用的DirectX修复工具&…

字节Java后端二面也太难了吧...

粉丝投稿&#xff0c;字节二面直接连环问场景题&#xff0c;难以招架&#xff0c;已经准备好市场上常见的场景题了&#xff0c;希望能帮助你&#xff01; 由于平台篇幅原因&#xff0c;很多内容展示不了&#xff0c;需要这份《java面试宝典》的伙伴们转发文章关注后&#xff…

Linux_Shell变量及运算符-05

一、Shell基础 1.1 什么是shell Shell脚本语言是实现Linux/UNIX系统管理及自W动化运维所必备的重要工具&#xff0c; Linux/UNIX系统的底层及基础应用软件的核心大都涉及Shell脚本的内容。Shell是一种编程语言, 它像其它编程语言如: C, Java, Python等一样也有变量/函数/运算…

MySQL基础练习题38-每位教师所教授的科目种类的数量

目录 题目 准备数据 分析数据 总结 题目 查询每位老师在大学里教授的科目种类的数量。 准备数据 ## 创建库 create database db; use db;## 创建表 Create table If Not Exists Teacher (teacher_id int, subject_id int, dept_id int)## 向表中插入数据 Truncate table…

ALB使用指南|深入探究 lj-lua-stacks:如何生成 Lua 代码级别的火焰图?

前言 ALB&#xff08;Another Load Balancer&#xff09;是一款由灵雀云基于 OpenResty 开发的开源Kubernetes&#xff08;K8s&#xff09; 网关&#xff0c;拥有多年的生产环境使用经验。Openresty框架高性能的基础上&#xff0c;提供了一系列高级特性&#xff0c;包括多租户支…