miRNA测序数据生信分析——第三讲,已知物种的生信分析实例

news2024/9/22 17:32:12

miRNA测序数据生信分析——第三讲,已知物种的生信分析实例

  • miRNA测序数据生信分析——第三讲,已知物种的生信分析实例
    • 1. 下载测序数据
    • 2. 原始数据质控——软件fastqc
    • 3. 注释tRNA和rRNA,使用Rfam数据库——软件blast,Rfam_statistics.py脚本
    • 4. 注释miRNA,包括种类,序列及定量,靶基因和绘图
      • 4.1 鉴定,使用miRBase数据库——软件blast
      • 4.2 定量和miRNA序列提取——脚本miRBase_sequence.py
      • 4.3 miRNA靶基因,使用miRTarBase和miRDB数据库
        • 4.3.1 miRTarBase数据库——脚本miRTarBase_Target.py
        • 4.3.2 miRDB数据库——脚本miRDB_Target.py
        • 4.3.3 整合两个数据库——脚本Total_Target.py
      • 4.4 绘制miRNA-靶基因互作图——软件Cytoscape
    • 5. 总结

miRNA测序数据生信分析——第三讲,已知物种的生信分析实例

1. 下载测序数据

SRA号:DRR463940 单端测序 测序类型:miRNA-seq
点击FASTQ,下载即可。文件DRR463940.fastq
在这里插入图片描述

2. 原始数据质控——软件fastqc

cd /home/zhaohuiyao/miRNA_seq/DRR463940/00Rawdata
#质控
/home/zhaohuiyao/Biosoft/general/FastQC/fastqc ./DRR463940.fastq
#Read数目:311289;Read长度分布:8~136bp
#查看质控下的每一个模块,都是可以理解的,判断不修剪
/home/zhaohuiyao/Biosoft/seqkit fq2fa -w 0 ./DRR463940.fastq > ./DRR463940.fasta

3. 注释tRNA和rRNA,使用Rfam数据库——软件blast,Rfam_statistics.py脚本

这里需要的Rfam数据库数据是博文:miRNA测序数据生信分析——第二讲,数据库下载整理,中提到的1.2.2 用于注释ncRNA/sRNA测序中的tRNA和rRNA序列,整理的。
为什么要做这一步呢?
从第二步质控结果Read长度分布:8~136bp,判断虽然是miRNA测序,但是依旧有rRNA和tRNA混入。做这一步,可以看看混入占比。

cd /home/zhaohuiyao/miRNA_seq/DRR463940/01Rfam
#只保留一个比对结果
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/blastn -db /home/zhaohuiyao/Database/Rfam/Rfam -query …/00Rawdata/DRR463940.fasta -out DRR463940_Rfam.annotations -outfmt 6 -evalue 1e-5 -num_alignments 1 -num_threads 36
#统计
python ./Rfam_statistics.py -i ./DRR463940_Rfam.annotations -db1 /home/zhaohuiyao/Database/Rfam/family.txt -db2 /home/zhaohuiyao/Database/Rfam/Rfam.full_region -o ./
在这里插入图片描述
#注意1:这里Subclass为ncRNA指在Rfam数据库中定义了Class但没有定义Subclass的ncRNA。注意2:可以看中重点比对结果出现在tRNA和rRNA,而其他注释类型少。
#结果
#总比对结果数目:98127条(98127/311289=31.52%)
#tRNA比对结果数目:75446条(75446/311289=24.24%)
#rRNA比对结果数目:4709条(4709/311289=1.51%)

4. 注释miRNA,包括种类,序列及定量,靶基因和绘图

测序物种已知,人类Homo sapiens(hsa)。且该物种在后续使用的miRBase、miRDB、miRTarbase数据库中都存在。

4.1 鉴定,使用miRBase数据库——软件blast

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/
grep “Homo sapiens” /home/zhaohuiyao/Database/miRBase/organisms.txt
在这里插入图片描述
#提取miRBase数据库中物种hsa的所有miRNA序列,制作物种特异数据库。
grep -A 1 “hsa” /home/zhaohuiyao/Database/miRBase/mature.fa | grep -v “--” > /home/zhaohuiyao/Database/miRBase/hsa_mature.fa
grep -c “>” /home/zhaohuiyao/Database/miRBase/hsa_mature.fa #2656个miRNA
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/makeblastdb -in /home/zhaohuiyao/Database/miRBase/hsa_mature.fa -dbtype nucl -out /home/zhaohuiyao/Database/miRBase/hsa_mature
#只保留一个比对结果
cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/01miRBase
/home/zhaohuiyao/Biosoft/general/ncbi-blast-2.10.0+/bin/blastn -task blastn-short -db /home/zhaohuiyao/Database/miRBase/hsa_mature -query /home/zhaohuiyao/miRNA_seq/DRR463940/00Rawdata/DRR463940.fasta -out DRR463940_miRBase.annotations -outfmt 6 -evalue 1e-5 -num_alignments 1
#统计
wc -l ./DRR463940_miRBase.annotations #66776条比对结果(66776/311289=21.45%)
cut -f 2 ./DRR463940_miRBase.annotations | sort | uniq | wc -l #367种miRNA

4.2 定量和miRNA序列提取——脚本miRBase_sequence.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/02Sequence_Quantity
python ./miRBase_sequence.py -i …/01miRBase/DRR463940_miRBase.annotations -db /home/zhaohuiyao/Database/miRBase/hsa_mature.fa -o ./
在这里插入图片描述
#两个结果文件:
DRR463940_miRBase.annotations.fa和DRR463940_miRBase.annotations.readscount
在这里插入图片描述
在这里插入图片描述

4.3 miRNA靶基因,使用miRTarBase和miRDB数据库

#三个子目录miRTarBase/、miRDB/和Total/

4.3.1 miRTarBase数据库——脚本miRTarBase_Target.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/miRTarBase
#确保物种在miRTarBase数据库中
grep “hsa” /home/zhaohuiyao/Database/miRTarBase/miRTarBase.organism
在这里插入图片描述
python ./miRTarBase_Target.py -i …/…/02Sequence_Quantity/DRR463940_miRBase.annotations.readscount -db /home/zhaohuiyao/Database/miRTarBase/miRTarBase_MTI.txt -o ./
#结果文件DRR463940_miRBase.annotations.miRTarBase
在这里插入图片描述

4.3.2 miRDB数据库——脚本miRDB_Target.py

cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/miRDB
#确保物种在miRDB数据库中
grep “hsa” /home/zhaohuiyao/Database/miRTarBase/miRDB.organism
在这里插入图片描述
python ./miRDB_Target.py -i …/…/02Sequence_Quantity/DRR463940_miRBase.annotations.readscount -db /home/zhaohuiyao/Database/miRDB/miRDB_v6.0_prediction_result.txt.hsa -o ./
在这里插入图片描述
#结果文件DRR463940_miRBase.annotations.miRDB
在这里插入图片描述

4.3.3 整合两个数据库——脚本Total_Target.py

#取两个数据库的并集,获得最终miRNA-Gene关系文件
cd /home/zhaohuiyao/miRNA_seq/DRR463940/02miRNA/known/03Target/Total
python ./Total_Target.py -db1 …/miRTarBase/DRR463940_miRBase.annotations.miRTarBase -db2 …/miRDB/DRR463940_miRBase.annotations.miRDB -o ./
在这里插入图片描述
#结果文件DRR463940_miRBase.annotations.target
在这里插入图片描述

4.4 绘制miRNA-靶基因互作图——软件Cytoscape

因为这个互作关系很庞大,有351413条关系。因此绘制会比较难,我就单独提取了部分互作关系,进行绘图,在Windows下进行。绘图查看另一篇公众号文章:https://mp.weixin.qq.com/s/vbFAre601-9atwah9PMwUw查看

5. 总结

以上就是针对已知物种的miRNA分析。同时满足miRBase、miRTarBase和miRDB三个数据的物种,只有5种。因此针对未知的分析是重要的,而且在你时候的时候,可能会交叉使用。上面步骤中涉及了很多脚本,但都是很简单的文件内容提取比对。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1080182.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL数据库技术笔记(3)

概述 学习MySQL数据库技术其实只需要安装mysql服务器就可以使用了。只不过对于初学者来说直接操作dos窗口方式比较麻烦,命令不熟悉,导致经常写错。在真实的开发当中直接操作dos窗口效率比较慢,企业中也会经常使用一些mysql数据库支持的可视化…

【VR开发】【Unity】0-课程简介和概述

【说明】 这是我录制的一套VR基础开发课程的文字版本,更加便于快速参考。 应大家在后台所提的需求,从今天开始,我计划带给大家一套完整达40课时的VR开发基础课程。 在开始学习前需要注意如下几点: 本教程基于Unity2022.2.1f1版…

【Python 零基础入门】基础语法

【Python 零基础入门】第四课 基础语法 【Python 零基础入门】第四课 基础语法怎么写 Python 代码缩进注释Python 标识符规则Python关键字代码行和块导包 字符串操作字符串连接字符串的其他常用方法 循环for 循环while 循环 判断语句比较运算符逻辑运算符if 判断三元表达式brea…

【已解决】ORA-01722: invalid number

文章目录 ORA-01722: invalid number问题思路解决 ORA-01722: invalid number 问题 invalid number 字符与数值不匹配 oracle 截取 ‘1-2’ 只需要’-前面的 思路 一、问题提示 执行Oracle的sql语句提示【ORA-01722: invalid number】无效数字错误。 二、问题分析 2.1、类…

共模电感在EMC电路里有哪些原理及作用?|深圳比创达EMC

共模电感在EMC电路里有哪些原理及作用?相信不少人是有疑问的,今天深圳市比创达电子科技有限公司就跟大家解答一下! 一、共模电感在EMC电路里的作用 EMC电路设计中共模干扰问题居多,所以共模电感很常见。共模电感是可以抑制共模干…

亚马逊“黑五网一”大促开启!如何抓住流量密码实现爆单?

亚马逊“黑五网一”大促从起10月30日正式开始,对比往年活动周期增加至11天,作为海外电商年度盛宴,将覆盖Choice day年度盛典、双十一、黑色星期五三大营销节点,备受全民瞩目。 去年,仅是美国消费者在“黑五”期间消费…

golang使用energy开发GUI桌面程序,CEF,LCL

1、概述 仓库:https://github.com/energye/energy 文档:https://energy.yanghy.cn/ Energy 是 Go 基于 CEF(Chromium Embedded Framework) 开发的框架,内嵌 CEF 二进制 使用 Go 和 Web 端技术 ( HTML CSS JavaScript ) 构建支持Windows, …

配电室六氟化硫气体泄漏报警装置安装位置

六氟化硫气体泄漏报警装置安装位置产品的设计、检验、制造均遵循GB16808-2008《可燃气体报警控制器》和GB12358-2006《作业场所环境气体检测报警仪通用技术要求》严格设计。是经过高速CPU数据处理,通过LCD显示出探测器的浓度、状态并输出相应的控制信号。报警控制器…

什么是 API 接口?给大家举例说明

Api 接口也就是所谓的应用程序接口,api 接口的全称是 Application Program Interface,通过 API 接口可以实现计算机软件之间的相互通信,开发人员可以通过 API 接口程序开发应用程序,可以减少编写无用程序,减轻编程任务…

KdMapper扩展实现之SOKNO S.R.L(speedfan.sys)

1.背景 KdMapper是一个利用intel的驱动漏洞可以无痕的加载未经签名的驱动,本文是利用其它漏洞(参考《【转载】利用签名驱动漏洞加载未签名驱动》)做相应的修改以实现类似功能。需要大家对KdMapper的代码有一定了解。 2.驱动信息 驱动名称spee…

JavaScript算法43- 分类求和并作差(leetCode:100103easy)周赛

2894. 分类求和并作差 一、题目 给你两个正整数 n 和 m 。 现定义两个整数 num1 和 num2 ,如下所示: num1:范围 [1, n] 内所有 无法被 m 整除 的整数之和。num2:范围 [1, n] 内所有 能够被 m 整除 的整数之和。 返回整数 num1…

Spring Cloud 微服务系列文章合集,一次性看个够!

微服务架构图 为了方便大家可以直接下载编辑,这里用的ProcessOn画的架构图,可以直接克隆一个出来进行编辑,地址:https://www.processon.com/view/6523a1b37fde9c4bb35c7278 微服务系列文章合集,点击阅读 Spring Cl…

CAD(计算机辅助设计)软件的开发框架

CAD(计算机辅助设计)软件的开发通常使用特定的CAD开发框架和工具。这些框架提供了一组API(应用程序编程接口)和开发工具,使开发人员能够创建自定义插件、应用程序和功能。以下是一些常见的CAD开发框架和平台&#xff0…

linux系统配置Samba实现与Windows系统的文件共享

1.linux系统下载安装Samba sudo apt install samba 2.在linux文件系统中创建一个共享目录(通常在用户目录下面创建一个名为share的目录) mkdir share 3.修改samba配置文件 sudo vim /etc/samba/smb.conf 添加配置信息(path share路径,需要修改) ,保存修改 [Share]comm…

MySQL-3(9000字详解)

一:索引 索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。 1.1索引的意义 索引的意义:加快查找速度,但需要…

什么是嵌入式Linux?

什么是嵌入式Linux? 对于很多电气、电信、通信专业的同学来说,对口专业就业方向主要有软、硬件两个方向。无论是对于学生还是就业而言,软硬件的开发学习,嵌入式物联网在近年来无疑是一个摆在面前的“香饽饽”。 近年来国家社会愈…

百花齐放:解锁大型语言模型的潜力 | 开源专题 No.32

这一系列开源项目共同特点在于它们提供多模型支持、具备可定制性、开源可自由修改、并且提供多功能性,为用户提供了灵活、强大的AI聊天和模型访问工具,为AI交互和实验提供了广泛的选择和创新机会。 jtsang4/claude-to-chatgpt Stars: 2.3k License: MI…

JavaScript和Java的区别是什么?

目录 一、不同的公司开发的不同产品。 二、使用的方向不同 三、对象不同 四、HTML文档中采用的标识不同 五、语言类型不同 六、在浏览器中所执行的方式不同 七、代码格式不同 八、所采取的变量是不同 九、联编方式不一样 十、对图文操作方式不一样 很多初学者看到Jav…

echarts折线图设置背景颜色

initChartsBox() {this.option {tooltip: {trigger: "axis",axisPointer: {// 方法一type: "shadow", // 默认为直线,可选为:line | shadowshadowStyle: {color: "rgba(41, 95, 204, 0.2)",},},borderColor: "rgba(…

解决Mysql时区问题

程序员的公众号:源1024,获取更多资料,无加密无套路! 最近整理了一份大厂面试资料《史上最全大厂面试题》,Springboot、微服务、算法、数据结构、Zookeeper、Mybatis、Dubbo、linux、Kafka、Elasticsearch、数据库等等…