scanMiR:使用R语言预测 miRNA 结合位点

news2024/10/10 5:45:48

生信碱移

scanMiR 结合预测

scanMiR,一款R语言工具包,能够高效地扫描任何自定义序列上的典型和非典型miRNA结合位点,估计解离常数并预测聚合的转录物抑制。

最近,几项高通量研究试图阐明miRNA–mRNA靶向的生化决定因素。在一项发表于Science的研究中,McGeary等人使用纯化的Ago–miRNA复合体结合RNA结合-n-序列(RBNS)来确定六种miRNA(miR-1、let-7a、miR-7、miR-124、miR-155和lsy-6,基于它们的保守序列和现有功能数据选择)对任何可能的12个核苷酸长(12-mer)序列的亲和力。他们展示了不同典型位点类型的亲和力和相应解离常数(KD)与细胞环境中观察到的抑制非常吻合,这大大优于重新训练的TargetScan7版本。为了将这些发现推广到其他miRNA,作者使用实证获得的数据训练了一个卷积神经网络(CNN)。他们证明了基于通过CNN获得的亲和值的抑制分数在另一种细胞类型中的12种不同miRNA上比TargetScan7提高了约50%。

图片

▲ McGeary等人的研究

尽管如此,虽然McGeary等人(2019)提供的模型和实验数据在目标预测方面代表了重大进展,但它们并没有提供给更广泛的用户群。事实上,基于生化模型的占用分数已被添加到TargetScan8,但这样广泛使用的平台未能提供所需的灵活性:例如,TargetScan只包括少数几种物种,仅涵盖转录组的一部分(每个蛋白质编码基因的单个策划UTR),不提供非典型或开放阅读框结合位点的信息,且对自定义序列的应用非常繁琐。最后,尽管R和Bioconductor在生物信息学中很普遍,但基于R的miRNA-靶标预测工具相对稀缺。

因此,来自瑞士的研究人员试图通过在Bioconductor框架内整合和扩展McGeary的生化模型,提供一个通用的、灵活的、用户友好的软件包和伴随的Web应用程序scanMiR。scanMiR2022年发表于「Bioinformatics」杂志,能够高效地扫描任何自定义序列上的典型和非典型miRNA结合位点,估计解离常数并预测聚合的转录物抑制。作者还提供了一个灵活的3′-补充对齐,允许系统地预测可能的结合位点以及导致RNA剪切的位点。此外,scanMiR提供了几个新的可视化功能,以便于miRNA-靶标候选选择。scanMiR预测的mRNA抑制与测量的mRNA折叠变化比TargetScan分数显著更相关。最后,作者还将scanMiR集成到了一个web应用程序,可供大部分人群使用。

图片

▲ scanMiR的整体设计

一、miRNA的介绍

microRNA(miRNA)是一类小型、单链的非编码RNA分子,包含21至23个核苷酸。在植物、动物和一些病毒中发现的miRNA,参与RNA沉默和基因表达的转录后调控。miRNA与mRNA分子中的互补序列配对,通过以下一个或多个过程使该mRNA分子沉默:

  1. 切割mRNA链为两部分。

  2. 通过缩短其poly(A)尾部使mRNA稳定性降低。

  3. 翻译mRNA为蛋白质。

miRNA与RNA干扰(RNAi)途径中的小干扰RNA(siRNA)相似,不同之处在于miRNA源自RNA转录本中折叠回自身形成的短发夹结构,而siRNA源自更长的双链RNA区域。人类基因组可能编码超过1900种miRNA,尽管最近的分析表明这个数字接近于2300。然而,在手动策划的miRNA基因数据库MirGeneDB中,只有大约500种人类miRNA被确认为真正的miRNA。成熟的miRNA是活跃的RNA诱导的沉默复合体(RISC)的一部分,该复合体包含Dicer和许多相关蛋白。RISC也被称为microRNA核糖核蛋白复合体(miRNP);含有miRNA的RISC有时被称为“miRISC”。

图片

▲ 上图展示了几种翻译抑制机制:M1)对起始过程的干扰,阻止起始复合体的组装或招募40S核糖体亚基;M2)对核糖体组装的干扰;M3)对翻译过程的干扰;M7、M8)对mRNA的降解。40S和60S是核糖体的轻型和重型组分,80S是结合到mRNA的组装核糖体,eIF4F是翻译起始因子,PABC1是Poly-A结合蛋白,而“cap”是mRNA圆化所需的mRNA帽结构(可以是正常的m7G帽或修饰的A帽)。mRNA的起始可以通过招募40S到位于5'UTR区域的内部核糖体进入位点(IRES)以独立于帽的方式进行。RNA沉默的实际工作由RISC执行,其中主要的催化亚单位是阿尔戈蛋白(AGO)之一,而miRNA充当识别特定mRNA序列的模板。

阿尔戈蛋白(Ago)家族的成员是RISC功能的核心。阿尔戈蛋白对miRNA诱导的沉默是必需的,包含两个保守的RNA结合域:PAZ域可绑定成熟miRNA的单链3'端,PIWI域在结构上类似于核糖核酸酶-H,并用于与引导链的5'端相互作用。它们绑定成熟miRNA,并将其定位于与目标mRNA的相互作用。一些阿尔戈蛋白,例如人类Ago2,可以直接切割靶转录本;阿尔戈蛋白还可能招募额外的蛋白来实现翻译抑制。

miRNA在许多哺乳动物细胞类型中丰富存在,也存在于细胞外循环miRNA中。细胞外循环miRNA被释放到包括血液和脑脊液在内的体液中,有可能作为多种疾病的生物标志物。此外,许多miRNA在进化上是保守的,这意味着它们具有重要的生物学功能。

二、R包安装

devtools::install_github("omarwagih/ggseqlogo")
BiocManager::install("ETHZ-INS/scanMiR")

三、简单的示例

详情查看代码注释哈:

library(BiocStyle)
library(scanMiR)

# miRNA的序列,可以从miRbase数据库获得
miRNA <- "UUAAUGCUAAUCGUGAUAGGGGUU"

# 加载示例mRNA序列数据
data("SampleTranscript")
print(SampleTranscript)
#[1] "CAACGGATTGGGGGCAGCATTCTCGTCGTTTCGGATCCGGCCTTCTCTTAATAGTGATCTCCGATTACTCCATTGGCGGTCCTGCGAAGTTGATATTCATCAGAAGTTTGTTCTGTGCAACATTGTAGATTTTCATGGCACTCTTCTTCGCCGGCGCATGATCACCCACATTATGCAGATTGCGTCACACATCTTCCTTCTTCGGGTCGGCGTATTAAATTTAGCAAGGTTCCAGTGGTTGAGCACCTAAGTAATTGCACGTCGAACATCTAACTGCTAATAACTATGCTCGGCTAATAACGCCCCAGTCCCAAACAGGGAAGCTTAACTTTGGCATCAGCGTGGTCCAGTGATCGATACAGACGAATGCGGGCTAAGTCAGCATGAATGCTGGTCCTTTTGGCCTAGTACGTTCAGTTTTATCATTTTGGGCGGTAGGCACATTGGCAATTCGGGAGCAATATAGAGTAACGACCCCTATCACGTCCGCAGCATTAAATGGACACTAAACACTCGCGAATCGTATCGGATTGCCTTCTATTCGCGTATCGCGTCGTCAGAGTAAGAGCTAGAGTGTGATAATTGACTGACCCAATTGAAGGGATATATACGGGAAGCGGTTGACCGGAAGCACAGGTTATAGACCCTGCTGCTTGGCTCTCTACCCCCTTCCTTGTCGGAGAGCATTTTGAGCATTATGATGCAAGGGAATCTTCGCTCGGGGGTCGCCGATCCACGCTATCGCAAGATGGTTCAGGCTTCGTTCTCCGAAGAGACACATTAGTTATACCTGCTTTTGAGCGCGCAATCCCAAGGGACCATCGACACACGGACCGGGTCACACGACACACCGGACAGCAAACAACGTCCAAGTGACCTTCAGATTTCAGCAGACTAG"

# 执行匹配
matches <- findSeedMatches(SampleTranscript, miRNA, verbose = FALSE)
matches      # 简单看一下返回的结果
#GRanges object with 2 ranges and 3 metadata columns:
#      seqnames    ranges strand |     type  p3.score  note
#         <Rle> <IRanges>  <Rle> | <factor> <integer> <Rle>
#  [1]     seq1   491-498      * |  8mer           12 TDMD?
#  [2]     seq1   692-699      * |  7mer-m8         0     -
#  -------
#  seqinfo: 1 sequence from an unspecified genome; no seqlengths

# 简单看看结合模式
viewTargetAlignment(matches[1], miRNA, SampleTranscript)
#miRNA             3'-UUGGGGAUAGUGC-UAA-UCGUAAUU-5'     
#                      ||||||||||||     ||||||||        
#target 5'-...NGAGUAACGACCCCUAUCACGUCCGCAGCAUUAAAU...-3'

# 当然,也可以输出为图片
viewTargetAlignment(matches[1], miRNA, SampleTranscript, outputType = "plot")

图片

更多函数:
  • aggregateMatches: aggregateMatches

  • assignKdType: assignKdType

  • c-method: miRNA affinity models

  • conservation: conservation

  • dummyKdData: Create dummy log_kd per 12-mer data

  • findSeedMatches: Predicting and characterizing miRNA binding sites

  • get3pAlignment: Finds 3' complementary binding of a miRNA

  • get8merRange: get8merRange

  • getKdModel: getKdModel

  • getKmers: getKmers

  • getMatchTypes: getMatchTypes

  • getRandomSeq: getRandomSeq

  • getSeed8mers: getSeed8mers

  • KdModel: miRNA affinity models

  • KdModel-class: miRNA affinity models

  • KdModel-methods: miRNA affinity models

  • KdModelList: KdModelList

  • KdModelList-class: KdModelList

  • KdModelList-methods: Methods for the 'KdModelList' classes

  • KdModelList-methods-method: Methods for the 'KdModelList' classes

  • plotKdModel: plotKdModel

  • removeOverlappingRanges: removeOverlappingRanges

  • SampleKdModel: Example KdModel (hsa-miR-155-5p)

  • SampleTranscript: Example transcript sequence

  • show-method: miRNA affinity models

  • summary-method: miRNA affinity models

  • summary-method: Methods for the 'KdModelList' classes

  • viewTargetAlignment: viewTargetAlignment

参考链接:
  • https://academic.oup.com/bioinformatics/article/38/9/2466/6533438?login=false

  • McGeary S.E.  et al.  (2019) The biochemical basis of microRNA targeting efficacy. Science, 366, eaav1741.

  • Wiki

简单分享到这 

各位早点休息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2201207.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity 克隆Timeline并保留引用

Timeline的资源是.playable文件&#xff0c;简单的复制不会保留引用关系。 下面的脚本可以复制引用关系。 using System.Collections.Generic; using System.Linq; using System.Reflection; using UnityEngine; using UnityEngine.Playables; using UnityEngine.Timeline; u…

Node.js入门——fs、path模块、URL端口号、模块化导入导出、包、npm软件包管理器

Node.js入门 1.介绍 定义&#xff1a;跨平台的JS运行环境&#xff0c;使开发者可以搭建服务器端的JS应用程序作用&#xff1a;使用Node.Js编写服务器端代码Node.js是基于Chrome V8引擎进行封装&#xff0c;Node中没有BOM和DOM 2.fs模块-读写文件 定义&#xff1a;封装了与…

(03)python-opencv图像处理——图像的几何变换

前言 1、变换 2、缩放 3、平移变换 4、旋转 5、仿射变换 6、翻转 参考文献 前言 在本教程中&#xff1a; 你将会学到将不同的几何变换应用于图像&#xff0c;如平移、旋转、仿射变换等。你会学到如下函数&#xff1a;cv.getPerspectiveTransform 图像的几何变换是图像…

Ping32引领数据防泄漏新潮流:智能、高效、安全

在当今数字化迅猛发展的时代&#xff0c;企业面临着日益严峻的数据安全挑战。数据泄漏事件频发&#xff0c;不仅损害企业声誉&#xff0c;还可能导致巨额的经济损失。为此&#xff0c;Ping32以其创新的数据防泄漏解决方案&#xff0c;正在引领行业新潮流。其技术特点可概括为“…

017 平台属性[属性分组、规格参数、销售属性]

文章目录 获取指定分类的属性列表AttrController.javaAttrServiceImpl.java 获取属性分组所关联的所有属性AttrGroupControllerAttrServiceImpl.java 移除AttrGroupController.javaAttrServiceImpl.javaAttrAttrgroupRelationDao.javaAttrAttrgroupRelationDao.xml 获取属性分组…

动态规划算法专题(六):回文串问题

目录 1、回文子串&#xff08;"引子题"&#xff09; 1.1 算法原理 1.2 算法代码 2、最长回文子串 2.1 算法原理 2.2 算法代码 3、分割回文串 IV&#xff08;hard&#xff09; 3.1 算法原理 3.2 算法代码 4、分割字符串 II&#xff08;hard&#xff09; 4…

甲虫身体图像分割系统源码&数据集分享

甲虫身体图像分割系统源码&#xff06;数据集分享 [yolov8-seg-EfficientRepBiPAN&#xff06;yolov8-seg-C2f-FocusedLinearAttention等50全套改进创新点发刊_一键训练教程_Web前端展示] 1.研究背景与意义 项目参考ILSVRC ImageNet Large Scale Visual Recognition Challen…

C语言之扫雷小游戏(完整代码版)

说起扫雷游戏&#xff0c;这应该是很多人童年的回忆吧&#xff0c;中小学电脑课最常玩的必有扫雷游戏&#xff0c;那么大家知道它是如何开发出来的吗&#xff0c;扫雷游戏背后的原理是什么呢&#xff1f;今天就让我们一探究竟&#xff01; 扫雷游戏介绍 如下图&#xff0c;简…

从0开始linux(12)——命令行参数与环境变量

欢迎来到博主的专栏&#xff1a;从0开始linux 博主ID&#xff1a;代码小豪 文章目录 命令行参数环境变量 我们先打断一下关于进程的话题&#xff0c;博主先来介绍两个东西&#xff0c;分别是命令行参数与环境变量。那么有人看到这就会问了&#xff0c;难道说命令行参数和环境变…

Spring系列 循环依赖

文章目录 注入方式循环依赖的场景单例创建流程getSingletoncreateBeandoCreateBeancreateBeanInstance 循环依赖分析为什么都使用构造函数无法解决&#xff1f;为什么使用Autowired可以解决&#xff1f;为什么要添加到 earlySingletonObjects 缓存中&#xff1f;allowCircularR…

基于Kafka2.1解读Producer原理

文章目录 前言一、Kafka Producer是什么&#xff1f;二、主要组件1.Kafka Producer1.1 partitioner1.2 keySerializer1.3 valueSerializer1.4 accumulator1.5 sender 2.Sender2.1 acks2.2 clientinFlightBatches 3. Selector3.1 nioSelector3.2 channels 4. 全局总览 总结 前言…

【hot100-java】N 皇后

回溯篇 视频题解 真的裂开了&#xff0c;多看视频题解。 class Solution {public List<List<String>> solveNQueens(int n) {List<List<String>>retnew ArrayList<>();int []colnew int[n];boolean[] onPathnew boolean[n];boolean[] diag1ne…

(Linux和数据库)1.Linux操作系统和常用命令

了解Linux操作系统介绍 除了办公和玩游戏之外不用Linux&#xff0c;其他地方都要使用Linux&#xff08;it相关&#xff09; iOS的本质是unix&#xff08;unix是付费版本的操作系统&#xff09; unix和Linux之间很相似 Linux文件系统和目录 bin目录--放工具使用的 操作Linux远程…

双光吊舱图像采集详解!

一、图像采集 可见光图像采集&#xff1a; 使用高性能的可见光相机&#xff0c;通过镜头捕捉自然光或人工光源照射下的目标图像。 相机内部通常配备有先进的图像传感器&#xff0c;如CMOS或CCD&#xff0c;用于将光信号转换为电信号。 红外图像采集&#xff1a; 利用红外热…

【hot100-java】二叉树的最近公共祖先

二叉树篇 我觉得是比两个节点的深度&#xff0c;取min&#xff08;一种情况&#xff09; DFS解题。 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode(int x) { val x; }* }*/ clas…

Unity/VS 消除不想要的黄色警告

方法一&#xff1a;单个消除 在要关闭的代码前一行写上#pragma warning disable 警告代码编码 在要关闭代码行下面一行写上#pragma warning restore 警告代码编码 精准的关闭指定地方引起的代码警告&#xff0c;不会过滤掉无辜的代码 #pragma warning disable 0162,1634HandleL…

JDBC: 连接池

文章目录 没有连接池的现状连接池解决现状问题的原理连接池好处常用连接池的介绍Druid连接池DRUID简介Druid常用的配置参数Druid连接池基本使用API介绍 案例代码 没有连接池的现状 通过下图来分析一下我们目前jdbc程序的结构。 以前使用的jdbc的缺点&#xff1a; 1、操作数据库…

户外打气泵方案软件设计开发

随着户外活动的普及和人们对便捷生活的需求&#xff0c;打气泵成为越来越多有车人士及爱好户外运动的人的装备之一。而打气泵的核心控制是它的芯片和软件方案&#xff0c;今天我们就介绍一下打气泵芯片软件方案的开发过程与技术要点。 打气泵方案的软件设计相较于硬件更具复杂性…

数据库——sql多表查询

当要在两个表&#xff08;或多个表&#xff09;中查找对应数据时&#xff0c;与普通的查询略有不同。本篇博文用于介绍基本的多表查询的方法。 为方便展示&#xff0c;本篇建了两个数据库表“学生表”和“班级表”作为例子 其中&#xff0c;在“学生表”中&#xff0c;cid标签…

RT-DETR改进策略:BackBone改进|CAFormer在RT-DETR中的创新应用,显著提升目标检测性能

摘要 在目标检测领域,模型性能的提升一直是研究者和开发者们关注的重点。近期,我们尝试将CAFormer模块引入RT-DETR模型中,以替换其原有的主干网络,这一创新性的改进带来了显著的性能提升。 CAFormer,作为MetaFormer框架下的一个变体,结合了深度可分离卷积和普通自注意力…