【神器分享】自从用了这个神器，大规模RNA-seq数据挖掘我也可以

【神器分享】自从用了这个神器，大规模RNA-seq数据挖掘我也可以

news2026/2/11 6:16:04

咱不来虚的，只分享干货，不谈枯燥的理论，只来通俗易懂的操作。先来看一张图：

通过这张图展示的是 GEO数据库中的 RNA-seq数据与芯片数据积累随时间的变化，很显然测序数据从2015年开始就已经超过了芯片数据的累积（生信宝典注：这里没有统计物种信息，芯片能应用的物种少，测序能应用的物种多。现在临床数据分析还是基于芯片的数据量更大一些，有兴趣一起易生信GEO/TCGA专题课程 - 挖掘公共数据，发表自己文章，同时适合GEO和测序数据）。大批量的数据产生固然是个好事，同时也带来了一个问题，公开的RNA-seq数据大多提供的是原始数据，这样就对数据的重新挖掘使用带来了很大困难。为啥嘞，数据量太大，临床医生，小实验室你确定做得了，就连测序数据从原始数据开始的分析都会遇到很多困难？

今天要介绍的神器呢叫做 ARCHS4，它的诞生呢就是为了解决这个问题，过程讲的比较复杂，简单讲就是西奈山医学院的Mayan实验室设计有效的算法把 GEO/SRA的原始数据整合，分析，预处理成方便后续分析的矩阵格式。而且发了一篇Nature communication。就像 TCGA那样的数据库，之所以应用广泛，数据整理的格式就是原因之一呀。该数据库包括人和鼠的sample 187,946 , 其中人84,863，鼠103,083。接下来就看下具体这个神器有哪些功能吧：

数据下载功能Download

https://amp.pharm.mssm.edu/archs4/download.html (后台回复 转录组 获取链接)

可供下载的数据包括：

这里只列举了部分，甚至还包括了 GTEx/TCGA的数据，数据都整理为 H5格式，数据包括原始的 read count数据和 meta data信息，简单讲这些数据都整理成了方便后续分析的矩阵格式，可以这样全部下载。

当然也可以挑选自己感兴趣的下载，可以挑选自己感兴趣的组织，细胞系，也可以手动选择，基因集，Download部分会自动产生下载数据的 R代码，放到 Rstudio运行即可。

这里白介素同学，随便测试下载了一个代码，可以看看长啥样，有R基础的小伙伴应该更容易理解 (ggplot2高效实用指南 (可视化脚本、工具、套路、配色))：

大概就是这样，运行下就可以啦。

https://amp.pharm.mssm.edu/archs4/data.html#

此外数据下载后，就是做数据解析了,H5文件格式的解析，批次效应移除等，都有提供相应的代码 (DESeq2差异基因分析和批次效应移除)：

提供代码链接：https://amp.pharm.mssm.edu/archs4/help.html

查询功能

按 meta data信息查询，可以看下自己感兴趣的组织, 细胞系等的 (这个T-SNE聚类很有意思)。

查找 signature，输入数据为上调和下调基因，寻找match这些基因的sample。

富集查询，找到富集某些基因集的sample然后下载，可以从8个基因集库中选择感兴趣的，比如KEGG库，GO库，其实这是一个反向的操作，与咱们通常的差异分析得到基因集进行富集不同，这是一种通过感兴趣的通路，基因集来找sample。

基因查询功能，遇到一个感兴趣的基因，这时候这个功能就派上用场啦，比如案例给出的 FOXM1基因

点击下就可以得到很多信息：

主要功能就是这些啦，提供处理过的数据下载和查询功能。然后就是了解下这个数据库的背景，文章在2018年4月发表在 Nature Communcations上。

内容就分享到这儿啦，白介素同学祝大家学习愉快！

附上网址：

https://amp.pharm.mssm.edu/archs4/index.html

参考资料：

https://www.nature.com/articles/s41467-018-03751-6

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1963265.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

EtherCAT运动控制器上位机之Python+Qt（一）：链接与单轴运动

EtherCAT运动控制器上位机之Python+Qt（一）：链接与单轴运动

ZMC408CE硬件介绍 ZMC408CE是正运动推出的一款多轴高性能EtherCAT总线运动控制器，具有EtherCAT、EtherNET、RS232、CAN和U盘等通讯接口，ZMC系列运动控制器可应用于各种需要脱机或联机运行的场合。 ZMC408CE支持8轴运动控制，最多可扩展至32轴…

阅读更多...

AI初学者必看：什么是大型语言模型 (LLM)？

AI初学者必看：什么是大型语言模型 (LLM)？

介绍 “人工智能（AI）”一词于 1956 年问世，如今已为大家所熟知。然而，在 ChatGPT 迅速流行之前，AI 的使用和讨论大多局限于科学研究或虚构电影。如今，AI 尤其是生成式 AI 已成为大家热议的话题。初学者生…

阅读更多...

使用Process Explorer和Dependency Walker排查dll动态库加载失败的问题

目录 1、问题描述 2、如何调试Release版本的代码？ 3、使用Process Explorer查看exe主程序加载的dll库列表，发现mediaplay.dll没有加载起来 4、使用Dependency Walker查看rtcmpdll.dll的库依赖关系和接口调用情况，定位问题 4.1、使用Depe…

阅读更多...

html+css+js 实现3D透视倾斜按钮，javascript库之vanilla-tilt.js详解

html+css+js 实现3D透视倾斜按钮，javascript库之vanilla-tilt.js详解

前言：哈喽，大家好，今天给大家分享htmlcss 绚丽效果！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏关注哦 💕 文…

阅读更多...

常用游戏运行库 v4 官方版下载与安装教程 (游戏DLL补全包)

常用游戏运行库 v4 官方版下载与安装教程 (游戏DLL补全包)

前言游戏运行库包含了VC运行库合集，.NET2.0到.NET4.8合集，DirectX9.0 Rapture3D 等游戏必备的系统组件，如果你的游戏安装后无法运行，那么安装这些组件基本上就可以解决。本必备运行库安装包集成32位和64位运行库，是目…

阅读更多...

（自用）MyLog 简单日志 .net6.0 等

（自用）MyLog 简单日志 .net6.0 等

appsettings.json {"LogOnOff": true //true 开启日志；false 关闭日志 } MyLog.cs using System.ComponentModel;namespace Namespace {/// <summary>/// 日志类型枚举/// </summary>public enum LogType{[Description("调试日志&q…

阅读更多...

Android经典面试题之实战经验分享：如何简单实现App的前后台监听判断

Android经典面试题之实战经验分享：如何简单实现App的前后台监听判断

本文首发于公众号“AntDream”，欢迎微信搜索“AntDream”或扫描文章底部二维码关注，和我一起每天进步一点点在Android中判断一个应用是否处于前台或后台，可以使用ActivityLifecycleCallbacks 和 ProcessLifecycleOwner。在Kotlin中&#xff…

阅读更多...

实验2-5-3 求平方根序列前N项和

实验2-5-3 求平方根序列前N项和

//实验2-5-3 求平方根序列前N项和/*本题要求编写程序， 计算平方根序列123⋯的前N项之和。可包含头文件math.h，并调用sqrt函数求平方根。*/#include<stdio.h> #include<math.h> int main(){int n0;scanf("%d",&n);//输入Nint …

阅读更多...

【Canvas与艺术】三环莫比乌斯圈

【Canvas与艺术】三环莫比乌斯圈

【成图】【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>三环莫比乌斯圈</title><style type"text/css"&g…

阅读更多...

测桃花运（算姻缘）的网站系统源码

测桃花运（算姻缘）的网站系统源码

简介： 站长安装本源码后只要有人在线测算，就可以获得收入哦。是目前市面上最火的变现利器。本版本无后台，无数据。本版本为开发的逗号联盟接口版本。直接对接逗号联盟，修改ID就可以直接运营收费赚钱。安装环境：PH…

阅读更多...

可以个性化的网盘与相册服务 PDS

可以个性化的网盘与相册服务 PDS

可以个性化的网盘与相册服务 PDS 什么是PDS企业版企业网盘团队管理用户管理安全策略企业设置文件设置及其他设置专属登录配置使用建议企业网盘用户端开发者版体验感受什么是PDS 在正式开始测评PDS之前，首先来了解一下什么是PDS。PDS 网盘与相册服务（D…

阅读更多...

Pythonic 的从远程列表中提取分支名称方法

Pythonic 的从远程列表中提取分支名称方法

1、问题背景在 Git 版本控制系统中，我们需要经常使用 git ls-remote 命令来获取远程仓库的分支列表。这个命令的输出通常包含分支的哈希值和分支名称，就像这样： db6ad7246abf74cb845baa60e6fe45dacf897612 HEAD 1fc347b17201054d8b5b9…

阅读更多...

YOLOv8 基于BN层的通道剪枝

YOLOv8 基于BN层的通道剪枝

YOLOv8 基于BN层的通道剪枝 1. 稀疏约束训练在损失项中增加对BN层的缩放系数 γ \gamma γ和偏置项 β \beta β的稀疏约束， λ \lambda λ系数越大，稀疏约束越严重 L ∑ ( x , y ) l ( f ( x ) , y ) λ 1 ∑ γ g ( γ ) λ 2 ∑ β g ( β ) L…

阅读更多...

华杉研发九学习日记18 集合泛型

华杉研发九学习日记18 集合泛型

华杉研发九学习日记18 一，集合框架 1.1 集合和数组的区别集合就是在java中用来保存多个对象的容器集合是数组的升级版，集合中只能放置对象[object]. 数组: 在java中用来保存多个具有相同数据类型数据的容器数组弊端： 1.数组只能保存…

阅读更多...

2024AICoding公司全景图及评分

2024AICoding公司全景图及评分

AI Coding背景 AI coding 领域的产品和公司在 2024 年开始爆发了，主要涉及技术进步、市场需求和开发者生态系统的变化。本文会从技术背景，市场需求，生态以及相关评分为大家完整梳理一下相关内容。底层技术大规模预训练模型技术背景&#…

阅读更多...

C#使用OPC组件方式和AB的PLC通信

C#使用OPC组件方式和AB的PLC通信

目录一、PLC硬件配置 1、创建PLC程序 （1）程序工程选择 （2）变量和程序 2、配置程序在模拟器中运行 （1）打开RSLkin Classic （2）仿真器配置 （3）PLC程序…

阅读更多...

我终于搭建完成了我的个人网站！（仅分享，非教程）

我终于搭建完成了我的个人网站！（仅分享，非教程）

先看看我的个人网站~ https://yaoqx.pages.devhttps://yaoqx.pages.dev 来看看我搭建的过程吧！ （仅分享，非教程） 网站技术前端框架：Astro主题：Frosti代码托管：Github网页部署：Cl…

阅读更多...

Vscode ssh Could not establish connection to

Vscode ssh Could not establish connection to

错误表现上午还能正常用vs code连接服务器看代码，中午吃个饭关闭vscode再重新打开输入密码后就提示 Could not establish connection to 然后我用终端敲ssh的命令连接，结果是能正常连接。解决方法踩坑1 网上直接搜Could not establish connectio…

阅读更多...

浮点数如何存储

浮点数如何存储

一、浮点数存储格式符号（sign） s是符号位，1表示负，0表示正阶码（exponent） E的作用是对浮点数加权，这个权重是2的E次幂尾数（significand） M是一个二进制小数二、举例说…

阅读更多...

被爬网站用fingerprintjs来对selenium进行反爬，怎么破？

被爬网站用fingerprintjs来对selenium进行反爬，怎么破？

闲暇逛乎的时候，看到了这个问题： Fingerprintjs实际上就是专门用来识别和追踪浏览器的，要应对起来，确实并非易事。那么，我们要如何应对FingerprintJS的唯一标记技术呢？ 接下来，我们将一起来探讨…

阅读更多...

推荐文章

最新文章