云平台教程 | 手把手教你主成分分析PCA的可视化

news2024/9/24 1:21:03

·  爱基百客云平台小工具使用

    1.1 爱基百客云平台之PCA分析

    1.2 PCA分析原理

    1.3 参数设置

    1.4 任务查看

    1.5 结果

         1.5.1 PCA图

01

爱基百客云平台小工具使用

首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。

图片

弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!

图片

登陆后,如下图,我们进入到小工具专栏。当前云平台已上线了32款小工具供大家使用,包括基础绘图,高级绘图,差异检验,聚类分析,序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。

图片

1.1 

爱基百客云平台之PCA分析

PCA(主成分分析)是一种广泛使用的数据降维技术,它在多个领域都有重要的意义和应用,用于从数据集中提取最重要的特征。它通过正交线性变换将数据从原始空间转换到新的空间,这个新空间由几个主成分组成,这些主成分在新的空间中具有最大的方差。在基因表达数据分析中,PCA可以帮助研究者识别样本之间的相似性和差异,以及发现基因表达模式。在基因组学中,PCA可以用于分析大规模的基因组数据,帮助识别与疾病相关的基因。

1.2 

PCA分析原理图

1. 数据准备: 在进行PCA之前,数据应该进行中心化处理(即每个变量的均值被设为0)。

2. 标准化尽管中心化可以减少均值的影响,但在某些情况下,你可能还需要对数据进行标准化,即将每个变量的标准差设为1。

3. 计算协方差矩阵计算每个变量的协方差矩阵,这是PCA分析的基础。协方差矩阵描述了每个变量与其他变量之间的关系

图片

4. 计算特征值和特征向量: 通过求解协方差矩阵的特征值和特征向量来找到主成分。特征值表示每个主成分的方差,而特征向量描述了该主成分在原始数据空间中的方向。

5. 选择主成分: 根据特征值选择主成分。通常,我们会保留特征值占总特征值之和的一定比例(例如,95%)的主成分。而PCA图主要是应用了前2~3个主成分在二维或者三维平面对观测数据进行可视化。

爱基百客云平台提供了PCA分析小工具(点击底部阅读原文,即可直达)。

下面我们进行PCA分析实操练习。

首先点击小工具PCA分析。

图片

右侧的工具介绍对PCA分析小工具的主要用途,使用方法以及结果解读做了详细的说明。左侧是必要的输入文件和参数选项。任务名称和任务编号系统会自动生成。后面可用于记录查看具体的任务。小工具提供了示例文件给用户做测试分析。同时,该页面还提供了一些常用参数调节选项。您也可进行自定义,后面将详细介绍。输出名自定义,默认Result。

图片

1.3 

参数设置

输入文件:支持txt(制表符分隔)文本文件,以及Excel专用的xlsx格式,同样支持旧版Excel的xls(Excel 97-2003 )格式。

输入文件需包含基因表达文件和分组文件两个文件。其中表达量文件第一行为样本信息,第一列为基因信息。如下表所示:

图片

分组文件包含两列,第一列为样本信息,第二列为组别信息。不加表头。如下表所示:

图片

如果文件已经上传过,您可以直接点击选择按钮找到需要的文件勾选确定,无须再次上传。

你可以选择是否显示样本名;另外,可以自定义是否添加分组环以及分组环的透明度。散点大小,字体大小;另外可以根据自己的喜欢选择不同的色系,输出名自定义即可。

填写好上述所有的参数后,点击提交即可。

1.4 

任务查看

您可在任务管理栏中查看任务的运行情况和结果。默认情况下新任务将会在最上方展示。也可通过任务名、任务编码、日期点击查询,找到需要的任务。如下图:当状态成功时,表示任务成功结束。

图片

点击下载按钮可直接打包下载全部结果。点击查看按钮可在线查看结果。

图片

您可在在线查看结果后选择是否下载保存。另外如果结果较多时,结果展示区还可通过点击左侧或右侧的箭头进行图片切换。您可挑选自己感兴趣的结果图片进行下载保存。

图片

1.5 

结果

输出结果包含pdf格式和png格式的PCA图。

1.5.1 

PCA图

图片

PCA图的两个轴代表数据的主要变异方向。PC1通常是数据方差最大的轴,而PC2通常是第二大的。在PCA图中,数据点之间的距离可以反映原始数据集中观测值之间的相似度。距离越近的点表示它们在原始数据中的相似度越高。如果数据点在某些区域聚集在一起,这可能表明原始数据中存在聚类或分组。通过PCA图可以观察不同组(如不同实验条件、不同治疗群体等)之间是否在主成分轴上有所分离。如果某些组在PC1和PC2上距离较远,这表明这些组之间存在显著差异。

另外,样本在图中的分布也可以帮助识别异常值或离群点。在PCA图中,异常值可能会远离其他点,这可以用来识别潜在的异常或错误数据。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1906312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

藏汉翻译通工具推荐使用《藏文翻译词典》App:藏族文化的掌上宝典,帮助你了解学习藏语反义词近义词和藏文作文!

如果你正在学习藏语,遇到不同地区的发音不同时,卫藏语、安多语和康巴语,那么你需要一款好用的翻译和语音朗读工具,帮助你掌握藏语。 如果你正在用藏文写作文,发现一些词汇不会时,需要使用藏文词典&#xf…

盘点效率工具RunFlow那些容易被忽略的功能

本文我们将带您了解RunFlow有哪些容易被忽略、但是又非常实用的功能。 固定工作窗口 您还可以通过双击 Ctrl 键来切换窗口固定状态,您也可以在 热点事件 设置页面自定义该快捷键。 预览菜单内容 用浏览器打开剪贴板复制的URL 多行输入 按 CtrlEnter 或 ShiftEnter …

C语言 -- 深入理解指针(二)

C语言 -- 深入理解指针(二) 1. 数组名的理解2. 使用指针访问数组3. 一维数组传参的本质4. 冒泡排序5. 二级指针6. 指针数组7. 指针数组模拟二维数组8. 字符指针变量9. 数组指针变量2.1数组指针变量是什么?2.2 数组指针变量怎么初始化 10. 二维…

海外媒体发稿-全媒体百科

全球知名媒体机构 在全球范围内,有许多知名的新闻机构负责报道世界各地的新闻事件。以下是一些国外常见的媒体机构: AP(美联社)合众国际社(UPI)AFP(法新社)EFE(埃菲通讯社)Europa …

【vue】下载 打印 pdf (问题总结)- 持续更新ing

这里是目录标题 一、pdf1.查看 下载一、pdf 1.查看 下载 样式 Code<template><div><el-table :data="pdfList" style="width: 100%" border ><el-table-columnprop="index"label="序号"width="80"ali…

JVM:介绍

文章目录 一、什么是JVM二、JVM的功能1、解释和运行2、内存管理3、即时编译 三、常见的JVM四、Java虚拟机规范五、HotSpot发展历程 一、什么是JVM JVM的全称为Java Virtual Machine&#xff0c;Java虚拟机。本质上是一个运行在计算机上的程序&#xff0c;职责是运行Java字节码…

气膜体育馆作为临时赛场有哪些优势—轻空间

一、气膜体育馆简介 气膜体育馆是一种利用气膜技术建造的室内场馆&#xff0c;其结构主要由高强度膜材、充气系统和钢缆固定系统组成。通过向膜体内部充气&#xff0c;使其形成稳定的内部压力来支撑整个建筑结构。气膜体育馆因其快速建设、环保节能、灵活多样等优点&#xff0c…

tqdm进度条函数使用 python

1.作用&#xff1a; 通过使用 tqdm &#xff0c;可以让您在处理大量数据或长时间运行的循环时&#xff0c;更好地了解程序的执行进度&#xff0c;增强用户体验。 2.使用 ---可以使用 pip install tqdm 进行安装。 ---tqdm.tqdm(iterator可迭代对象&#xff0c;desc描述符&…

数据中台设计书及建设指南(中台及大数据解决技术方案)

1. 中台概念 2. 推动企业组织模式演进 3. 建设方法 4 .中台内容 5. 数据安全体系 中台内容围绕数据中台建设评估、整体框架、数据采集&#xff0c;结构化、半结构化、非结构化的数据采集&#xff0c;数据计算能力、存储计算引擎、数据架构、数据挖掘、各种不同数据层建设、模型…

7月8号直播预告 | 全国产EtherCAT运动控制器ZMC432HG及其EtherCAT驱动器与控制器常用回零模式介绍

EtherCAT运动控制边缘控制器是工业互联网的关键组件之一&#xff0c;结合丰富的运动控制功能、实时数据采集、处理和本地计算等&#xff0c;具备高度灵活的可编程性和出色的运动控制性能&#xff0c;为运动控制协同工业互联网应用带来巨大市场潜力&#xff0c;同时也使其成为企…

spark shuffle写操作——SortShuffleWriter

写入的简单流程&#xff1a; 1.生成ExternalSorter对象 2.将消息都是插入ExternalSorter对象中 3.获取到mapOutputWriter&#xff0c;将中间产生的临时文件合并到一个临时文件 4.生成最后的data文件和index文件 可以看到写入的重点类是ExternalSorter对象 ExternalSorter 基…

关于振动盘正反料下料逻辑编写

写在前文 借鉴某个程序的逻辑套路写的 1.就是第一个料是正方向&#xff0c;第二个料是反方向。 (* 基础逻辑应该都差不多&#xff0c;这个是一个振动盘&#xff0c;振动盘的末端是一个上下对射的感应器&#xff0c;这个感应器的作用是对射感应到物料的到位信号&#xff0c;末端…

网安加·百家讲坛 | 关昕健:新时代企业数据安全运营思路

作者简介&#xff1a;关昕健&#xff0c;某运营商安全专家&#xff0c;2015年获CISSP认证&#xff0c;长期负责企业安全运营工作&#xff0c;关注国内外数据安全动态与解决方案&#xff0c;持续开展数据安全运营实践。 近年来&#xff0c;随着《数据安全法》的出台和国家数据局…

怎么将视频翻译免费?这篇文章告诉你5个视频翻译的方法

在探索不同文化的经典影视剧时&#xff0c;我们常常被那些精彩绝伦的台词深深吸引。 然而&#xff0c;难以理解的外语符号让我们难以完全领略其魅力。不过&#xff0c;如果你认识免费视频翻译软件的话&#xff0c;那将这些经典台词从陌生的外语符号变成直观的母语表达&#xf…

Git注释规范

主打一个有用 代码的提交规范参考如下&#xff1a; init:初始化项目feat:新功能&#xff08;feature&#xff09;fix:修补bugdocs:文档&#xff08;documentation&#xff09;style:格式&#xff08;不影响代码运行的变动&#xff09;refactor:重构&#xff08;即不是新增功能…

【双出版加持!录用率高!见刊、检索更稳定!】第六届结构抗震与土木工程研究国际学术会议 (ICSSCER 2024,8月16-18)

随着社会的发展&#xff0c;城市规模的不断扩大&#xff0c;建筑形态也趋于多样化和复杂化&#xff0c;建筑结构形式逐渐由规则简单向高层、大跨甚至特殊复杂的方向发展。而房屋建筑是人们正常生活和生产活动的基本场所&#xff0c;房屋建筑结构的安全必须得到充分保障。但是&a…

提升曝光与转化率:速卖通、敦煌网店铺运营结合自养号测评

全球速卖通&#xff08;AliExpress&#xff09;是中国最大的跨境出口B2C平台之一&#xff0c;面向海外买家客户&#xff0c;是全球第三大英文在线购物网站。速卖通是阿里巴巴集团旗下电商业务之一&#xff0c;致力于服务全球中小创业者出海&#xff0c;让天下没有难做的跨境生意…

Maven Nexus3 私服搭建、配置、项目发布指南

maven nexus私服搭建 访问nexus3官方镜像库,选择需要的版本下载:Docker Nexus docker pull sonatype/nexus3:3.49.0 创建数据目录并赋权 sudo mkdir /nexus-data && sudo chown -R 200 /nexus-data 运行(数据目录选择硬盘大的卷进行挂载) docker run -d -p 808…

在线白板工具大揭秘:为何它成为远程团队的必备神器?

一直觉得白板是个很好的工具&#xff0c;不管是学习还是工作&#xff0c;它都能够帮助我们更好地整理思路。 作为一名经常需要远程协作和创意脑暴的职场人&#xff0c;显然传统普通的白板工具已经不够用了。 在这个数字化时代&#xff0c;我们更需要一个电子白板&#xff0c;一…

Chrome 127内置AI大模型攻略

Chrome 127 集成Gemini:本地AI功能 Google将Gemini大模型整合进Chrome浏览器,带来全新免费的本地AI体验: 完全免费、无限制使用支持离线运行,摆脱网络依赖功能涵盖图像识别、自然语言处理、智能推荐等中国大陆需要借助魔法,懂都懂。 安装部署步骤: 1. Chrome V127 dev …