【20220605】文献翻译:高维数据动态可视化研究综述

news2024/11/14 6:33:18

A Review of the State-of-the-Art on Tours for Dynamic Visualization of High-dimensional Data


Visualization of High-dimensional Data)

Lee, Stuart, et al. “A Review of the State-of-the-Art on Tours for Dynamic Visualization of High-dimensional Data.” arXiv preprint arXiv:2104.08016 (2021).

本文讨论了一种称为tour的高维可视化技术,它可以用于查看三维以上的数据。我们回顾了该技术背后的理论和历史,以及在科学和机器学习中发现的现代软件开发和应用。

在这里插入图片描述

图1:说明了本文中“高维”和“线性投影”的含义。以线框图的形式,由一维到5D的维度递增的立方体序列可以看出,当维度增加1时,立方体会翻倍。

在这里插入图片描述

图2:当用户在左侧面板上刷数据时,该区域内的点以橙色突出显示。右边的视图通过强调相应的点来回应。摘自Cook等人,2007年图2.12。

在这里插入图片描述

图3:用t-SNE (A)和tour (B)从10 d非线性降维的结构感知比较。在t-SNE视图中,有6个簇,但簇之间的相对距离变化很大。这可以从所示的旅游预测样本中看出。这两个绿色的星团(几乎)是球形的,与橙色星团的距离非常远。其中三个橙色星团彼此非常接近(仅在B.1中可见),所有橙色星团都是椭圆形的。该指南提供了高维空间中集群的更准确的呈现,并补充了从降维中学到的内容。

Dynamic visualization of high-dimensional data

降维(DR)是高维数据分析中的一种标准方法。除了降低噪声和促进下游计算分析,DR方法被广泛用于在二维或三维可视化数据。事实上,已经开发了许多DR方法来生成高维数据的可视化信息。目前比较流行的数据可视化DR方法包括线性主成分分析(PCA)、非线性t分布随机邻居嵌入(t-SNE)[1]和统一流形逼近与投影(UMAP)[2]。已经开发了许多其他DR方法来解决常用的t-SNE和UMAP方法的缺点[3-5]。可视化的DR方法已经在广泛的不同学科中找到了特定的用途。一些例子包括在单细胞生物学中验证细胞类型身份[6,7],从深度学习模型探索输入嵌入,探索人类基因组[8]的地理模式,以及解剖恒星物体[9]的化学丰度。尽管DR方法在高维数据可视化方面很受欢迎,但这些方法在低维可视化质量上存在失真和异质性[6,10-14]。因此,天真地使用DR方法来验证、确认或告知研究结果和方向很容易由于这些歪曲而被误解。例如,在单细胞生物学领域,通常使用t-SNE或UMAP可视化来确认[6]簇的细胞类型身份,整合不同的单细胞数据集[15 - 17],并使用RNA速度测量来计算细胞轨迹[18,19]。对于前面提到的每一个用例,观测者变化之间的距离和DR可视化质量的异质性都存在扭曲,并可能影响最终的解释[10,13,20 - 22]。一般来说,通过这些扭曲,DR可视化可能会导致簇的验证不正确(即低簇或过簇),人工检测或缺乏对簇之间桥接连接的检测,以及人工存在沿元数据轴的观测顺序或丢失。

降维法(DR)通常用于将高维数据投影到低维数据中进行可视化,从而产生新的见解和假设。然而,DR算法必然会在可视化中引入失真,并且不能完全代表数据中的所有关系。因此,需要有评估DR可视化可靠性的方法。在这里,我们提出了DynamicViz,这是一个生成动态可视化的框架,它捕获了DR可视化对数据扰动的敏感性。DynamicVic可以应用于所有常用的DR方法。我们展示了动态可视化在诊断静态可视化的常见解释缺陷和扩展现有单细胞分析方面的效用。我们引入方差分数来量化这些可视化中观测结果的动态可变性。方差分数表征了数据的自然可变性,可以用来优化DR算法的实现。我们已经免费提供DynamicViz来帮助评估DR可视化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/710234.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【书评】一本Android系统性能优化的新书

Android性能优化,是一个合格的Android程序员必备的技能,现如今几乎所有的Android面试内容都会或多或少涉及性能优化方面的话题。 学习Android性能优化可以让我们在简历上展示自己的专业技能和项目经验,证明自己具备高效开发和优化Android应用…

java jwt生成token并在网关设置全局过滤器进行token的校验

1、首先引入jjwt的依赖 <dependency><groupId>io.jsonwebtoken</groupId><artifactId>jjwt</artifactId><version>0.9.1</version> </dependency>2、编写生成token的工具类 package com.jjw.result.util;import com.jjw.res…

【UnityDOTS 三】Component的理解

Component的理解 文章目录 Component的理解前言一、托管Component与非托管Component1.非托管Component2.托管Component 二、各功能的Component三、在Editor中的Component的区分总结 前言 Component作为ECS中承载数据的结构&#xff0c;了解他相关内容是非常必要的&#xff0c;…

基于Jsp+Servlet+Mysql学生信息管理系统

基于JspServletMysql学生信息管理系统 一、系统介绍二、功能展示1. 系统的部署2.导入数据库3. 系统介绍 四、其它1.其他系统实现五.获取源码 一、系统介绍 项目类型&#xff1a;Java web项目/Java EE项目/ 项目名称&#xff1a;基于sevelet的学生信息管理系统 当前版本&…

用Python制作一个简单时间、日期显示工具

Python是一款强大的编程软件&#xff0c;可以轻松实现我们的多种开发需求。今天我们拿Python中自带的tkinter来开发一个时钟显示器。如下图所示&#xff1a; 时间显示器 一、编程要求 用tkinter写一个漂亮、五彩的时间显示器&#xff0c;要求显示时、分、秒&#xff0c;即时变…

【JAVA】十分钟带你了解java的前世今生

个人主页&#xff1a;【&#x1f60a;个人主页】 系列专栏&#xff1a;【初始JAVA】 文章目录 前言JAVA介绍诞生&#x1f52c;名字与图标&#x1f916;发展&#x1f6e9;️未来&#x1fa84; 前言 玩过我的世界的朋友想必对JAVA以及它的图标都很熟悉&#xff0c;在游戏开始画面…

Java程序所在机器性能监控

Java程序所在机器性能监控 背景 问题单&#xff1a;程序故障&#xff08;OOM、网络不通、操作卡顿&#xff09;问题单&#xff1a;服务连接不上需求 1、监控本地机器性能 告警日志UI2、监控服务接口服务 告警日志UI方案 固定间隔获取机器网络CPU内存数据设置阈值&#xff0c;告…

自定义starter实现接口或方法限流功能

本文的思路是利用AOP技术自定义注解实现对特定的方法或接口进行限流。目前通过查阅相关资料&#xff0c;整理出三种类型限流方法&#xff0c;分别为基于guava限流实现、基于sentinel限流实现、基于Semaphore的实现。 一、限流常用的算法 1.1令牌桶算法 令牌桶算法是目前应用…

OpenCV(视频加载与摄像头使用)

目录 1、VideoCapture类 2、视频属性get() 3、视屏文件保存 1、VideoCapture类 2、视频属性get() 3、视屏文件保存 //视频的读取保存 int test3() {VideoCapture video;//video.open("F:/testMap/lolTFT.mp4");//读取视频video.open(0);//读取摄像头if (!video.i…

linux docker安装

一、Linux安装docker 1.1 前提 要求Linux内核&#xff08;kernel&#xff09; 版本大于等于3.8。&#xff08;kernel version >3.8&#xff09;。 查看当前系统内核版本 uname -a | awk {split($3,arr,"-");print arr[1]} 1.2 linux 安装docker Centos安装doc…

【数据结构与算法】7、队列(Queue)的实现【用栈实现队列】

目录 一、队列介绍二、使用 LinkedList 实现队列三、LeetCode&#xff1a;用【栈】实现队列(1) 老师讲之前我自己的实现&#xff08;Correct&#xff09;(2) 实现思路(3) 代码实现 四、jdk 的 Queue五、双端队列&#xff08;Deque&#xff09;六、循环队列(1) 分析(2) 入队(3) …

Linux--运行指令的本质

本质&#xff1a; ①找到它 which的作用就是找到它 ②运行它 示例&#xff1a; ①告诉系统要运行的指令&#xff0c;然后系统去查找它的路径并运行它 ②自己告诉系统自己要运行的路径&#xff0c;然后系统运行它 注意&#xff1a;a.out不能运行&#xff0c;而./a.out能运行…

MES是如何帮助企业提高生产效率的

大多数提高制造生产效率的系统都是从详细分析公司的制造流程和运营开始的。这样做的目的是是为了消除浪费的不增值的流程&#xff0c;将有价值的流程系统化&#xff0c;实现生产自动化并增强增值操作。 在自动化流程方面&#xff0c;实施制造执行系统&#xff08;MES&#xff…

HTML5 游戏开发实战 | 俄罗斯方块

俄罗斯方块是一款风靡全球的电视游戏机和掌上游戏机游戏&#xff0c;它曾经造成的轰动与造成的经济价值可以说是游戏史上的一件大事。这款游戏看似简单但却变化无穷&#xff0c;游戏过程仅需要玩家将不断下落的各种形状的方块移动、翻转&#xff0c;如果某一行被方块充满了&…

发送邮箱验证码【spring boot】

⭐前言⭐ ※※※大家好&#xff01;我是同学〖森〗&#xff0c;一名计算机爱好者&#xff0c;今天让我们进入学习模式。若有错误&#xff0c;请多多指教。更多有趣的代码请移步Gitee &#x1f44d; 点赞 ⭐ 收藏 &#x1f4dd;留言 都是我创作的最大的动力&#xff01; 1. 思维…

Redis6之穿透、击穿、雪崩

大量的高并发的请求打在Redis上&#xff0c;但是发现Redis中并没有请求的数据&#xff0c;redis的命令率降低&#xff0c;所以这些请求就只能直接打在DB&#xff08;数据库服务器&#xff09;上&#xff0c;在大量的高并发的请求下就会导致DB直接卡死、宕机。 缓存穿透 当客户端…

一例Phorpiex僵尸网络样本分析

本文主要分析Phorpiex僵尸网络的一个变种&#xff0c;该样本通常NSIS打包&#xff0c;能够检测虚拟机和沙箱。病毒本体伪装为一个文件夹&#xff0c;通过U盘来传播&#xff0c;会隐藏系统中各盘符根目录下的文件夹&#xff0c;创建同名的lnk文件&#xff0c;诱导用户点击。 病…

TF卡/U盘系统备份

Jetson nano使用TF卡/U盘来装载系统&#xff0c;如果TF卡/U盘丢失或者损坏&#xff0c;那么Jetson nano上的数据都会丢失&#xff0c;所以一定要备份好TF卡/U盘。这篇文章可以帮你备份你的Jetson nano系统。主要内容为备份TF卡/U盘&#xff0c;制作Jetson nano系统镜像以及在需…

Java——《面试题——ElasticSearch篇》

目录 1、谈谈分词与倒排索引的原理 2、说说分段存储的思想 3、谈谈你对段合并的策略思想的认识 4、了解文本相似度 TF-IDF吗 5、能说说ElasticSearch 写索引的逻辑吗&#xff1f; 6、熟悉ElasticSearch 集群中搜索数据的过程吗&#xff1f; 7、了解ElasticSearch 深翻页的…

vsCode 创建新java项目(创建一个新java项目测试方法)

VSCODE环境配置-java之项目建立&#xff0c;非常适合刚准备使用VSCODE开发JAVA的人_vscode创建java项目_rainmenzhao的博客-CSDN博客 1 按 ctrl shift p 2 输入 create Java project 3 选 no build tools 4 选择 一个文件夹 存放 之后要 新建的文件 5 选完之后 自动返回主页…