详细解答T-SNE程序中from sklearn.manifold import TSNE的数据设置,包括输入数据,绘制颜色的参数设置,代码复制可用!!

news2024/11/17 5:30:39

在这里插入图片描述

文章目录

  • 前言——TSNE是t-Distributed Stochastic Neighbor Embedding的缩写
  • 1、可运行的T-SNE程序
  • 2. 实验结果
  • 3、针对上述程序我们详细分析T-SNE的使用方法
    • 3.1 加载数据
    • 3.2 TSNE降维
    • 3.3 绘制点
    • 3.4 关于颜色设置,颜色使用的标签数据的说明c=y
  • 总结


前言——TSNE是t-Distributed Stochastic Neighbor Embedding的缩写

TSNE是t-Distributed Stochastic Neighbor Embedding的缩写,它是一个非线性降维算法。

TSNE的主要作用和优点如下:

  • 高维数据投影到低维空间,如二维或三维,实现高维数据的可视化。

  • 相比其他降维方法如PCA,TSNE在保留局部结构信息上的效果更好,尤其适用于高维稠密数据。

  • 它可以很好地区分数据中的簇结构,有利于观察不同类别或类型的数据分布情况

1、可运行的T-SNE程序

from sklearn.datasets import load_iris
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')

# 加载数据
iris = load_iris()
X = iris.data
y = iris.target

# TSNE降维
tsne = TSNE(n_components=2, random_state=0)
X_tsne = tsne.fit_transform(X)

# 绘制点
plt.scatter(X_tsne[:,0], X_tsne[:,1], c=y, marker='o', s=5)

# 添加图例
plt.legend(iris.target_names)

# 添加标题
plt.title("TSNE projection of the Iris dataset")

plt.show()

2. 实验结果

在这里插入图片描述

3、针对上述程序我们详细分析T-SNE的使用方法

3.1 加载数据

  • load_iris()函数从sklearn.datasets模块加载鸢尾花数据集,
  • iris包含数据集的特征数据X标签数据y

3.2 TSNE降维

  • TSNE是一种非线性降维算法,用于高维数据的可视化。它可以将高维数据投影到二维或三维空间。

  • TSNE(n_components=2)实例化一个TSNE模型,降维后的维度数设为2

  • random_state=0固定随机数种子,使得结果可重复

  • fit_transform(X)对特征数据X进行降维,返回降维后的新特征X_tsne。

3.3 绘制点

  • X_tsne包含每个样本的二维坐标

  • plt.scatter以(x,y)坐标方式绘制每个点,c=y指定点的颜色

  • marker='o’设置点的形状为圆形

  • s=5控制点的大小

通过TSNE降维,高维数据X被投影到二维空间,得到低维表示X_tsne。然后根据X_tsne和y进行散点图绘制,就可以实现TSNE降维结果的可视化。这是TSNE的标准流程。

3.4 关于颜色设置,颜色使用的标签数据的说明c=y

c=y这行代码的含义和作用是:

  • c参数用于设置散点图中每个点的颜色。

  • y变量包含了样本的类别标签信息。对于鸢尾花数据集来说,y取值为0、1或2,分别表示三种花的类别

  • 当我们设置c=y时,就是根据每个样本在y中的类别标签值,来动态设置这个样本点在散点图中的颜色

  • 具体来说:

    • 如果一个样本的y值为0,那么这个点的颜色就会取颜色映射中的第一个颜色。

    • 如果y值为1,点颜色取第二个颜色。

    • 如果y值为2,点颜色取第三个颜色。

  • 这样每个类别的样本点就会使用不同的颜色来绘制,从而在可视化结果中清晰区分开各个类别。


总结

  • 在科研中,TSNE广泛应用于图像分类、自然语言处理等领域的数据降维和可视化。

  • 比如对神经网络分类结果进行TSNE降维,可以观察不同类别样本在特征空间中的分布,有助于分析模型表现。

  • 对文本语料进行TSNE降维,可以观察词汇在语义空间中的分布,帮助理解语义结构。

  • 对单细胞RNA-seq数据进行TSNE降维,可以观察不同类型细胞在表达空间中的分布,有助于发现新型细胞亚群。

所以总体来说,TSNE通过高效的降维和保留局部结构,有助于科研人员直观观察高维数据的内在结构,分析模型效果,发现数据中的新知识,从而推动科研工作的进展。它为数据可视化和理解提供了重要的工具支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1247401.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Apollo接入配置中心 -- 源码分析之如何获取配置

全文参考:https://mp.weixin.qq.com/s/G5BV5BIdOtB3LlxNsr4ZDQ https://blog.csdn.net/crystonesc/article/details/106630412 https://www.cnblogs.com/deepSleeping/p/14565774.html 背景:近期在接入行内配置中心,因此对配置的加载接入有了…

浅析三相异步电动机控制的电气保护

安科瑞 华楠 摘 要:要求三相异步电动机的控制系统不仅要保证电机正常启动和运行,完成制动操作,还要通过相关保护措施维护电动机的安全使用。基于此,本文以电动机电气保护作为研究对象,结合三相异步电动机的机械特点&…

electerm 跨平台的终端 /ssh/sftp 客户端

文章目录 electerm功能特性主题配色 electerm 每个程序员基本都离开SSH链接工具,目前市场上好用的基本都是收费的 给大家推荐一款国人开发的开源链接工具https://github.com/electerm/electerm 到目前为止star已经9.5K了,非常受欢迎 功能特性 支持ssh,telnet,serialport,本地和…

满满干货!搭建智能视频监控系统如何挑选前端设备?

在此前的文章中,小编也和大家讨论过如何选择适合场景需求又性价比高的摄像头。除了摄像头以外,智能监控系统的组成也少不了前端设备,今天就给大家介绍一下几大前端设备的区别与应用场景吧。 在智能视频监控中,前端设备一般分为四类…

功率放大器在介电弹性体测试中的应用案例

介电弹性体作为一种具有高介电常数的材料,近年来越来越受到人们的关注。由于其具有许多独特的性质,如高灵敏度、快速响应以及出色的循环稳定性,使其在许多领域都有广泛的应用,如电子皮肤、传感器和执行器等。在介电弹性体的测试中…

rocky8.9配置K8S集群kubernetes,centos同理

rocky8.9配置K8S集群 节点主机名IP地址mastertang1192.168.211.101node1tang2192.168.211.102node2tang3192.168.211.103 1)准备工作 全部主机都配置静态ip vi /etc/sysconfig/network-scriptsTYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DE…

AI智能识别如何应用于单病种上报?

何为AI? AI是人工智能(Artificial Intelligence)的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,该领域的研究包括机器人、语言识别…

C++算法 —— 贪心(3)

文章目录 1、买卖股票的最佳时机2、买卖股票的最佳时机Ⅱ3、K次取反后最大化的数组和4、按身高排序5、优势洗牌6、最长回文串7、增减字符串匹配 1、买卖股票的最佳时机 121. 买卖股票的最佳时机 这里最容易想到的就是暴力枚举,两层for循环,i 0&#xf…

TFA-Net

TFA SCA means ‘Self-Context Aggregation’ 作者未提供代码

JVM中如何实现垃圾收集

Java虚拟机(JVM)使用垃圾收集器(Garbage Collector)来管理内存,清理不再使用的对象以释放内存空间。垃圾收集的主要目标是自动化内存管理,使开发人员无需显式地释放不再使用的内存,从而降低了内…

EFAK-v3.0.1版部署与使用

一、前言 EFAK((Eagle For Apache Kafka,以前称为Kafka Eagle)用于在使用 Topic 的情况下监控 Kafka 集群。包含Offset 的产生、Lag的变化、Partition的分布、Owner、Topic的创建以及修改的时间等信息。 二、环境&安装包 官方下载连接E…

使用python 实现华为设备的SFTP文件传输

实验目的: 公司有一台CE12800的设备,管理地址位172.16.1.2,现在需要编写自动化脚本,通过SFTP实现简单的上传下载操作。 实验拓扑: 实验步骤: 步骤1:将本地电脑和ensp的设备进行桥接&#xff…

华为云之SFS弹性文件服务使用体验

华为云之SFS弹性文件服务使用体验 一、本次实践介绍1.1 实践环境简介1.2 本次实践目的 二、SFS弹性文件服务介绍2.1 SFS弹性文件服务简介2.2 SFS弹性文件服务特点 三、购买ECS弹性云服务器3.1 购买ECS弹性云服务器3.2 查看ECS弹性云服务器状态3.3 远程连接ECS3.4 检查操作系统版…

线程信息分析,生产环境问题

现象: 应用服务器启动不了 产生原因: 最近升级了,将单线程查询数据变成了多线程查询数据。 分析: 推测一、sql 查询时间太慢导致 排查sql 后发现,不是这个原因 取回线程启动过程的线程信息 发现线程死锁了&…

无线通信:基于深度强化学习

这里写自定义目录标题 异构蜂窝网络:用户关联和信道分配a stochastic gameMulti-Agent Q-Learning MethodMulti-Agent dueling double DQN Algorithm 分布式动态下行链路波束成形Limited-Information Exchange ProtocolDistributedDRL-Based DTDE Scheme for DDBCDi…

每日一题:LeetCode-102.二叉树的层序遍历

每日一题系列(day 03) 前言: 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 &#x1f50e…

使用Python对CSI相位进行矫正,并进行图像调整

一、前言 我记得我是最早将《MatLab对CSI的相位进行矫正》代码上传至网上的,后面陆续有人进行抄袭,不得已把一些细节和代码进行隐藏。今天整理之前Python代码的时候,发现一些不规范的问题,所以写了这篇博客。 二、使用Python对C…

大数据基础设施搭建 - Hive

文章目录 一、上传压缩包二、解压压缩包三、配置环境变量四、初始化元数据库4.1 配置MySQL地址4.2 拷贝MySQL驱动4.3 初始化元数据库4.3.1 创建数据库4.3.2 初始化元数据库 五、启动元数据服务metastore5.1 修改配置文件5.2 启动/关闭metastore服务 六、启动hiveserver2服务6.1…

手动实现 git 的 git diff 功能

这是 git diff 后的效果,感觉挺简单的,不就是 比较新旧版本,新增了就用 "" 显示新加一行,删除了就用 "-" 显示删除一行,修改了一行就用 "-"、"" 显示将旧版本中的该行干掉了并…

C#FlaUI.UIA实现发送微信消息原理

一 准备 .NetFramework 4.8 FlaUI.UIA3 4.0.0 FlaUInspect V1.3.0 1下载FlaUInspect https://github.com/FlaUI/FlaUInspect FlaUInspect V1.3.0 百度网盘下载 2 NuGet 引用 flaUI.UIA3 4.0.0 二代码部分 1 引用FlaUI using FlaUI.Core; using FlaUI.Core.Automatio…