分类模型的预测概率解读:3D概率分布可视化的直观呈现

news2024/12/22 13:26:09

图片

背景

在分类模型中,预测概率不仅是结果,更是模型决策的关键依据。为了更直观地理解这些概率分布,3D可视化提供了一种生动的展示方式,本文通过3D概率分布图,直观展示分类模型的预测概率

代码实现

基于时间序列的3D分布可视化

import datetime
import matplotlib.pyplot as plt
import numpy as np
from mpl_toolkits.mplot3d.art3d import Poly3DCollection
import pandas as pd
plt.rcParams['font.family'] = 'Times New Roman'
plt.rcParams['axes.unicode_minus'] = False
# 示例数据,用于演示
num_samples = 100  # 时间间隔的数量(样本数量)
categories = ['Class A', 'Class B', 'Class C']  # 示例类别名称
probability_df = pd.DataFrame(
    np.random.rand(num_samples, len(categories)),  
    columns=categories
)

# 每个类别的颜色
colors = ['#FF9999', '#99CCFF', '#99FF99']  # 柔和的红色、蓝色和绿色

# 生成时间戳,用作x轴(模拟时间间隔)
start_time = datetime.datetime.now()  # 当前时间作为起点
time_stamps = [start_time + datetime.timedelta(minutes=5 * i) for i in range(num_samples)]  # 每隔5分钟生成一个时间点
time_labels = [ts.strftime('%H:%M') for ts in time_stamps]  # 格式化时间戳为“小时:分钟”形式

# 创建图形和3D坐标轴
fig = plt.figure(figsize=(20, 20))  # 设置图形大小
ax = fig.add_subplot(111, projection='3d')  # 添加3D子图

# 将x值设置为时间索引
x = np.arange(probability_df.shape[0])  # x表示时间序列的索引

# 为每个类别绘制概率分布的曲面图
for i, col in enumerate(probability_df.columns):
    y = np.full_like(x, i)  # y值固定为类别的索引
    z = probability_df[col].values  

    # 定义多边形的顶点
    verts = [[(x[0], y[0], 0)] + [(x[j], y[j], z[j]) for j in range(len(x))] + [(x[-1], y[-1], 0)]]
    poly = Poly3DCollection(
        verts,  # 多边形顶点列表
        facecolors=colors[i % len(colors)],  # 多边形的填充颜色
        edgecolors=colors[i % len(colors)],  # 多边形的边界颜色
        alpha=0.7,  # 透明度
        lw=1.5  # 边框宽度
    )
    ax.add_collection3d(poly)  # 将多边形添加到3D坐标轴

# 设置坐标轴的范围和标签
ax.set_xlim([0, len(x)])  # 设置x轴范围
ax.set_ylim([-0.5, len(probability_df.columns) - 0.5])  # 设置y轴范围
ax.set_zlim([0, 1])  # 设置z轴范围
ax.set_xticks(np.linspace(0, len(x) - 1, 5))  # x轴设置5个等间距刻度
ax.set_xticklabels([time_labels[int(t)] for t in np.linspace(0, len(x) - 1, 5).astype(int)], fontsize=12)  # 设置x轴标签
ax.set_yticks(range(len(probability_df.columns)))  # y轴刻度为类别索引
ax.set_zticks(np.linspace(0, 1, 5))  # z轴设置为0到1之间的5段
ax.set_yticklabels(probability_df.columns, fontsize=12)  # y轴标签为类别名称
# 设置坐标轴标签,并通过 labelpad 参数调整标签与坐标轴的距离
ax.set_xlabel('Time (HH:MM)', fontsize=18, labelpad=20)  # 调整 x轴标签的距离
ax.set_ylabel('Classes', fontsize=18, labelpad=30)  # 调整 y轴标签的距离
ax.set_zlabel('Probability', fontsize=18, labelpad=3)  # 调整 z轴标签的距离
ax.view_init(elev=30, azim=-45)  # 设置3D图的视角(俯仰角30度,方位角-45度)
plt.savefig("probability_visualization_with_time.pdf", format="pdf", dpi=1200)  
plt.show()

图片

通过生成时间序列数据,将数值分布映射到三维空间,直观展示不同类别的数值随时间变化的趋势,基于这个代码的可视化方式,接下来进一步探索如何将分类模型的概率分布用同样的可视化进行映射

模型概率获取

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
plt.rcParams['font.family'] = 'Times New Roman'
plt.rcParams['axes.unicode_minus'] = False
# 读取数据
df = pd.read_excel('2024-12-16-0公众号Python机器学习AI—class (1).xlsx')
# 划分特征和目标变量
X = df.drop(['y'], axis=1)
y = df['y']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, 
                                                    random_state=42, stratify=df['y'])

from sklearn.ensemble import RandomForestClassifier

# 创建随机森林分类器
rf_model = RandomForestClassifier(random_state=42, n_estimators=100)
# 训练模型
rf_model.fit(X_train, y_train)

# 预测类别的概率
probabilities = rf_model.predict_proba(X_test)
# 创建一个 DataFrame,列名为类别
probability_df = pd.DataFrame(probabilities, columns=[f'Prob_Class_{i}' for i in range(probabilities.shape[1])])
# 如果需要,可以添加 X_test 的索引或其他标识列
probability_df.index = X_test.index
# 重置索引,并选择是否保留原索引作为一列
probability_df.reset_index(drop=True, inplace=True)
probability_df.head()

图片

通过构建一个随机森林分类模型,对测试数据进行预测,并生成每个样本属于各个类别的概率分布,以便进一步分析模型的分类行为

3D概率分布可视化-1

from mpl_toolkits.mplot3d.art3d import Poly3DCollection  

# 为每个类别定义颜色
colors = [
    "darkviolet",  # 类别1的颜色
    "teal",        # 类别2的颜色
]

# 创建图形对象和3D坐标轴
fig = plt.figure(figsize=(20, 20))  # 设置图形大小
ax = fig.add_subplot(111, projection='3d')  # 添加3D子图

# 将x值设置为样本索引
x = np.arange(probability_df.shape[0])  # x表示样本的索引

# 为每个类别绘制概率分布
for i, col in enumerate(probability_df.columns):  # 遍历每个类别
    y = np.full_like(x, i)  # y值固定为类别的索引
    z = probability_df[col].values  # z表示类别对应的概率值

    # 创建多边形的顶点
    verts = [[(x[0], y[0], 0)] + [(x[j], y[j], z[j]) for j in range(len(x))] + [(x[-1], y[-1], 0)]]  # 定义多边形的顶点
    poly = Poly3DCollection(
        verts,  # 多边形的顶点列表
        facecolors=colors[i % len(colors)],  # 多边形的填充颜色(按类别循环选择颜色)
        edgecolors=colors[i % len(colors)],  # 多边形的边界颜色
        alpha=0.5,  # 设置透明度
        lw=2  # 边框宽度
    )
    ax.add_collection3d(poly)  # 将多边形添加到3D坐标轴

# 设置坐标轴的范围和标签
ax.set_xlim([0, len(x)])  # 设置x轴范围
ax.set_ylim([-0.5, len(probability_df.columns) - 0.5])  # 设置y轴范围
ax.set_zlim([0, 1])  # 设置z轴范围
ax.set_xticks(np.linspace(0, len(x), 5))  # 设置x轴刻度(等间隔5个点)
ax.set_yticks(range(len(probability_df.columns)))  # 设置y轴刻度为类别索引
ax.set_zticks(np.linspace(0, 1, 5))  # 设置z轴刻度(概率值分为5段)
ax.set_yticklabels(probability_df.columns, fontsize=12)  # 设置y轴刻度标签为类别名称
ax.set_xlabel('Sample Index', fontsize=18)  # 设置x轴标签为“样本索引”
ax.set_ylabel('Classes', fontsize=18)  # 设置y轴标签为“类别”
ax.set_zlabel('Probability', fontsize=18)  # 设置z轴标签为“概率”
ax.view_init(elev=20, azim=-60)  # 设置3D图的视角(俯仰角为20度,方位角为-60度)
plt.savefig("1.pdf", format="pdf", dpi=1200)  
plt.show()

图片

通过3D可视化展示了分类模型的预测概率分布,以样本索引为X轴、类别为Y轴、概率值为Z轴,并使用不同颜色区分类别,使模型的分类结果更加直观

3D概率分布可视化-2

图片

在前面的基础上通过为第一个类别添加概率值的文本标注,使可视化更具解释性和直观性

3D概率分布可视化-3

图片

在所有类别上添加了概率值的文本标注,使得每个样本在每个类别的具体预测概率都可以直接观察到,进一步增强了3D可视化的细节和解释性,适合更精确的模型分析和展示,关注微信公众号:Python机器学习AI

往期推荐

从模型构建到在线部署:基于Stacking集成模型的全流程实现与SHAP可视化

探究SHAP交互效应:基于shap.dependence_plot与自定义可视化方法的对比分析

利用Optuna TPE算法优化RF模型及3D曲面图展示调参过程

nature medicine二分类结局随机森林模型构建与评估复现

期刊配图:分类变量SHAP值的箱线图及可视化优化展示

如何用SHAP解读集成学习Stacking中的基学习器和元学习器以及整体模型贡献

从入门到实践:如何利用Stacking集成多种机器学习算法提高模型性能

整合数据分布+拟合线+置信区间+相关系数的皮尔逊相关可视化

期刊配图:通过变量热图展示样本与模型预测的关联信息

期刊配图:如何有效呈现回归、分类模型的评价指标

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2263752.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Spring】获取Bean对象需要哪些注解

阿华代码,不是逆风,就是我疯 你们的点赞收藏是我前进最大的动力!! 希望本文内容能够帮助到你!! 目录 一:Service(服务存储) 1:存储bean的代码 2&#xff1…

【C++】哈希表实现

目录 一、哈希概念 1.1 直接定址法 1.2 哈希冲突 1.3 负载因子 1.4 将关键字转为整数 二、哈希函数 2.1 除法散列法/除留余数法 2.2 乘法散列图(了解即可) 2.3 全域散列法(了解即可) ​编辑 三、处理哈希冲突 3.1 开放…

Android-相对布局RelativeLayout

相对布局在摆放子视图位置时,按照指定的参考系来摆放子视图的位置,默认以屏幕左上角(0,0)位置作为参考系摆放位置 了解一下接下来都会以代码的方式可视化出来 属性 可选值 说明 layout_alignParentTop true/false 是否让控件相对于父容器顶部对齐 …

Intellij配置scala运行环境

文章目录 Intellij配置scala运行环境下载地址安装插件设置sdk与scala scala项目创建安装可能出现的错误 Intellij配置scala运行环境 下载地址 在centos7上安装intellij https://www.jetbrains.com/idea/download/other.html解压后进入文件夹启动打开ide ./idea-IC-232.1033…

【批量生成WORD和PDF文件】根据表格内容和模板文件批量创建word文件,一次性生成多个word文档和批量创建PDF文件

如何按照Word模板和表格的数据快速制作5000个word文档 ? 在与客户的合作的中需要创建大量的合同,这些合同的模板大概都是一致的,是不是每次我们都需要填充不一样的数据来完成? 今天用表格数据完成合同模板的填充,批量…

深度网络结构中的梯度消失与爆炸原理分析

原理 梯度消失的定义 在深度神经网络中,梯度消失是指在误差反向传播过程中,接近输入层的层次上梯度趋近于零的现象。这导致网络权重的更新非常缓慢,甚至停止,使得训练过程变得极其困难。主要发生在使用Sigmoid或Tanh等饱和激活函…

请求go web后端接口 java安卓端播放视频

前端代码 添加gradle依赖 implementation com.squareup.retrofit2:retrofit:2.9.0 implementation com.squareup.retrofit2:converter-gson:2.9.0 添加访问网络权限 <uses-permission android:name"android.permission.INTERNET" />允许http 请求请求 andro…

乐凡信息智能安全管控方案:助力油气田行业安全管控多方位升级

我国油田地域广阔&#xff0c;分布着大量各种油井&#xff0c;油井开采设备的连续稳定运行是保证石油开采的首要条件。然而&#xff0c;由于油田多位于特殊地理环境中&#xff0c;因而实现油井之间的通信首要问题就是要克服地理环境所带来的限制&#xff0c;传统通信系统的建设…

编辑, 抽成组件

问题 错误思路&#xff1a; 1 dept不能修改&#xff0c; 用watch监听一下&#xff1a;赋值给新的变量进行修改&#xff0c; 问题&#xff1a; currentDept 发生改变&#xff0c; depth也发生了改变&#xff0c;因为是浅拷贝&#xff0c; 用了json.pase(json.stringify(value…

<项目代码>YOLO Visdrone航拍目标识别<目标检测>

项目代码下载链接 &#xff1c;项目代码&#xff1e;YOLO Visdrone航拍目标识别&#xff1c;目标检测&#xff1e;https://download.csdn.net/download/qq_53332949/90163918YOLOv8是一种单阶段&#xff08;one-stage&#xff09;检测算法&#xff0c;它将目标检测问题转化为一…

如何从全局视角规划项目与战略决策(“精准接送”案例、技术架构设计与选型、业务逻辑及产品商业模式探讨)

文章目录 1. 引言2. 项目背景与需求分析2.1 业务背景&#xff08;5W分析法&#xff09;2.2 需求概述功能需求非功能需求 2.3 典型挑战 3. 技术架构设计与选型3.1 技术选型扩展表3.2 架构设计的深度思考3.2.1 核心架构原则3.2.2 实际架构实践 4. 业务逻辑及产品商业模式探讨4.1 …

QT exe文件设置图标【终极解决方案!】

会报错&#xff1a;makefile error 1 将图片转换成ico文件&#xff0c;不能自己改后缀&#xff01;多试几个转换的网站&#xff0c;下面是我使的转换网站【成功了】 在线转换网址&#xff1a; https://onlineconvertfree.com/zh/convert/jpg/ 将图片放在.pro同级下 .pro和…

JAVA:组合模式(Composite Pattern)的技术指南

1、简述 组合模式(Composite Pattern)是一种结构型设计模式,旨在将对象组合成树形结构以表示“部分-整体”的层次结构。它使客户端对单个对象和组合对象的使用具有一致性。 设计模式样例:https://gitee.com/lhdxhl/design-pattern-example.git 2、什么是组合模式 组合模式…

CTFHUB 历年真题 afr-1

发现传参为 ?phello&#xff0c;尝试 ?pflag 发现都是 no 尝试假设它是个PHP文件&#xff0c;利用php伪协议 ?pphp://filter/readconvert.base64-encode/resourceflag 得到 base64 编码再解码发现了本题的 flag n1book{afr_1_solved}

共创共建!葡萄城 SpreadJS 完成 HarmonyOS NEXT 操作系统兼容认证

最新技术资源&#xff08;建议收藏&#xff09; https://www.grapecity.com.cn/resources/ 近日&#xff0c;华为“企业工作必备应用鸿蒙化论坛”在北京圆满落幕&#xff0c;论坛汇聚了众多行业精英和合作伙伴&#xff0c;聚焦讨论企业数字化转型与原生鸿蒙生态融合等话题。葡萄…

Android学习(二)-Kotlin编程语言学习

接上篇文章&#xff0c;我们写如下语法&#xff0c;重新赋值&#xff0c;你会发现报错了&#xff0c;是因为val关键字等同于Java中的final&#xff0c;是无法被改变的&#xff0c;如果想更改数值&#xff0c;换成var即可 函数学习 函数的基本概念 函数是用于封装一段代码的载…

【JavaEE进阶】第一个Spring Boot程序

目录 &#x1f334;安装插件 &#x1f384;Spring Boot介绍 &#x1f333;Spring Boot项目创建 &#x1f6a9;创建Spring Boot项目 &#x1f3c0;jar 包下载不下来问题 &#x1f6a9;启动项目 &#x1f332;目录介绍 &#x1f6a9;src文件 &#x1f6a9;target文件 &…

Oracle 中间件 Webcenter Portal服务器环境搭建

环境信息 服务器基本信息 如下表&#xff0c;本次安装总共使用2台服务器&#xff0c;具体信息如下&#xff1a; Webcenter1服务器 归类 SOA服务器 Ip Address 172.xx.xx.xx.xx HostName wcc01.xxxxxx.com Alias wccprd01 Webcenter2服务器 归类 OSB服务器 Ip Addr…

浅谈文生图Stable Diffusion(SD)相关模型基础

1.U-Net模型基础 1.基础概念 UNet模型是一种基于卷积神经网络的图像分割算法&#xff0c;它采用了U型的网络结构&#xff0c;由编码器&#xff08;下采样路径&#xff09;和解码器&#xff08;上采样路径&#xff09;两部分组成。 编码器负责提取输入图像的特征&#xff0c;…

【潜意识Java】javaee中的SpringBoot在Java 开发中的应用与详细分析

目录 一、前言 二、Spring Boot 简介 三、Spring Boot 核心模块 四、Spring Boot 项目实战&#xff1a;构建一个简单的 RESTful API 1. 创建 Spring Boot 项目 2. 配置数据库 3. 创建实体类 4. 创建 JPA 仓库接口 5. 创建服务层 6. 创建控制器层 7. 测试 API 8. 运…