R-kknn包-类别插值可视化绘制

news2024/11/27 22:31:50

前面的推文我们介绍了使用scikit-learn结合分类散点数据,构建机器学习分类模型并将模型结果可视化展示,具体链接如下: 机器学习和可视化还能一起这样用?Python教你全搞定。今天这篇推文,我们就使用R语言的kknn包进行类别插值可视化绘制,主要知识点如下:

  • R-kknn包简介及应用

  • kknn 模型结果可视化绘制

  • 所有完整代码都已整理之我们的线上课程,有需要的同学+v yidianshuyulove 咨询

R-kknn包简介及应用

R-kknn包简介

R-kknn包主要是是用于加权K近邻分类、回归和聚类模型的应用(kknn is a R package for Weighted k-Nearest Neighbors Classification, Regression and Clustering),其官网为:http://klausvigo.github.io/kknn/。很多小伙伴向我反映说:“虽然R的包比较丰富,但在具体的介绍文档描述上海有所欠缺,即看完文档甚至连基本的输入输出都不太清楚”,关于这一点,可以认为是R学习的一个陡峭性,不像Python可以快速上手,这就需要你熟悉了解其基本语法和函数,这里建议新手小白可以买一本书籍进行参考,在有一定基础的同时就直接看英文博客或者官网(讲真的,国内的教程真的是千篇一律,没有新意,当然,小编的公号除外哈)。好了,不扯了,我们继续~~

kknn包的官网描述的就较少,还好有具体的例子可以供参考,这里我们不再赘述,大家可以自行阅读,我们直接给出我们的示例过程。

R-kknn包应用散点数据可视化

在之前,我们需要提供散点数据(用于模型样本) 和*地图数据(c插值的范围)*,散点数据预览如下:

地图数据选择的是四川省的geojson文件,代码读取如下:

sichuang <- "四川省.json"
sichuang <- sf::read_sf(sichuang)
head(sichuang)

地图数据

这里我们先看下散点的分布情况,可视化代码如下:

#导入主题包
library(sf)
library(tidyverse)
library(ggspatial)
library(RColorBrewer)
library(ggtext)
library(hrbrthemes)

#自定义颜色
#my_colormap <- colorRampPalette(rev(brewer.pal(11,'Spectral')))(32)
point2 <- ggplot() + 
  geom_sf(data = sichuang,fill="NA",size=.4,colour="gray60") + 
  geom_point(data = point,aes(x = lon,y = lat,color=factor(label))) +
  scale_color_brewer(palette = "Dark2",name="Label",
                     labels=c("class1","class2","class3","class4","class5")) +
  annotation_scale(location = "bl") +
      # spatial-aware automagic north arrow
       annotation_north_arrow(location = "tr", which_north = "false",
                             style = north_arrow_fancy_orienteering) +
  labs(x="",y="",
       title = "Map Charts in R Exercise 03-2: <span style='color:#D20F26'>Categorical Interpolation</span>",
       subtitle = "processed map charts with <span style='color:#1A73E8'>geom_point()</span>",
       caption = "Visualization by <span style='color:#DD6449'>DataCharm</span>") +
  theme_ipsum(base_family = "Roboto Condensed") +
  theme(
        plot.title = element_markdown(hjust = 0.5,vjust = .5,color = "black",
                             size = 20, margin = margin(t = 1, b = 12)),
        plot.subtitle = element_markdown(hjust = 0,vjust = .5,size=15),
        plot.caption = element_markdown(face = 'bold',size = 12),
  )
point2

可视化结果如下:

R-kknn包应用

在应用kknn进行模型构建之前,我们需要构造出测试数据,即根据地图文件的经纬度范围进行插值得到,再用基于散点数据构建好的kknn模型,预测出插值数据的类别,进行做到类别插值。具体步骤如下:

  1. 构建插值数据 使用sf包的st_bbox() 方法即可计算出地图文件的经纬度范围:

st_bbox(sichuang)
# xmin      ymin      xmax      ymax 
#97.35010  26.04586 108.54649  34.31245 

接下来,使用sf包的st_make_grid() 构建网格数据:

width_in_pixels <- 600
dx <- ((st_bbox(sichuang)["xmax"] - st_bbox(sichuang)["xmin"]) / width_in_pixels)
dy <- dx
height_in_pixels <- floor((st_bbox(sichuang)["ymax"] - st_bbox(sichuang)["ymin"]) / dy)

grid2 <- sf::st_make_grid(sichuang,cellsize = dx,
                         n = c(width_in_pixels, height_in_pixels),
                         what = "centers"
                         )

注意: 这里我们不是直接插入600x600的一个网格,而是,先再行上计算插入600个,再计算每个网格格点的大小,再根据格点大小在列上计算网格个数。

最后,我们使用data.frame()基础方法构建DF数据格式:

result2 = data.frame(lon = st_coordinates(grid2)[,1],
                     lat = st_coordinates(grid2)[,2],
                     label = as.factor(NA))
head(result2)

注意:由于类别是因子(factor)类型,不是数值类型,所以使用as.factor() 进行转换。

  1. kknn::kknn()计算 在计算之前,我们要将之前散点数据的label列转换成因子(factor)类型

point$label <- as.factor(point$label)

接下来,我们调用kknn::kknn()方法进行计算:

label_kknn <- kknn::kknn(label ~ ., 
                        train = point, 
                        test = result2, 
                        kernel = "gaussian", 
                        k = 100)

由于结果打印出来较多,我们直接将结果转换成DF类型:

#将结果转换成df
result_label  <- result2 %>% 
    mutate(label = fitted(label_kknn),
           prob = apply(label_kknn$prob, 1, function(x) max(x)))
    
head(result_label)

注意:由于结果输出的prob列(即每一个类别(5类)的可能性,最终输出结果为最大的那一个),我们使用了自定义函数:function(x) max(x) 将prob结果最大的一个求出。结果预览如下:

R-kknn结果可是绘制

在绘制地图可视化之前,最好将要绘制的结果转换成sf对象,便于可视化绘制(转换投影等操作均可进行),转换代码如下:

result_labela_raster <- st_as_sf(result_label, coords = c("lon", "lat"),crs = 4326,remove = F)

接下里,我们就将结果进行可视化绘制: 「网格数据可视化:」

library(sf)
library(tidyverse)
library(ggspatial)
library(RColorBrewer)
library(ggtext)
library(hrbrthemes)

#自定义颜色
knn_result2_grid <- ggplot() + 
  # add raster geom for the knn result
  geom_sf(data = sichuang,fill="NA",size=.8,colour="gray60",alpha=.7)+
  geom_raster(data = result_labela_raster,aes(x =lon,y = lat,fill=label,alpha=prob)) + 
  #geom_sf(data = sichuang,fill="NA",size=.8,colour="gray60",alpha=.7)+
  scale_fill_brewer(palette = "Dark2",name="Label",
                   labels=c("class1","class2","class3","class4","class5")) +
  annotation_scale(location = "bl") +
      # spatial-aware automagic north arrow
       annotation_north_arrow(location = "tr", which_north = "false",
                             style = north_arrow_fancy_orienteering) +
   # remove propability legend
  scale_alpha_continuous(guide = F) +
  labs(x="",y="",
       title = "Map Charts in R Exercise 03-2: <span style='color:#D20F26'>Categorical Interpolation</span>",
       subtitle = "processed map charts with <span style='color:#1A73E8'>geom_raster()</span>",
       caption = "Visualization by <span style='color:#DD6449'>DataCharm</span>") +
  theme_ipsum(base_family = "Roboto Condensed") +
  theme(
        plot.title = element_markdown(hjust = 0.5,vjust = .5,color = "black",
                             size = 20, margin = margin(t = 1, b = 12)),
        plot.subtitle = element_markdown(hjust = 0,vjust = .5,size=15),
        plot.caption = element_markdown(face = 'bold',size = 12),
  )

可视化结果如下:

在之前的推文中,我们也说过会提出一个较好的裁剪方法,这里我们将给出参考方法,如下:

result_labela_raster_clip = result_labela_raster[sichuang,]

直接使用[地图数据,],这里需要在指出的是:result_labela_raster和sichuang文件均为sf类型数据。 这样就可裁剪出较满意的结果,而可视化的绘制也只是的更改为以下即可:

geom_raster(data = result_labela_raster_clip,aes(x =lon,y = lat,fill=label,alpha=prob))

最终我们绘制的可视化结果如下:

总结

本篇推文我们使用了R-kknn包计算了分类模型结果即结果的可视化绘制,此外,还提出了一个较方便的裁剪方法,目的也是让大家更好的熟悉ggplot2的可视化绘制。到这里,关键空间插值系列的可视化教程(Python和R)也暂时结束,接下来,我会将改系列的所有推文整理汇总(数据、源码和解释文档)。接下来可能会推出几篇商业图表的绘制推文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425678.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解锁视频号带货小程序的成功密码:策略、技巧与实践

随着社交电商的兴起&#xff0c;越来越多的人开始在视频号上直播带货。而上线带货小程序&#xff0c;不仅可以方便观众购买商品&#xff0c;还可以提高商品的转化率。那么&#xff0c;如何上线带货小程序呢&#xff1f; 首先&#xff0c;我们需要选择一个可靠的第三方平台来搭建…

消息中间件之RocketMQ源码分析(四)

消费者的Rebalance机制 客户端是通过Rebalance服务做到高可靠的。当发生Broker掉线、消费者实例掉线、 Topic扩容等各种突发情况时&#xff0c;消费者组中的消费者实例是怎么重平衡的&#xff0c;以支持全部队列的正常消费的? Rebalance服务的类图 RebalanceImpl的核心属性 …

面试了字节大模型算法岗(实习),快被问哭了。。。。

最近技术群组织了一次算法面试讨论会&#xff0c;今天分享的是一位小伙子的痛苦面试经历&#xff0c;如果你想加入我们的讨论群&#xff0c;见文末。 本次分享的内容如下&#xff1a; 应聘岗位&#xff1a;字节大模型算法实习生 面试轮数&#xff1a;第一轮 整体面试感觉&…

银行数据仓库体系实践(17)--数据应用之营销分析

营销是每个银行业务部门重要的工作任务&#xff0c;银行产品市场竞争激烈&#xff0c;没有好的营销体系是不可能有立足之地&#xff0c;特别是随着互联网金融发展,金融脱媒”已越来越普遍&#xff0c;数字化营销方兴未艾&#xff0c;银行的营销体系近些年也不断发展&#xff0c…

基于SpringBoot开发的JavaWeb智能家电商城[附源码]

基于SpringBoot开发的JavaWeb智能家电商城[附源码] &#x1f345; 作者主页 央顺技术团队 &#x1f345; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; &#x1f345; 文末获取源码联系方式 &#x1f4dd; &#x1f345; 查看下方微信号获取联系方式 承接各种定制系统 &a…

Linux系统中的日志管理工具和技术

Linux系统中的日志管理工具和技术 在Linux系统中&#xff0c;日志管理对于系统管理员和开发人员来说至关重要。它能够帮助用户监视系统运行时的行为、故障和安全问题。以下是一些常用的日志管理工具和技术&#xff0c;包括使用logrotate和ELK堆栈。 1. 日志管理工具 - **rsys…

Flutter canvas 画一条会动的波浪线 进度条

之前用 Flutter Canvas 画过一个三角三角形&#xff0c;html 的 Canvas 也画过一次类似的&#xff0c; 今天用 Flutter Canvas 试了下 感觉差不多&#xff1a; html 版本 大致效果如下&#xff1a; 思路和 html 实现的类似&#xff1a; 也就是找出点的位置&#xff0c;使用二阶…

PySimpleGUI 综合应用|英语文本朗读以及转换为语音Mp3

PySimpleGUI 综合应用 目录 PySimpleGUI 综合应用 应用界面 完整代码 所需模块 PySimpleGUI pyttsx3 pyaudio rapidfuzz 字典格式 应用界面 完整代码 英语朗读器.pyw import PySimpleGUI as sg import pyttsx3,pyaudio,pyperclip import os,re,datetime,wave,threa…

如何分辨坏信息?

每当有社会热点&#xff0c;大家也许都会遇到一个困扰&#xff1a; 铺天盖地的信息&#xff0c;实在是太多了。究竟哪一些值得信任&#xff0c;哪些不值得信任&#xff1f;哪些可以接受&#xff0c;哪些最好保持怀疑&#xff1f; 我想用这篇文章&#xff0c;彻底把这个问题讲清…

python数据类型-元组

1 元组(tuple)的定义 元组是集合类型&#xff0c;和列表类似&#xff0c;元组中的元组类型可以不同&#xff0c;元素间用逗号隔开&#xff0c;和列表的不同之处在于&#xff1a; 1 元组的元组不可改变&#xff0c;也被称为只读列表 2 且元组用括号()表示&#xff0c;列表用方括…

HTML+JavaScript-06

节点操作 目前对于节点操作还是有些困惑&#xff0c;只是了解简单的案例 具体操作可以看菜鸟教程&#xff1a;https://www.runoob.com/js/js-htmldom-elements.html 案例-1 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8…

前端构建变更:从 webpack 换 vite

现状 这里以一个 op &#xff08;内部运营管理用&#xff09;项目为例&#xff0c;从 webpack 构建改为 vite 构建&#xff0c;提高本地开发效率&#xff0c;顺便也加深对 webpack 、 vite 的了解。 vite 是前端构建工具&#xff0c;使用 一系列预配置进行rollup 打包&#x…

获客助手助力提升企业微信添加客户的效率和精准度

数字化营销时代&#xff0c;企业微信成为企业与客户沟通的重要渠道&#xff0c;但如何快速、精准地添加潜在客户&#xff0c;一直是企业面临的一大挑战。获客助手作为一款企业微信服务商数灵通外链工具提供的营销工具&#xff0c;为企业提供了一种高效、精准的解决方案。 获客助…

【C++】 C++入门 — auto关键字

C入门 auto 关键字1 介绍2 使用细则3 注意事项 Thanks♪(&#xff65;ω&#xff65;)&#xff89;谢谢阅读下一篇文章见&#xff01;&#xff01;&#xff01; auto 关键字 1 介绍 编程时常常需要把表达式的值赋给变量&#xff0c;这就要求在声明变量时清楚地知道表达式的类…

服务网格(Service Mesh)流行工具

在这篇博客中&#xff0c;我们将介绍微服务的最佳服务网格工具列表&#xff0c;这些工具提供安全性、金丝雀部署、遥测、负载均衡等。 用于部署和操作微服务的服务网格工具的数量不断增加。在这篇文章中&#xff0c;我们将探讨您应该用来构建自己的服务网格架构的顶级服务网格…

(已解决)spingboot项目如何做QQ邮箱注册功能,如何在邮箱注册中进行随机数添加作为动态验证码,并满足分层解耦

前面我们已经完成了发送静态验证码&#xff0c;现在用随机数作为动态验证码。 文章地址&#xff1a;spingboot 后端发送QQ邮箱验证码 使用注解Component进行分层解耦加入ioc容器&#xff0c;方便调用。 package com.example.tianyidemo.utils; import org.springframework.st…

深度学习(7)--Keras项目详解(卷积神经网络)

目录 一.项目介绍 二.卷积神经网络构造 2.1.判断是否是channels first的back end 2.2.卷积层构造 2.3.添加激活函数 2.4.池化层构造 2.5.全连接FC层构造 三.完整代码 3.1.学习率衰减设置 四.首次运行结果 五.数据增强对结果的影响 六.BatchNormalization对结果的影…

MIT6.5830 实验3

前置回顾 在实验2中&#xff0c;完成了增删查改、排序、分组、聚合、连接等基本操作&#xff0c;在已提供 sql 解析器的基础上&#xff0c;能够运行进本的 sql 语句。都是逻辑层的实现&#xff0c;没有涉及物理存储方面的内容。 实验目标 实现最简单的基于锁的transaction&am…

RabbitMQ之死信交换机

前言 消息队列是分布式系统中常用的组件&#xff0c;用于异步通信、解耦和提高系统可靠性。然而&#xff0c;在实际应用中&#xff0c;难免会遇到一些异常情况&#xff0c;例如消息处理失败、超时等。为了更好地处理这些异常情况&#xff0c;死信交换机&#xff08;Dead Lette…

搭建高效企业培训平台:教育系统源码开发详解

为了更好地满足企业培训的需求&#xff0c;许多组织纷纷转向数字化教育&#xff0c;搭建高效的企业培训平台成为当务之急。本篇文章&#xff0c;小编将为您讲解教育系统源码的开发细节&#xff0c;为搭建一个功能强大、灵活高效的企业培训平台提供详尽的指南。 一、教育系统的…