机器学习100天（三十二）：032 KD树的构造和搜索

机器学习100天（三十二）：032 KD树的构造和搜索

news2025/4/28 2:19:01

机器学习100天，今天讲的是：KD树的构造和搜索！

《机器学习100天》完整目录：目录

在 K 近邻算法中，我们计算测试样本与所有训练样本的距离，类似于穷举法。如果数据量少的时候，算法运行时间没有大的影响，但是如果数据量很大，那么算法运行的时间就会很长。这在实际的应用中效率很低。

因此，为了最快地进行检索，就提出了一种新的算法：KD树（k-dimensional tree）。KD树是二叉树的一种，是对 k 维空间的一种分割，不断地用垂直于坐标轴的超平面将k维空间切分，形成 k 维超矩形区域。KD 树可以帮助我们在很快地找到与测试点最邻近的 K 个训练点。不再需要计算测试点和训练集中的每一个数据的距离。下面我将以最通俗的语言来介绍。

要完全掌握 KD 树，只要记住两个步骤：一是 KD 树的构造，二是 KD 树的搜索。

一、KD 树的构造

首先我们来看 KD 树的构造，举个例子。二维平面上有 13 个点，分布如图所示。
在这里插入图片描述
该 13 个点的坐标为：([6,5], [1,-3], [-6,-5], [-4,-10], [-2,-1], [-5,12], [2,13], [17,-12], [8,-22], [15,-17], [10,-6], [7,15], [14,1])。

首先，第一步，选取一个维度，

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/380971.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

GFD563A101 3BHE046836R0101

GFD563A101 3BHE046836R0101

GFD563A101 3BHE046836R0101关于高端涂布机张力控制系统方案的介绍高端涂布机张力控制系统方案涂布机是将具有某种功效的胶，或者油墨类物质均匀粘连在塑料薄膜、铝箔、纺织品等表面的机械设备。本系统从放卷到收卷共采用七台变频器，其中收放卷采用闭环张…

阅读更多...

Databend 开源周报第 81 期

Databend 开源周报第 81 期

Databend 是一款现代云数仓。专为弹性和高效设计，为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务：https://app.databend.com 。Whats New探索 Databend 本周新进展，遇到更贴近你心意的 Databend 。Accepted RFCsrfc: 查询结果缓存…

阅读更多...

Cartesi 举办的2023 黑客马拉松

Cartesi 举办的2023 黑客马拉松

Cartesi 是具有 Linux 运行时的特定于应用程序的Rollups执行层。Cartesi 的特定应用程序 Optimistic Rollup 框架使区块链堆栈足够强大，开发人员可以构建计算密集型和以前不可能的去中心化实例。Cartesi 的 RISC-V 虚拟机支持 Linux 运行时环境，允许像你…

阅读更多...

DevOps 学习笔记（二）| 使用 Harbor

DevOps 学习笔记（二）| 使用 Harbor

文章目录1. 上传镜像到 Harbor2. 拉取 Harbor 镜像3. 使用 Jenkins 操作 Harbor1. 上传镜像到 Harbor 首先在CI/CD 服务器中配置 Docker mkdir -p /etc/docker/ cd /etc/docker/ vim daemon.json其中的 IP 地址为Harbor 服务器的 IP 地址 {"xxx": "xxxx"…

阅读更多...

IGH主站通信测试csp模式（DC同步 preemrt）连通一从站并实现控制

IGH主站通信测试csp模式（DC同步 preemrt）连通一从站并实现控制

IGH主站通信测试 linuxcnc配置基础机器人控制LinuxCNC与EtherCAT介绍&&PDO&SDO，搭建环境步骤需要配置IGH主站的查看这篇文章 linux系统学习笔记7——一次性安装igh-ethercat主站 CSP模式 DC同步方式 preemrt实时补丁直接上代码，这…

阅读更多...

YOLOV7模型调试记录

YOLOV7模型调试记录

先前的YOLOv7模型是pytorch重构的，并非官方提供的源码，而在博主使用自己的数据集进行实验时发现效果并不理想，因此生怕是由于源码重构导致该问题，此外还需进行对比实验，因此便从官网上下载了源码，进行调试运…

阅读更多...

二叉树——二叉搜索树中的插入操作

二叉树——二叉搜索树中的插入操作

二叉搜索树中的插入操作链接给定二叉搜索树（BST）的根节点 root 和要插入树中的值 value ，将值插入二叉搜索树。返回插入后二叉搜索树的根节点。输入数据保证 ，新值和原始二叉搜索树中的任意节点值都不同。注意&#xff0c…

阅读更多...

配置二层远程端口镜像案例

配置二层远程端口镜像案例

实验拓扑： 实验需求： 如图1所示，某公司行政部通过SwitchA与外部Internet通信，监控设备Server通过SwitchB与SwitchA相连。现在希望Server能够远程对行政部访问Internet的流量进行监控。操作步骤： 配置观察端口 # 在…

阅读更多...

C/C++开发，无可避免的多线程（篇一）.跨平台并行编程姗姗来迟

C/C++开发，无可避免的多线程（篇一）.跨平台并行编程姗姗来迟

一、编译环境准备在正式进入c/c多线程编程系列之前，先来搭建支持多线程编译的编译环境。 1.1 MinGW（win） 进入Downloads - MinGW-w64下载页面，选择MinGW-w64-builds跳转下载， 再次进行跳转： 然后进入下载页…

阅读更多...

Fiddler抓包之Fiddler过滤器(Filters)调试

Fiddler抓包之Fiddler过滤器(Filters)调试

Filters：过滤器，帮助我们过滤请求。如果需要过滤掉与测试项目无关的抓包请求，更加精准的展现抓到的请求，而不是杂乱的一堆，那功能强大的 Filters 过滤器能帮到你。 2、Filters界面说明 fiddler中的过滤说明&#…

阅读更多...

新增2000w播放、单月涨粉80w！13秒短视频竟成B站热门

新增2000w播放、单月涨粉80w！13秒短视频竟成B站热门

知识区自从被设立为一级分区后，B站就成了大家口中的“互联网大学”，有什么不懂的知识就习惯上B站搜一搜、查一查。根据B站官方出具的创作者报告数据显示，除了众多自发原创知识作品的UP主以外，还有超过300位名师学者加入B站&#x…

阅读更多...

【亲测可用】BEV Fusion (MIT) 环境配置

【亲测可用】BEV Fusion (MIT) 环境配置

CUDA环境首先我们需要打上对应版本的显卡驱动： 接下来下载CUDA包和CUDNN包： wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda_11.6.2_510.47.03_linux.run sudo sh cuda_11.6.2_510.47.03_linux.runwget htt…

阅读更多...

pytorch-softmax解决分类问题，用fashion-mnist为例子，再走一遍数据获取到模型预测的流程。深度了解分类指标的递进关系

pytorch-softmax解决分类问题，用fashion-mnist为例子，再走一遍数据获取到模型预测的流程。深度了解分类指标的递进关系

softmax回归线性回归模型适用于输出为连续值的情景。在另一类情景中，模型输出可以是一个像图像类别这样的离散值。对于这样的离散值预测问题，我们可以使用诸如softmax回归在内的分类模型。和线性回归不同，softmax回归的输出单元从一个变成了…

阅读更多...

当ChatGPT遇见Python

当ChatGPT遇见Python

在如火如荼的 ChatGPT 大潮当中，已经衍生出了各种各样的周边产品。Python 作为著名的万金油工具，怎么能没有它的身影呢。今天我们就介绍两种通过 Python 调用 ChatGPT 的方法，一起来看看吧~chatgpt-wrapper这是一个开源在 GitHub 上的项目&am…

阅读更多...

leetcode 236. 二叉树的最近公共祖先

leetcode 236. 二叉树的最近公共祖先

给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为：“对于有根树 T 的两个节点 p、q，最近公共祖先表示为一个节点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大（一个节点也可以是它自己的祖…

阅读更多...

华为机试题：HJ86 求最大连续bit数（python）

华为机试题：HJ86 求最大连续bit数（python）

文章目录（1）题目描述（2）Python3实现（3）知识点详解1、input()：获取控制台（任意形式）的输入。输出均为字符串类型。1.1、input() 与 list(input()) 的区别、及其相互转换方…

阅读更多...

Linux下 C/C++ NTP网络时间协议详解

Linux下 C/C++ NTP网络时间协议详解

NTP（Network Time Protocol，网络时间协议）是由RFC 1305定义的时间同步协议。它是通过网络在计算机系统之间进行时钟同步的网络协议。NTP 在公共互联网上通常能够保持时间延迟在几十毫秒以内的精度，并在理想条件下，它能…

阅读更多...

Molecule:使用Jetpack Compose构建StateFlow流

Molecule:使用Jetpack Compose构建StateFlow流

Molecule:使用Jetpack Compose构建StateFlow流看下面的jetpack compose片段： Composable fun MessageCard(message: Message) {Column {Text(text message.author)Text(text message.body)} }这段代码最有趣的部分是它实际上是reactive。其反应性为通过Composa…

阅读更多...

树链剖分（维护树上信息）

树链剖分（维护树上信息）

学习前请先掌握线段树：线段树（维护区间信息） 一，思想： 将一颗树拆成多条线性链以方便维护（如线段树）。先给出以下定义（通过这些定义我们就可以组成链）： …

阅读更多...

Docker概念介绍

Docker概念介绍

目录 1、传统方式、虚拟化、容器部署方式的区别 2、为什么会有docker 3、什么是docker 4、docker的优势 5、Docker组成部分 6、docker镜像的原理介绍 7、容器应用场景 8、Docker资源汇总了解docker之前，我们要先了解部署方式有哪些，各有什么优缺点…

阅读更多...

推荐文章

最新文章