算法笔记：相似性度量

news2025/1/5 9:52:36

1 欧氏距离

1.1 标准化欧氏距离

先将数据标准化

（减去的均值两两抵消）

2 曼哈顿距离

又称为城市街区距离

3 切比雪夫距离

等价形式

4 闵可夫斯基距离 minkowski

当p=1时，就是曼哈顿距离

当p=2时，就是欧氏距离

当p→∞时，就是切比雪夫距离

4.1 闵可夫斯基距离的缺点

各个分量的量纲(scale)，也就是“单位”当作相同的看待
没有考虑各个分量的分布（期望，方差等)可能是不同的
- eg，二维样本(身高,体重)，有三个样本：a(180,50)，b(190,50)，c(180,60)。
  - 那么a与b之间的闵氏距离（无论是曼哈顿距离、欧氏距离或切比雪夫距离）等于a与c之间的闵氏距离，但是身高的10cm真的等价于体重的10kg么？

5 马氏距离 Mahalanobis

有M个样本向量X1~Xm，协方差矩阵记为S，均值记为向量μ，
- 其中样本向量X到μ的马氏距离
- 其中向量Xi与Xj之间的马氏距离
——>马氏距离和量纲无关，排除变量之间的相关性的干扰

6 夹角余弦

7 汉明距离

两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数

例如字符串“1111”与“1001”之间的汉明距离为2。

8 杰卡德距离 Jaccard

8.1 杰卡德相似系数

8.2 杰卡德距离

9 相关距离

9.1 相关系数

相关系数的取值范围是[-1,1]。
- 相关系数的绝对值越大，则表明X与Y相关度越高。
- 当X与Y线性相关时，相关系数取值为1（正线性相关）或-1（负线性相关）

9.2 相关距离

参考内容：机器学习中的相似性度量总结 (qq.com)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/740702.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

WSL安装与使用(Ubuntu22.04)

WSL安装与使用(Ubuntu22.04)

文章目录概要WSL介绍WSL安装安装环境安装方式一：命令行安装(不推荐，可能出现奇怪的问题)安装方式二：通过控制面板安装 WSL 安装Ubuntu22.04（通过Microsoft Store）Ubuntu更换镜像源进入Ubuntu更换镜像源 Ubuntu安装Doc…

阅读更多...

Spark-用IDEA编写wordcount demo

Spark-用IDEA编写wordcount demo

配置 Spark版本：3.2.0 Scala版本：2.12.12 JDK：1.8 Maven：3.6.3 pom文件 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi&quo…

阅读更多...

小红书笔记为什么没有流量，归纳总结

小红书笔记为什么没有流量，归纳总结

我们都知道小红书是一个内容分享类平台。小红书笔记是平台的主要内容形式。但有时候，我们撰写了一篇笔记，却无法搜索到，今天为大家分享下小红书笔记为什么没有流量，归纳总结！ 一、小红书笔记不被收录的原因当我们精心…

阅读更多...

Java 递归和非递归方式实现二叉树的前、中、后序遍历

Java 递归和非递归方式实现二叉树的前、中、后序遍历

文章目录 Node结点定义前序遍历递归方式实现非递归方式实现图文解读最终结果中序遍历递归方式实现非递归方式实现图文解读最终结果后序遍历递归方式实现非递归方式实现图文解读最终结果结语 Node结点定义 private static class Node {public int value;public Node left;…

阅读更多...

Vue子组件向父组件传递消息

Vue子组件向父组件传递消息

父子组件之间的通信：props与emit 通常提到props，都会想到的是父组件给子组件传值；提到emit为子组件向父组件发送消息，但其实，props也可以使子组件向父组件传递消息方式为在父组件中通过为子组件绑定属性&#xff0c…

阅读更多...

Docker之centos7环境离线安装

Docker之centos7环境离线安装

一、docker简介 Docker是一个开源的应用容器引擎，可以让开发者将应用及其依赖打包在一个虚拟的容器中，方便地部署、移植、升级和管理。Docker可以运行在Linux、Windows和MacOS等操作系统上，并且可以在不同的平台之间进行交互和迁移。Docker的…

阅读更多...

ES 性能调优，这可能是全网最详细的 Elasticsearch 性能调优指南

ES 性能调优，这可能是全网最详细的 Elasticsearch 性能调优指南

文章目录 1、通用优化策略1.1 通用最小化法则1.2 职责单一原则1.3 其他 2、写性能调优2.1 基本原则2.2 优化手段2.2.1 增加 flush 时间间隔，2.2.2 增加refresh_interval的参数值2.2.3 增加Buffer大小，2.2.4 关闭副本2.2.5 禁用swap2.2.6 使用多个工作线程…

阅读更多...

小奇猫物语之产品经理篇（1）

小奇猫物语之产品经理篇（1）

小奇猫物语之产品经理篇（1） 喵喵提示：看到标题后面的（1）了嘛？没错！关于产品经理这方面，小奇会出一个系列哟，感谢各位铲屎官们的观看，欢迎提出指正和批评哦&a…

阅读更多...

Springboot设置并访问静态资源目录

Springboot设置并访问静态资源目录

目录静态文件 application设置方法配置详解编写配置优缺点设置配置类方法配置详解编写配置优缺点总结静态文件静态资源，一般是网页端的：HTML文件、JavaScript文件和图片。尤其是设置图片的静态资源，尤其重…

阅读更多...

浅谈消防应急照明和疏散指示系统在建筑物中的设计与应用

浅谈消防应急照明和疏散指示系统在建筑物中的设计与应用

安科瑞华楠摘要：在消防安全意识逐渐提高的背景下，安全疏散技术也取得了不断发展。基于这种认识，本文对建筑物消防应急照明和疏散指示系统进行了介绍，然后对系统设计与应用方法展开了探讨，为关注这一话题的人们提供…

阅读更多...

Linux--查看常驻进程：ps

Linux--查看常驻进程：ps

进程分为瞬时进程和常驻进程瞬时进程：瞬间完成从加载到内存、显示在输出设备、退出过程 int main() {printf("hello world!\n");return 0; } 常驻进程：一直在内存中 int main() {while (1){printf("hello world!\n");sleep(1);…

阅读更多...

Java 动态规划 Leetcode 931. 下降路径最小和

Java 动态规划 Leetcode 931. 下降路径最小和

代码展示: class Solution {public int minFallingPathSum(int[][] matrix) {int nmatrix.length;//创建dp数组int[][]dpnew int[n1][n2];//初始化for(int i1;i<n;i){dp[i][0]dp[i][n1]Integer.MAX_VALUE;}//填充数组for(int i1;i<n;i){for(int j1;j<n;j){dp[i][j]Ma…

阅读更多...

【网络安全】Burpsuite v2021.12.1安装激活配置快捷启动

【网络安全】Burpsuite v2021.12.1安装激活配置快捷启动

Burpsuite v2021.12.1安装&激活&配置&快捷启动一、下载激活包二、配置JDK11三、启动激活一、下载激活包需要下载的内容： Burp Suite jar包JDK11激活jar包汉化jar包下面是已经下载好的，可以直接使用 BurpSuite网盘下载链接提取码&#…

阅读更多...

单键触摸开关/双键触摸式照明灯/触摸式延时照明灯电路设计

单键触摸开关/双键触摸式照明灯/触摸式延时照明灯电路设计

单键触摸开关触摸式照明开关是一种非常实用的电子开关，用手触摸一下导电片，就能实现开关动作 ，使用方便可靠、电路简单、性能稳定、寿命长、节电效果明显。适合于爱好者自制。一、电路工作原理电路原理如图 21 所示。接通电源后&#…

阅读更多...

RabbitMQ ---- Hello World

RabbitMQ ---- Hello World

RabbitMQ ---- Hello World 1. 依赖2. 消息生产者3. 信息消费者本节使用 Java 编写两个程序。发送单个消息的生产者和接收消息并打印出来的消费者。 1. 依赖 <build><plugins><plugin><groupId>org.apache.maven.plu…

阅读更多...

Scratch 随机平台跳跃

Scratch 随机平台跳跃

Scratch 随机平台跳跃本程序转换为HTML后运行。程序在随机位置生成红、蓝平台各13个，通过W、A、S、D键控制角色移动，移动时把标记下落的变量设为1。该变量为1时角色下落，碰到边缘或平台时结束下落，变量设为0。这种方案的缺陷是角…

阅读更多...

Databricks推出AI模型SDK，能自动生成SQL代码

Databricks推出AI模型SDK，能自动生成SQL代码

近日一款AI模型的发布，或将有助于提高开发效率。据悉，最近Databricks发布大数据分析平台Spark所用的 AI 模型 SDK，开发者写代码时，可用英文下指令，编译器就会将英文指令转换为 PySpark 或 SQL 语言代码，以提…

阅读更多...

偏振光的斯托克斯矢量表示法

偏振光的斯托克斯矢量表示法

《光纤偏振模色散原理测量与自适应补充技术》张晓光第二章

阅读更多...

【Linux后端服务器开发】进程与地址空间概述

【Linux后端服务器开发】进程与地址空间概述

目录一、进程创建二、进程状态 1. 运行状态R 2. 睡眠状态S 3. 僵尸状态Z 4. 孤儿进程三、进程优先级 PRI 四、地址空间的层次结构五、虚拟地址和物理地址一、进程创建 fork()函数创建子进程，若创建成功，则给父进程返回子进程的pid&#x…

阅读更多...

Python基础教程:异常处理try...except语句

Python基础教程:异常处理try...except语句

Python是一门非常灵活且易于学习的编程语言，在日常开发中被广泛应用。然而，由于各种原因，我们的代码可能会出现异常情况，例如输入错误、文件读写异常等等。Python异常处理是Python中重要的一部分，为了保证程序的稳定性…

阅读更多...

推荐文章

最新文章