scipy 笔记:scipy.spatial.distance

news2025/1/23 13:03:40

1 pdist

计算n维空间中观测点之间的成对距离。

scipy.spatial.distance.pdist(
    X, 
    metric='euclidean', 
    *, 
    out=None, 
    **kwargs)

1.1 主要参数

X一个m行n列的数组,表示n维空间中的m个原始观测点
metric使用的距离度量
out输出数组。如果非空,压缩的距离矩阵Y将存储在此数组中

1.2 举例

import numpy as np
from scipy.spatial.distance import pdist

x = np.array([[2, 0, 2], 
              [2, 2, 3], 
              [-2, 4, 5], 
              [0, 1, 9], 
              [2, 2, 4]])
#5个元素,每个元素3维

pdist(x)
#array([2.23606798, 6.40312424, 7.34846923, 2.82842712, 4.89897949,
       6.40312424, 1.        , 5.38516481, 4.58257569, 5.47722558])
'''
10个元素,分别表示:

第1个点和第2个点之间的距离
第1个点和第3个点之间的距离
第1个点和第4个点之间的距离
第1个点和第5个点之间的距离
第2个点和第3个点之间的距离
第2个点和第4个点之间的距离
第2个点和第5个点之间的距离
第3个点和第4个点之间的距离
第3个点和第5个点之间的距离
第4个点和第5个点之间的距离
'''

2 cdist

计算两个输入集合中每对元素之间的距离

scipy.spatial.distance.cdist(
    XA, 
    XB, 
    metric='euclidean', 
    *, 
    out=None, 
    **kwargs)

2.1 主要参数

XAmA*n的矩阵,表示mA个元素,每个元素n维特征
XBmBn的矩阵,表示mB个元素,每个元素n维特征
metric使用的距离度量
out输出数组(mA*mB)。如果非空,压缩的距离矩阵Y将存储在此数组中

2.2 举例

import numpy as np
from scipy.spatial.distance import cdist

x = np.array([[2, 0, 2], 
              [2, 2, 3], 
              [-2, 4, 5], 
              [0, 1, 9], 
              [2, 2, 4]])

cdist(x,x)
'''
array([[0.        , 2.23606798, 6.40312424, 7.34846923, 2.82842712],
       [2.23606798, 0.        , 4.89897949, 6.40312424, 1.        ],
       [6.40312424, 4.89897949, 0.        , 5.38516481, 4.58257569],
       [7.34846923, 6.40312424, 5.38516481, 0.        , 5.47722558],
       [2.82842712, 1.        , 4.58257569, 5.47722558, 0.        ]])
'''

y=[[1,2,3]]
cdist(x,y)
'''
array([[2.44948974],
       [1.        ],
       [4.12310563],
       [6.164414  ],
       [1.41421356]])
'''

cdist(y,x)
'''
array([[2.44948974, 1.        , 4.12310563, 6.164414  , 1.41421356]])
'''

3 squareform

将距离向量的向量形式转换为方阵形式的距离矩阵,反之亦然。

scipy.spatial.distance.squareform(X, force='no', checks=True)

3.1 举例

import numpy as np
from scipy.spatial.distance import *

x = np.array([[2, 0, 2], 
              [2, 2, 3], 
              [-2, 4, 5], 
              [0, 1, 9], 
              [2, 2, 4]])

dist_vec=pdist(x)
dist_vec
'''
array([2.23606798, 6.40312424, 7.34846923, 2.82842712, 4.89897949,
       6.40312424, 1.        , 5.38516481, 4.58257569, 5.47722558])
'''

dist_mat=squareform(dist_vec)
dist_mat
'''
array([[0.        , 2.23606798, 6.40312424, 7.34846923, 2.82842712],
       [2.23606798, 0.        , 4.89897949, 6.40312424, 1.        ],
       [6.40312424, 4.89897949, 0.        , 5.38516481, 4.58257569],
       [7.34846923, 6.40312424, 5.38516481, 0.        , 5.47722558],
       [2.82842712, 1.        , 4.58257569, 5.47722558, 0.        ]])
'''

squareform(dist_mat)
'''
array([2.23606798, 6.40312424, 7.34846923, 2.82842712, 4.89897949,
       6.40312424, 1.        , 5.38516481, 4.58257569, 5.47722558])
'''

4 directed_hausdorff

  • 计算两个二维数组之间的定向豪斯多夫距离
  • 通常用于衡量两个点集合的相似性
scipy.spatial.distance.directed_hausdorff(u, v, seed=0)

数学笔记/scipy 笔记:豪斯多夫距离(Hausdorff )_python 豪斯多夫距离-CSDN博客

4.1 主要参数

u

(M,N)大小的数组

M 表示点的数量,N 表示每个点的维度

v

(O,N)大小的数组

O 表示点的数量,N 表示每个点的维度

4.2 返回内容

duv 之间的定向豪斯多夫距离
index_1 在数组u中贡献豪斯多夫对的点的索引
index_2在数组v中贡献豪斯多夫对的点的索引

4.3 举例

import numpy as np
from scipy.spatial.distance import *

u = np.array([(1.0, 0.0),
              (0.0, 1.0),
              (-1.0, 0.0),
              (0.0, -1.0)])
v = np.array([(2.0, 0.0),
              (0.0, 2.0),
              (-2.0, 0.0),
              (0.0, -4.0)])


directed_hausdorff(u,v)
#(2.23606797749979, 3, 0)

5 is_valid_dm

判断输入数组是否为有效的距离矩阵

scipy.spatial.distance.is_valid_dm(
    D, 
    tol=0.0, 
    throw=False, 
    name='D', 
    warning=False)

5.1 主要参数

D用于测试有效性的候选对象
tol距离矩阵应该是对称的。tol是条目ij和ji之间的最大差异,以便将距离度量视为对称

5.2 举例

import numpy as np
from scipy.spatial.distance import *

d = np.array([[0.0, 1.1, 1.2, 1.3],
              [1.1, 0.0, 1.0, 1.4],
              [1.2, 1.0, 0.0, 1.5],
              [1.3, 1.4, 1.5, 0.0]])
is_valid_dm(d)
#True

is_valid_dm([[0, 2, 2], 
             [2, 0, 2]])
#形状不对


is_valid_dm([[0, 1, 1], 
             [1, 2, 3], 
             [1, 3, 0]])
#对角线不为0


is_valid_dm([[0, 1, 3], 
             [2, 0, 1], 
             [3, 1, 0]])
#不对称

6 is_valid_y

scipy.spatial.distance.is_valid_y(
    y, 
    warning=False, 
    throw=False, 
    name=None)

判断输入数组是否为有效的压缩距离矩阵。

压缩距离矩阵必须是1维的numpy数组。它们的长度必须是一些正整数n的二项系数C_n^2

6.1 主要参数

y压缩距离矩阵

6.2 举例

import numpy as np
from scipy.spatial.distance import *

is_valid_y([1.0, 1.2, 1.0, 0.5, 1.3, 0.9])
#True
#长度为6,合理长度,所以返回True

is_valid_y([1.0, 1.2, 1.0, 0.5, 1.3, 0.9,1.5])
#False
#长度为7,不合理长度,所以返回False

7 两个数字向量之间的距离

7.1 braycurtis

计算两个一维数组之间的布雷-柯蒂斯距离

scipy.spatial.distance.braycurtis(u, v, w=None)

7.1.1 主要参数

u

(N,)    输入数组

v(N,)    输入数组
w(N,)    u和v中每个值的权重

7.1.2 举例

基本上后面都是一样的,就不举例了

import numpy as np
from scipy.spatial.distance import *

braycurtis([1,1,0],[0,1,0])

#0.3333333333333333

7.2 canberra

scipy.spatial.distance.canberra(u, v, w=None)

7.3 chebyshev

scipy.spatial.distance.chebyshev(u, v, w=None)

7.4 cityblock

曼哈顿距离

scipy.spatial.distance.cityblock(u, v, w=None)

7.5 correlation

scipy.spatial.distance.correlation(u, v, w=None, centered=True)

7.6 cosine

scipy.spatial.distance.cosine(u, v, w=None)

7.7 euclidean

scipy.spatial.distance.euclidean(u, v, w=None)

7.8 jensenshannon

scipy.spatial.distance.jensenshannon(p, q, base=None, *, axis=0, keepdims=False)

两个概率向量p,q之间的JS距离

如果p和q的总和不为1.0,该程序将对其进行归一化

7.8.1 主要参数

p左侧概率向量
q右侧概率向量
base用于计算输出的对数底数
axis

沿着哪个轴计算JS距离

7.8.2 举例

import numpy as np
from scipy.spatial.distance import *

jensenshannon([1.0, 0.0, 0.0], [0.0, 1.0, 0.0])
#0.8325546111576977


jensenshannon([1.0, 0.0, 0.0], [0.0, 1.0, 0.0],2)
#1.0


a = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])
b = np.array([[13, 14, 15, 16],
              [17, 18, 19, 20],
              [21, 22, 23, 24]])
jensenshannon(a, b, axis=0)
#array([0.19542878, 0.14476971, 0.11383771, 0.09276358])

jensenshannon(a, b, axis=1)
#array([0.14023394, 0.03991063, 0.02018153])

7.9 mahalanobis

马氏距离

scipy.spatial.distance.mahalanobis(u, v, VI)

7.9.1 主要参数

u输入向量
v输入向量
VI协方差矩阵的逆,也即上面公式中的V^{-1}

7.9.2 举例

import numpy as np
from scipy.spatial.distance import *

iv = [[1, 0.5, 0.5], [0.5, 1, 0.5], [0.5, 0.5, 1]]

mahalanobis([1, 0, 0], [0, 1, 0], iv)
#1.0

7.10 minkowski

闵可夫斯基距离

scipy.spatial.distance.minkowski(u, v, p=2, w=None)

7.11 seuclidean 

标准欧氏距离

scipy.spatial.distance.seuclidean(u, v, V)

V[i]是针对点集中所有第i个分量计算得到的方差

7.12 sqeuclidean

平方欧氏距离

scipy.spatial.distance.sqeuclidean(u, v, w=None)

8 两个布尔向量距离

8.1 dice

scipy.spatial.distance.dice(u, v, w=None)

CTF表示u是T,v是F,其他类似

8.2 hamming

scipy.spatial.distance.hamming(u, v, w=None)

8.3 jaccard

scipy.spatial.distance.jaccard(u, v, w=None)

8.4 kulczynski1

scipy.spatial.distance.kulczynski1(u, v, *, w=None)

8.5 rogerstanimoto

scipy.spatial.distance.rogerstanimoto(u, v, w=None)

8.6 russellrao

8.7 sokalmichener

scipy.spatial.distance.sokalmichener(u, v, w=None)

8.8 sokalsneath

scipy.spatial.distance.sokalsneath(u, v, w=None)

8.9 yule

scipy.spatial.distance.yule(u, v, w=None)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1251316.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日一题:LeetCode-103/107.二叉树的(层序/锯齿形层序)遍历

每日一题系列(day 04) 前言: 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 &#x1f50e…

interface previously declared 的bug问题

其实就是重复定义了,只需要加如下的代码即可: 其中把APB的部分改成自己的接口名字就好了。

『亚马逊云科技产品测评』活动征文|EC2 实例安装 docker 与配套软件部署前后端分离的医疗管理后台系统

授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道 目录 一、AWS 产品类别选择 (1)应用服务器选择…

【接口技术】实验1:简易汇编程序调试

实验1 简易汇编程序调试 一、实验目的 1:掌握在集成开发软件环境中汇编程序的编写、调试方法。 2:学会用DOS功能调用(1号和2号)完成输入和输出。 二、实验内容 1-1: 在以BUF为首地址的字节存储区存放有若干个无符…

02 RANSAC算法 及 Python 实现

文章目录 02 RANSAC算法 及 Python 实现2.1 简介2.2 算法流程2.3 RANSAC 算法实现直线拟合2.4 利用 RANSAC 算法减少 ORB 特征点误匹配 02 RANSAC算法 及 Python 实现 2.1 简介 RANSAC (Random Sample Consensus,随机抽样一致)算法的 基本假…

网络通信基础概念介绍

网络通信基础概念介绍 局域网LAN 局域网,即 Local Area Network,简称LAN。 局域网内的主机之间能方便的进行网络通信,又称为内网;局域网和局域网之间在没有连接的情况下,是无法通信的。 局域网是指在一个相对较小的…

Android设计模式--外观模式

弈之为术,在人自悟 一,定义 外观模式要求一个子系统的外部与其内部的通信必须通过一个统一的对象进行。提供一个高层次的接口,使得子系统更易于使用。 外观模式在开发中的使用频率是非常高的,尤其是在第三方的SDK里面&#xff0…

redis运维(二十)redis 的扩展应用 lua(二)

一 redis 的扩展应用 lua redis lua脚本语法 ① 什么是脚本缓存 redis 缓存lua脚本 说明: 重启redis,脚本缓存会丢失 下面讲解 SCRIPT ... 系列 SCRIPT ② LOAD 语法:SCRIPT LOAD lua代码 -->载入一个脚本,只是预加载,不执行思考1&#xff1…

leetcode中“辅助栈”类题目和“单调栈”类题目的异同

1 总结 1 栈中元素的特性 2 单调栈存在一次性连续删除多个栈顶的情况,但是普通的栈,一次只pop掉一个栈顶元素 2 LC1209. 删除字符串中的所有相邻重复项 II - 普通辅助栈 class Solution {public String removeDuplicates(String s, int k) {int ns.l…

OSG粒子系统与阴影-爆炸模拟(3)

爆炸模拟示例 爆炸模拟示例的代码如程序清单11-4 所示&#xff1a; /* 爆炸模拟示例 */ void explosion_11_4() {osg::ref_ptr<osgViewer::Viewer> viewer new osgViewer::Viewer();osg::ref_ptr<osg::GraphicsContext::Traits> traits new osg::GraphicsContex…

Linux:Ubuntu虚拟机安装详解:VMware下的逐步指南

目录 1. centOS系统 2. ubuntu系统 1. 下载Ubuntu映像 step1 step2 step3 2. 新建虚拟机 step1 step2 Step3 step4 step5 step6 内存 内核 映像 显示 网络 3. 网络配置 NAT模式 本机IP获取 ​编辑 bridge模式 4. 开启虚拟机 5. 虚拟机常用配置 语言 …

物联网后端个人第十二周总结

学习工作进度 物联网方面 1.模拟设备通过规则引擎将数据通过mqtt进行转发 在物联网平台上实现模拟设备通过规则引擎将数据通过mqtt进行转发已经全部完成了&#xff0c;所使用的物联网平台在这方面有不少的问题和bug&#xff0c;也可能是没有按照开发者的想法对平台进行使用才导…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《考虑系统一次频率响应特性的新型电力系统源网荷储协调鲁棒规划》

这篇文章的标题涉及到新型电力系统的源&#xff08;发电源&#xff09;、网&#xff08;电网&#xff09;、荷&#xff08;负荷&#xff0c;即用电需求&#xff09;以及储&#xff08;储能系统&#xff09;的协调鲁棒规划&#xff0c;其中考虑了系统的一次频率响应特性。 让我…

软件设计师:计算机组成与体系结构之计算机基础知识

计算机基础知识 数据的表示 码制及进制转换 原码&#xff1a;将数值转成二进制反码&#xff1a;正数与原码完全相同&#xff1b;负数&#xff0c;除了符号位其他位取反补码&#xff1a;正数与原码完全相同&#xff1b;负数&#xff0c;在补码的基础上加1移码&#xff1a;补码…

CUDA编程二、C++和cuda混合编程的一些基础知识点

目录 一、C运行过程 1、C编译过程 2、代码运行示例 单文件 多文件 a、编译所有cpp文件&#xff0c;但是不链接 b、链接所有的.o文件 c、运行程序 CMake编译 代码 使用方法 编译过程 代码运行 二、C和cuda混合编程 cuda 单文件 cuda和C多文件 手动分步编译 C…

TDA笔记:夏克林老师,南洋理工大学

TDA比传统的统计方法有优势&#xff1a;benchmark中展现了这种优势 laplacian矩阵 多种单纯复形构造方式&#xff0c;可以构造出不同表征 二部图&#xff1a;Dowker complex Tor algebra可以用到多大数据 目前较新

python教程:正常shell与反弹shell

嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 正常shell需要先在攻击端开机情况下开启程序,然后攻击端运行程序,才能连接 反弹shell,攻击端是服务端,被攻击端是客户端 正常shell,攻击端是客户端,被攻击端是服务端 反弹shell,先启用服务端,再启用客户端 反弹shell的好处…

OPPO VOOC快充原理

1 USB 3.0标准A插头 USB 3.0连接器是基于USB 2.0改进而来的&#xff0c;这个设计给USB 3.0连接器带来了一些潜在风险&#xff0c;如果USB 3.0设备插入主机的速度太慢&#xff0c;3.0的针脚还没来得及被识别到&#xff0c;就会被主机判定成USB 2.0的设备。 Figure 1-1 USB 3.0标…

【C++】构造函数和析构函数第四部分(深拷贝和浅拷贝)--- 2023.11.25

目录 什么是浅拷贝&#xff1f;浅拷贝的问题使用深拷贝解决浅拷贝问题结束语 什么是浅拷贝&#xff1f; 如果在一个类中没有人为定义拷贝函数&#xff0c;则系统会提供默认拷贝函数。那么在此默认拷贝函数中主要进行了简单的赋值操作&#xff0c;那这个简单的赋值操作我们一般…