DeepSORT(目标跟踪算法)中的数值表格与调参的关系

news2024/9/20 22:49:13

DeepSORT(目标跟踪算法)中的数值表格与调参的关系

flyfish

DeepSORT(目标跟踪算法)中的马氏距离详解(很详细)

DeepSORT(目标跟踪算法)中 可以设置阈值进行异常检测或目标跟踪的原因(写了重要步骤)

代码地址

https://github.com/shaoshengsong/DeepSORT

文字要是懒得看,直接拖到后面看图。

原始代码

Python版

chi2inv95 = {
    1: 3.8415,
    2: 5.9915,
    3: 7.8147,
    4: 9.4877,
    5: 11.070,
    6: 12.592,
    7: 14.067,
    8: 15.507,
    9: 16.919}

C++版

const double KalmanFilter::chi2inv95[10] = {
    0,
    3.8415,
    5.9915,
    7.8147,
    9.4877,
    11.070,
    12.592,
    14.067,
    15.507,
    16.919};

原始的这些数值表格
表示卡方分布在自由度为N时的0.95分位数。这些数值是通过统计软件(如MATLAB或Octave)的chi2inv函数计算出来的。chi2inv函数计算的是卡方分布的逆累积分布函数(inverse cumulative distribution function),即给定一个概率(这里是0.95),求对应的卡方分布的值。这些数值用于马氏距离的阈值。卡方分布(chi-square distribution)是用于统计学中的一种概率分布,通常用于假设检验和方差分析。对于给定的自由度N,卡方分布的0.95分位数表示在该自由度下,随机变量的值有95%的概率落在此分位数之下。

自己实现一个

数值计算方法:

假设我们使用Python和SciPy库来计算这些值,可以通过以下代码实现:

import scipy.stats as stats

# 定义自由度列表
degrees_of_freedom = range(1, 10)

# 计算每个自由度下的0.95分位数
chi2inv95 = {df: stats.chi2.ppf(0.95, df) for df in degrees_of_freedom}

print(chi2inv95)

解释计算结果:

  • 自由度1: 对应的0.95分位数是3.8415,这意味着在自由度为1的情况下,随机变量有95%的概率其值在3.8415以下。
  • 自由度2: 对应的0.95分位数是5.9915,这意味着在自由度为2的情况下,随机变量有95%的概率其值在5.9915以下。
    依此类推,直至自由度为9。

使用场景:

在DeepSort算法中,马氏距离用于衡量目标检测之间的相似性。卡方分布的0.95分位数作为阈值,是为了确保在给定的置信水平下,可以有效地过滤掉不相似的目标检测,从而提高跟踪的准确性。换句话说,如果两个检测的马氏距离大于对应自由度的0.95分位数,那么它们被认为是不同的目标。

输出

{1: 3.841458820694124,
 2: 5.991464547107979, 
 3: 7.814727903251179,
 4: 9.487729036781154, 
 5: 11.070497693516351,
 6: 12.591587243743977, 
 7: 14.067140449340167,
 8: 15.507313055865453,
 9: 16.918977604620448}

马氏距离

马氏距离(Mahalanobis Distance)是一种度量点与点之间距离的方法,考虑了数据的相关性和尺度。具体来说,马氏距离计算两个点之间的距离时,使用了数据的协方差矩阵,使得它在数据的不同维度上有不同的缩放,能够更准确地反映点与点之间的关系。

马氏距离的公式如下:

D M ( x , y ) = ( x − y ) T S − 1 ( x − y ) D_M(\mathbf{x}, \mathbf{y}) = \sqrt{(\mathbf{x} - \mathbf{y})^T \mathbf{S}^{-1} (\mathbf{x} - \mathbf{y})} DM(x,y)=(xy)TS1(xy)

其中:

  • x \mathbf{x} x y \mathbf{y} y 是两个数据点的向量。
  • S \mathbf{S} S 是协方差矩阵。
  • S − 1 \mathbf{S}^{-1} S1 是协方差矩阵的逆矩阵。

马氏距离用于测量两个点之间的多维空间距离,其考虑了数据的协方差结构。阈值是在特定的置信水平下,用于判断两个点是否属于同一类别的界限。在DeepSort算法中,马氏距离的阈值对应于卡方分布的0.95分位数。如果两个检测的马氏距离超过了这个阈值,则认为它们不属于同一个目标。

动画展示

展示了马氏距离随给定点变化的情况,不同位置的给定点与数据集中其他点的马氏距离

pip install matplotlib seaborn numpy scipy
pip install imageio
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.spatial.distance import mahalanobis
from scipy.stats import chi2
import imageio

# 生成示例数据
np.random.seed(42)
mean = [0, 0]
cov = [[1, 0.5], [0.5, 1]]
data = np.random.multivariate_normal(mean, cov, 500)

# 计算马氏距离的函数
def calculate_mahalanobis_distance(data, point):
    cov_matrix = np.cov(data, rowvar=False)
    inv_cov_matrix = np.linalg.inv(cov_matrix)
    mean_data = np.mean(data, axis=0)
    distances = [mahalanobis(d, point, inv_cov_matrix) for d in data]
    return distances

# 绘制散点图并添加马氏距离
def plot_mahalanobis(data, point, frame_number):
    plt.figure(figsize=(10, 8))
    sns.scatterplot(x=data[:, 0], y=data[:, 1], hue=calculate_mahalanobis_distance(data, point), palette='viridis')
    plt.scatter(point[0], point[1], color='red')
    plt.colorbar(label='Mahalanobis Distance')
    plt.title(f'Mahalanobis Distance at Frame {frame_number}')
    plt.xlabel('X')
    plt.ylabel('Y')
    plt.savefig(f'frame_{frame_number}.png')
    plt.close()

# 定义动画点
points = np.linspace(-3, 3, 30)
frames = []

# 生成每一帧图像
for i, p in enumerate(points):
    plot_mahalanobis(data, [p, p], i)
    frames.append(imageio.imread(f'frame_{i}.png'))

# 保存为GIF
imageio.mimsave('mahalanobis_distance.gif', frames, fps=2,loop=0)

在这里插入图片描述

生成示例数据:使用 np.random.multivariate_normal 生成500个二维数据点,服从均值为 [0, 0] 和协方差矩阵为 [[1, 0.5], [0.5, 1]] 的多元正态分布。
计算马氏距离的函数:calculate_mahalanobis_distance 函数计算数据集中每个点与给定点的马氏距离。
绘制散点图并添加马氏距离:plot_mahalanobis 函数绘制散点图,并根据马氏距离着色。给定点用红色标出。
定义动画点:在 [-3, 3] 区间内生成30个点,作为动画中的给定点。

协方差

协方差(Covariance)是衡量两个变量共同变化程度的统计量。如果两个变量的协方差为正,意味着这两个变量一起增加或减少;如果协方差为负,意味着一个变量增加时另一个变量减少。

协方差的公式如下:

Cov ( X , Y ) = ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) n − 1 \text{Cov}(X, Y) = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{n-1} Cov(X,Y)=n1i=1n(XiXˉ)(YiYˉ)

其中:

  • X X X Y Y Y 是两个随机变量。
  • X i X_i Xi Y i Y_i Yi 是对应的观测值。
  • X ˉ \bar{X} Xˉ Y ˉ \bar{Y} Yˉ X X X Y Y Y 的均值。
  • n n n 是样本数量。
    协方差矩阵是包含所有变量对之间协方差的矩阵,用于多维数据的分析。

自由度(Degrees of Freedom)

自由度(Degrees of Freedom, df)在统计学中,表示用于估算一个统计量的独立信息数量。对于样本方差,自由度等于样本数量减去一个,这是因为我们在计算样本方差时使用了样本均值(这个均值本身也来自样本数据)。因此,我们失去了一个自由度来计算均值,剩下的自由度用于估算方差。

在计算样本方差时,我们首先计算样本均值:

X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i Xˉ=n1i=1nXi

样本均值 X ˉ \bar{X} Xˉ 是基于 n n n 个数据点计算出来的,但其实际上只提供了 n − 1 n-1 n1 个独立信息,因为最后一个数据点的值可以从前 n − 1 n-1 n1 个数据点的值及均值推断出来。因此,自由度减去1,用以反映我们在估算过程中消耗的一个独立信息。

在统计学中,自由度是指用于计算统计量的独立数值的数量。对于卡方分布,自由度通常对应于所涉及的随机变量的数量。举个简单的例子,如果我们有一个数据集,进行样本方差计算时,自由度等于样本数量减去一个(因为我们要用一个样本均值来估计总体均值)。

0.95分位数

0.95分位数是指在给定分布中,有95%的数据点位于该值以下。对于卡方分布来说,这个值用于判断在95%的置信水平下,观察值是否显著。使用stats.chi2.ppf(0.95, df)可以计算出对应自由度下的0.95分位数。

计算马氏距离并使用卡方分布的0.95分位数作为阈值

import numpy as np
from scipy.stats import chi2

def mahalanobis_distance(x, y, cov):
    diff = x - y
    inv_cov = np.linalg.inv(cov)
    md = np.sqrt(np.dot(np.dot(diff.T, inv_cov), diff))
    return md

# 示例数据
x = np.array([1, 2])
y = np.array([1.5, 1.8])
cov = np.array([[1, 0.5], [0.5, 1]])

# 计算马氏距离
md = mahalanobis_distance(x, y, cov)
print(f"Mahalanobis Distance: {md}")

# 设定自由度
degrees_of_freedom = 2

# 计算0.95分位数的卡方门限值
threshold = chi2.ppf(0.95, degrees_of_freedom)
print(f"Chi-square 0.95 quantile for df={degrees_of_freedom}: {threshold}")

# 判断是否匹配
if md < threshold:
    print("Match: The points are considered similar.")
else:
    print("No Match: The points are considered different.")

计算马氏距离的函数:mahalanobis_distance 计算两个点之间的马氏距离。它接受两个点 x 和 y 以及协方差矩阵 cov 作为输入。
示例数据:定义两个点 x 和 y 及其协方差矩阵 cov。
计算马氏距离:调用 mahalanobis_distance 函数计算两个点之间的马氏距离。
设定自由度:设定自由度为2,因为数据点是二维的。
计算卡方分布的0.95分位数:使用 chi2.ppf 函数计算卡方分布的0.95分位数,作为马氏距离的门限值。
判断是否匹配:通过比较马氏距离与门限值,判断两个点是否匹配。

Mahalanobis Distance: 0.7211102550927978
Chi-square 0.95 quantile for df=2: 5.991464547107979
Match: The points are considered similar.

使用SciPy和Matplotlib来绘制卡方分布的图形,同时标注0.95分位数

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# 定义自由度
degrees_of_freedom = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 设置x轴范围
x = np.linspace(0, 30, 1000)

plt.figure(figsize=(12, 8))

# 绘制不同自由度的卡方分布
for df in degrees_of_freedom:
    plt.plot(x, stats.chi2.pdf(x, df), label=f'df={df}')

# 标注0.95分位数
for df in degrees_of_freedom:
    chi2_95 = stats.chi2.ppf(0.95, df)
    plt.axvline(chi2_95, color='r', linestyle='--')
    plt.text(chi2_95, 0.02, f'{chi2_95:.2f}', rotation=90, verticalalignment='bottom')

plt.title('Chi-Square Distribution for Different Degrees of Freedom')
plt.xlabel('Value')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

在这里插入图片描述

调参

阈值用于过滤噪声和不相关的目标检测,以提高跟踪算法的准确性和可靠性。在目标跟踪过程中,存在许多不确定性,例如检测误差和环境干扰。通过设置一个合适的阈值,可以在一定的置信水平下排除不可靠的检测结果,从而增强算法的稳健性。具体来说,在DeepSORT算法中,使用卡方分布的0.95分位数作为阈值,可以确保在95%的置信水平下,正确匹配目标检测,从而提高跟踪的准确性。

阈值可以根据应用的需求进行调整。例如,在某些应用中,可以选择更高的置信水平(比如0.99),以获得更严格的匹配标准。只需修改 chi2.ppf 函数中的置信水平即可:

# 计算0.99分位数的卡方门限值
threshold = chi2.ppf(0.99, degrees_of_freedom)
print(f"Chi-square 0.99 quantile for df={degrees_of_freedom}: {threshold}")

这样得到数值再应用到代码中,通过调整置信水平,可以灵活地控制目标匹配的严格程度,从而适应不同的应用场景和需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1808661.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Xilinx(AMD) vivado对FPGA网表文件进行功能仿真的方法

1 概述 在FPGA开发中很多商用IP核出于知识产权保护的目的&#xff0c;不提供源代码&#xff0c;而是提供综合后的FPGA网表。由于没有源代码&#xff0c;也无法对网表文件直接进行仿真的操作来验证功能&#xff0c;此时需要独立的仿真模型文件。 本文介绍在Xilinx(AMD) vivado软…

阻塞队列和线程池

一、什么是阻塞队列 1.1 什么是队列 队列是先进先出。 队列是一种特殊的线性表&#xff0c;特殊之处在于它只允许在表的前端&#xff08;front&#xff09;进行删除操作&#xff0c;而在表的后端&#xff08;rear&#xff09;进行插入操作&#xff0c;和栈一样&#xff0c;队…

数据可视化Python实现超详解【数据分析】

各位大佬好 &#xff0c;这里是阿川的博客&#xff0c;祝您变得更强 个人主页&#xff1a;在线OJ的阿川 大佬的支持和鼓励&#xff0c;将是我成长路上最大的动力 阿川水平有限&#xff0c;如有错误&#xff0c;欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

深度学习模型的生命周期与推理系统架构

目录 深度学习模型的生命周期 ​编辑 深度学习模型的生命周期 推理相比训练的新特点与挑战 推理系统架构 推理系统 vs 推理引擎 顶层:API接口和模型转换 中层:运行时(计算引擎) 底层:硬件级优化 边缘设备计算 主要问题 边缘部署和推理方式 方式1:边缘设备计…

0元白嫖阿里云4G内存云服务器——感谢伟大的CSDN和阿里云

&#x1f9f8;欢迎来到dream_ready的博客&#xff0c;&#x1f4dc;相信您对博主首页也很感兴趣o (ˉ▽ˉ&#xff1b;) 学生邮箱白嫖/免费安装JetBrains全家桶(IDEA/pycharm等) —— 保姆级教程-CSDN博客 目录 1、学生认证领取300元优惠券 ​2、购买云服务器 1、学生认证领取…

Upscayl:款利用人工智能技术,深度学习算法,实现图像无损放大和增强的强大工具。

Upscayl AI&#xff1a; Upscayl AI是一款基于先进的人工智能技术&#xff0c;特别是深度学习算法开发的图像增强工具。它能够智能地分析并改善图像质量&#xff0c;实现无损放大、细节重建和模糊消除&#xff0c;让老旧、低分辨率或模糊的照片焕发新生&#xff0c;达到高清画…

【图论应用】使用多路图(multigraph)对上海地铁站点图建模,并解决最短路径问题

文章目录 1 前言2 导包导入数据集3 创建多路图&#xff0c;导入节点和边信息3 绘制线路图4 计算最短路径 1 前言 最近正在学习图神经网络&#xff0c;先pick up了一些最基础的图论知识并学习了一些好玩的应用。 本文启发于B站视频&#xff08;BV1LY411R7HJ&#xff09;&#…

自动驾驶跟驰仿真

联合仿真需求分析报告 一、项目背景 随着汽车技术的快速发展&#xff0c;自动驾驶和智能网联汽车已成为行业发展的重要趋势。为确保自动驾驶车辆在复杂交通环境中的安全性和可靠性&#xff0c;进行联合仿真测试显得尤为重要。本报告旨在明确联合仿真的具体需求&#xff0c;为…

基本表的定义:创建表、修改表、删除表

一、创建数据库与打开数据库 学生选课数据库 学生&#xff08;学号&#xff0c;姓名&#xff0c;性别&#xff0c;出生时间&#xff0c;所在系&#xff09; 课程&#xff08;课程编号&#xff0c;课程名&#xff0c;先修课程号&#xff09; 选课&#xff08;学号&#xff0…

浅析Vue3 实战笔记(一)

本文是结合实践中和学习技术文章总结出来的笔记(个人使用),如有雷同纯属正常((✿◠‿◠)) 喜欢的话点个赞,谢谢! 有问题欢迎指正!! 前面已经讲了基本的Vue生命周期和入门知识,本篇开始使用Vite构建一个demo 1. 创建项目 1.1. 初始化项目 使用Vite初始化项目 yarn create v…

简单了解java中的异常

异常 1、异常的概述 1.1、概述 异常就是程序出现了不正常的情况&#xff0c;程序在执行过程中&#xff0c;数据导致程序不正常&#xff0c;最终导致JVM的非正常停止。语句错误不算在异常体系中。 1.2、异常的存在形式 异常有类型之分&#xff0c;比如我们比较熟悉的数组越…

【C++11】常见的c++11新特性(一)

文章目录 1. C11 简介2. 常见的c11特性3.统一的列表初始化3.1initializer_list 4. decltype与auto4.1decltype与auto的区别 5.nullptr6.右值引用和移动语义6.1左值和右值6.1.1左值的特点6.1.2右值的特点6.1.3右值的进一步分类 6.2左值引用和右值引用以及区别6.2.1左值引用6.2.2…

两台电脑通过网线直连共享数据(超详细)- 我的实践记录

原文链接 按照原文的操作&#xff0c;成功通过直连网线连接了两台windows电脑并共享传输数据。 ping不通可能是防火墙没关闭导致的&#xff0c;但是完全关闭防火墙又不安全。 那么有没有不关闭防火墙&#xff0c;能够上网&#xff0c;又能直连另一台电脑呢&#xff1f; 我们…

tokenization(一)概述

文章目录 背景基于词&#xff08;Word-based&#xff09;基于字符&#xff08;Character-based&#xff09;子词词元化&#xff08;Subword tokenization&#xff09; 背景 tokenization是包括大语言模型在内所有自然语言处理的任务的基础步骤&#xff0c;其目标是将文本数据转…

数据结构:二叉树的实现

目录 二叉树的遍历方式 前序遍历&#xff1a; 中序遍历&#xff1a; 后序遍历&#xff1a; 二叉树的基本结构和功能 基本结构&#xff1a; 基本功能&#xff1a; 二叉树功能的实现思路 二叉树功能的实现 1、构建一个二叉树 2、二叉树的销毁 3、计算二叉树里的节点个数 4、得…

音频数据上的会话情感分析

情感分析&#xff0c;也被称为观点挖掘&#xff0c;是自然语言处理(NLP)中一个流行的任务,因为它有着广泛的工业应用。在专门将自然语言处理技术应用于文本数据的背景下,主要目标是训练出一个能够将给定文本分类到不同情感类别的模型。下图给出了情感分类器的高级概述。 例如,三…

从零开始理解AdaBoost算法:设计思路与算法流程(二)【权值更新与加权表决、数学公式】

设计思路 AdaBoost算法属于Boosting算法家族中的一种&#xff0c;其基本思路是将多个弱分类器组合成一个强分类器。 “强分类器”是指一个分类准确率较高的模型“弱分类器”则是指分类准确率略高于随机猜测的简单模型。 AdaBoost的核心思想是通过 加权 的方式逐步提高分类器…

Tomcat源码解析(八):一个请求的执行流程(附Tomcat整体总结)

Tomcat源码系列文章 Tomcat源码解析(一)&#xff1a;Tomcat整体架构 Tomcat源码解析(二)&#xff1a;Bootstrap和Catalina Tomcat源码解析(三)&#xff1a;LifeCycle生命周期管理 Tomcat源码解析(四)&#xff1a;StandardServer和StandardService Tomcat源码解析(五)&…

keda-P0460. 潜水员

可达信奥 - 登录 - 可达信奥https://kedaoi.cn/p/P0460 代码思路&#xff1a; 01背包DP。 思路也是比较经典的&#xff0c;就是看用这个水缸的最小值小&#xff0c;还是不用这个水缸的最小值小。但是这里涉及到一个初始化的问题&#xff0c;因为要求最小所以初始化理应…

使用NetAssist网络调试助手在单台计算机上配置TCP服务器和客户端

要使用NetAssist网络调试助手在同一台计算机上配置一个实例作为服务器&#xff08;server&#xff09;和另一个实例作为客户端&#xff08;client&#xff09;&#xff0c;可以按照以下步骤进行操作&#xff1a; 前提条件 确保已经安装NetAssist网络调试助手&#xff0c;并了…