Fourier分析入门——第10章——直接数据分析

news2024/11/22 7:06:29

目录

第10章 直接数据分析

10.1 引言

10.2 均值的方向和集中度(Mean direction and concentration about the mean)

10.3 假设检验(Hypothesis testing)

10.4 分组数据(Grouped data)及其与Fourier的关联

10.4.1 分组数据

10.4.2 分组数据与Fourier的关联

10.5 高次谐波(Higher harmonics)


第10章 直接数据分析

10.1 引言

在前面的章节中,我们将数据向量设想为有序的数字列表。我们已经看到,无论这些数字是实数值(即标量)还是复数值(即二维向量),Fourier分析的方法同样适用。 在本章中,我们特别关注介于实数值和复数值之间的一类数据。这些是二维向量,向量的幅度部分对其没有意义或益处。 换句话说,我们希望检查只有方向重要的数据。 一些示例是视觉对象的运动感知(perceived)方向、视网膜神经节细胞(retinal ganglion cells)的首选方向以及视觉诱发的皮层电位(cortical potential)的电偶极子(electric dipole)发生器的轴。

一个独立的统计学分支已经发展到处理生物学(biology)、地质学(geology)和生理学(physiology)等不同领域的定向数据。方向数据与其他单变量数据之间的主要区别在于,方向数据绘制在圆上而不是实线上。因此,方向数据是周期性的,且因为如此,为计算数据的集中趋势(central tendency)和离散度(dispersion)的简单度量而设计的公式与Fourier分析的公式有着惊人的相似之处。这种相似性允许方向数据分析的Fourier解释揭示了这两种不同数据分析方法之间的密切关系。

10.2 均值的方向和集中度(Mean direction and concentration about the mean)

考虑求得两个罗盘(compass)读数的平均值的问题:5°和 355°。 由于这两个方向都非常接近偏北方向,因此平均值也应该偏北。但是,这两个值的算术平均值为 180°,即正南。 此外,这两个数字的标准偏差为 175°,对于几乎相同的两个方向而言,这远远大于合理值。显然,如果我们要获得合理的结果,就需要一种不同的方法来计算方向数据的均值和分布。 Batschelet (1972) 和 Mardia (1972) 设计的方法如下图 10.1 所示。 这个想法是将各个方向视为单位向量与水平面所成的角度,可以将其视为复平面中的单位相量。 现在假设这些数据 U_i 根据向量加法(或复数求和)的普通规则求和,并将结果除以数据点的数量,根据等式 

\mathsf{B} = \frac{1}{n}\sum_{i=1}^{n}U_i -------------------------------------------------------------------------------------[10.1]

其中,U_i 是第 n 个单位向量,n 是求向的向量数目,且 B 是向量和的归一化结果。在所示的特定示例中,B 是水平方向上长度为 0.996 的向量。 因此,B 的方向是定义平均方向的明显选择,而 B 的长度提供了所有数据向量指向同一方向的程度的合理度量。 如果初始假设是方向随机分布在圆周上,则向量 B 将成为衡量数据偏向特定方向的程度的有用度量。 由于这个原因,B 被称为“偏量向量(bias vector)”(Thibos & Levick,1985)。请注意,如果两个向量指向相反的方向,B 的长度将为零,如果两个向量指向相同的方向,则 B 的长度为 1。一般而言,无论平均方向的数量如何,偏置向量 B 的长度都在范围为 0.0(随机方向)到 1.0(所有方向相同)的方便尺度上提供了关于平均值的数据集中度的度量。 

 

----------------------------------------------图10.1 方向数据分析-------------------------------------------------

10.3 假设检验(Hypothesis testing)

Greenwood & Durand (1955) 设计了 B = 0 零假设的统计检验,称为Rayleigh检验。 Raleigh 统计量 z

z = n|\mathsf{B}|^2-------------------------------------------------------------------------------------[10.2]

其中 n 是样本中的方向数,|B| 是偏置向量的长度。 如果 z 的值超过 Greenwood & Durand (1955) 表 2 中列出的临界值,则零假设将被拒绝,而备择假设即方向不是随机分布的。

10.4 分组数据(Grouped data)及其与Fourier的关联

10.4.1 分组数据

假设为了将数据分组到图 10.2 中所示的箱(bins)中,将圆细分为大小相等的 D 个扇区。假如在第i个箱的圆心方向的单位向量被分配给 U_i ,并且,假设 n_i 数据落入这个箱中,则那组数据可以用分组数据表示为

V_i = n_i U_i -----------------------------------------------------------------------------------[10.3]

按照这种约定,数据点的总数 n 等于组向量的长度之和

n = \sum_{i=1}^{D}V_i ------------------------------------------------------------------------------[10.4]

则,偏置向量计算为分级向量的平均值

B = \frac{1}{n}\sum_{i=1}^{D}V_i 

= \frac{\sum_{}^{}V_i}{\sum_{}^{}|V_i |} --------------------------------------------------------------------------------------[10.5]

图 10.2 中所示的数据列于表 10.1 中,其中记录了偏置向量 B = (1/3, -1/3) 的计算。 从这个结果我们得出结论,这些数据的平均方向是沿着将 \mathsf{U}_1组 和 \mathsf{U}_4组 分开的-45度轴方向。 B 的长度 = \frac{\sqrt{2}}{3} = 0.47 ,Rayleigh 的统计量为 z = 6 \times (\sqrt{2}/3)^2 = 6 × 2/9 = 1.333 。该值小于表格中的临界值 2.86( 5% 水平),因此不能拒绝数据围绕圆均匀分布的零假设。

 

-----------------------------------图10.2 分组数据分析--------------------------------------------

10.4.2 分组数据与Fourier的关联

    为了通过等式[10.5]计算偏置向量B 。首先需要将每个群向量从极坐标形式转换为矩形形式,然后分别对这些正交分量求和。 因此,偏置向量的 𝗑 分量和 𝗒 分量分别由下式给出

B_x = \frac{1}{n}\sum_{j=1}^{D}|V_j |cos(\theta_j)

B_y = \frac{1}{n}\sum_{j=1}^{D}|V_j |sin(\theta_j)----------------------------------------------------------------------[10.6]

其中,D 是分组向量数。这些表达式也称为 |V_j| 的第一三角矩(trigonometrical moments),且它们与通过将图 10.2 的数据重新绘制为如图 10.3 所示的出现频率直方图(a frequency-of-occurrence histogram)而获得的离散数据函数的Fourier系数计算惊人地相似。

 

--------------------------------图 10.3 分组数据直方图-----------------------------------------

为了更清楚地理解偏置向量和Fourier系数 a_1 和 b_1 之间的关系,我们重新调整等式[10.6]为如下形式

B_x = \frac{1}{n}\sum_{j=1}^{D}|V_j |cos(\theta_j)

= \frac{D}{2n}[\frac{2}{D}\sum_{j=1}^{D}|V_j |cos(\theta_j)]

= \frac{D}{2n}a_1 ------------------------------------------------------------------------------------[10.7]

B_y = \frac{D}{2n}b_1 -------------------------------------------------------------------------------[10.8]

将这些结果简化,我们注意到 \frac{D}{2n}=a_0 ,因此

B_x = \frac{a_1}{a_0 }

B_y = \frac{b_1}{a_0 } -----------------------------------------------------------------------------------[10.9]

据此,我们推导出

|\mathsf{B}| = \sqrt{B_x^2+B_y^2} 

= \frac{1}{a_0}\sqrt{a_1^2+b_1^2}

=\frac{m_1}{a_0} ---------------------------------------------------------------------------------------[10.9]

以极坐标形式解释此结果,我们看到分组方向数据中的偏置量等于直方图模型的基本Fourier分量调制(modulation)的一半 

|\mathsf{B}| = \frac{m_1}{a_0 } = \frac{1}{2} \frac{magnitude}{mean} = \frac{modulation}{2} ------------------------------------------[10.10]

此外,均值方向等于基本分量的相位

arg(\mathsf{B}) = \mathsf{tan}^{-1}(\frac{b_1}{a_1}) = phase (译注:arg = average)--------------------[10.11]

总之,我们发现偏置向量(也称为第一个三角矩)的长度等于模型的基本Fourier分量调制的一半,以适应频率直方图。 通过同样的推理,可以证明第 k 个三角矩

M_x = \frac{1}{n}\sum_{j=1}^{D}|V_j |cos(k\theta_j)

M_y = \frac{1}{n}\sum_{j=1}^{D}|V_j |sin(k\theta_j) ------------------------------------------------------[10.12]

也等于第 k 次谐波调制的一半。

10.5 高次谐波(Higher harmonics)

前面的讨论假定方向跨越 0-360 度的范围。 但是,如果考虑其他范围,则可以扩展这些方法应用的实用性。 例如,线的方向限制在 0-180 度范围内,因为 190°方向与 10° 方向相同。 这种情况可以视为数据沿圆周的周期性。 在方向测量的情况下,周期性是二次谐波,因此 k = 2。 某些其他度量可能会沿单位圆重复三次,在这种情况下 k = 3,依此类推。为了在方向数据分析中处理这些高次谐波,通常的方法是通过将所有角度乘以预期的谐波数 k 来计算第 k 个三角矩,如等式 [10.12] 所示。然后,我们继续进行上述标准形式的分析,以获得平均角度 = arg(M)。 在将结果解释为平均方向之前,必须将该计算出的平均角度除以 k

二次谐波分布的示例如图 10.4 所示,其中被分析的量可能是眼睛的散光轴或暴风雨期间与船桅垂直方向的角度。 按照惯例,坐标轴介于 0 到 180 度之间,此示例显示集中在 0 = 180 度附近。

二次谐波分布的示例如图 10.4 所示,其中被分析的量可能是眼睛的散光轴或暴风雨期间与船桅垂直方向的角度。按照惯例,坐标轴介于 0 到 180 度之间,此示例显示集中在 0 = 180 度附近。

 

--------------------------------图10.4 轴数据200个值的分布-------------------------------------

为了计算偏置向量 B,我们首先将所有轴值加倍,如图 10.5 所示,然后应用等式 [10.1]。 以复数表示的结果为 0.93 + 0.03i,其中双轴图的平均方向 = 1°,浓度 = 0.93。 因此,平均轴为 1/2 度,这在直觉上是令人满意的。

 

--------------------------------图10.5 轴数据200个值的分布----------------------------------------

内容来源:

<< Fourier Analysis for Beginners>> Larry N. Thibos

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/575774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决未加载的符号文件

在连接器》命令行里输入&#xff1a;/INCLUDE:?warp_sizecudaatYAHXZ

浅谈智能疏散照明系统在体育场馆中的应用分析

安科瑞 徐浩竣 江苏安科瑞电器制造有限公司 zx acrelxhj 摘要&#xff1a;随着经济的发展和科技的进步&#xff0c;人们对电气智能化提出了更高的要求&#xff0c;使得电气智能化系统在智能建筑中的地位越来越重要。本文结合工程实例对体育场馆智能疏散照明系统的设计进行了…

Matlab:神经网络实现手写数字识别

如今人工智能发展的时代,机器学习有着不可或缺的地位,而其中最为突出的模型该属于神经网络。从提出神经网络开始,历经感知机、人工神经网络、BP神经网络、进化神经网络、卷积神经网络、图神经网络等,不断的深入到众多的研究领域中,比如利用神经网络训练参数、图像识别、文…

机试打卡 -12 滑动窗口最大值(优先队列堆)

我的思路1&#xff1a;队列&#xff0c;每次 出队入队&#xff0c;记录1个队列中的最大值索引&#xff0c;超时。。。 class Solution:def maxSlidingWindow(self, nums: List[int], k: int) -> List[int]:nums_lenlen(nums)ans_list[]# 队列长度为kqueuenums[:k]# 队列最大…

基于GeoToolkit/INT实现二维等值线图绘制示例

继续在上一篇文章的基础上&#xff0c;利用相同的数据处理方法统一了地层数据和断层数据格式&#xff0c;本文主要基于GeoToolkit/INT组件&#xff0c;针对地质专业经常用到的地层数据解析和二维等值线&#xff08;等高或等深线&#xff09;可视化需求&#xff0c;本示例实现了…

Sqoop学习笔记

1 简介 Sqoop是Apache下的一款数据传输工具&#xff0c;用于Hadoop和关系型数据库等结构化数据存储之间的数据传输。 最新的稳定版本是1.4.7,Sqoop2 的最新版本是 1.99.7。请注意&#xff0c;1.99.7 与 1.4.7不兼容&#xff0c;且没有特征不完整&#xff0c;也并不打算用于生…

规则引擎入门-基于easy-rules

目录 概念理解实例和编码抽象出2条规则简单的规则引擎事实1的处理事实2的处理 easy-rules 规则的抽象和执行事实描述规则的抽象默认的规则 动态代理执行规则和动作规则的执行&#xff1a;org.jeasy.rules.core.DefaultRulesEngine#doFirepublic class RuleProxy implements Inv…

递归的基本概念

分类&#xff1a; 直接递归 间接递归 如果递归函数中调用递归的语句为最后一个执行语句&#xff0c;则称这种递归为尾递归 递归使用条件 原问题可以划为一个或多个子问题&#xff0c;且子问题的求解方式与原问题相同&#xff0c;只是数量规模不同 递归的调用次…

突破职场难题有效沟通、应对压力、提升能力,实现职场成功

在竞争激烈的职场中&#xff0c;我们经常面临各种职场挑战&#xff0c;例如如何有效沟通、应对工作压力以及提升职业能力等。下面分享一下在职场中的经验&#xff0c;帮助你提升职场技能&#xff0c;实现出色表现&#xff1a; 一、高效沟通&#xff1a; 倾听与理解&#xff1…

5.26~5.27

https://blog.csdn.net/m0_72827793/article/details/130478513 接着之前的内容 32bit.exe为何运行不了&#xff1f; 第一个问题当我运行32bbit.exe 那是因为我编译出的程序时64位的程序 64位程序和32位程序&#xff0c;在编译的时候&#xff0c;具有差异&#xff0c;在32位…

Qt_C++读写M1IC卡源码支持windows国产linux操作系统

Android Linux RFID读写器NFC发卡器WEB可编程NDEF文本/智能海报/-淘宝网 (taobao.com) IC卡的特性 1、分为16个扇区&#xff0c;每个扇区为4块&#xff0c;每块16个字节,以块为存取单位&#xff1b; 2、每个扇区有独立的一组密码及访问控制&#xff1b; 3、每张卡有唯一序列号…

HACK ME PLEASE: 1实战演练

文章目录 HACK ME PLEASE: 1实战演练一、前期准备1、相关信息 二、信息收集1、访问网站2、端口扫描2、扫描目录3、访问网站4、访问网站5、扫描目录6、访问网站7、登录MySQL数据库8、查看数据表9、查看users表的内容10、查看tblUsers表内容11、解密12、加密13、修改密码14、查询…

CentOS7.6(Linux)环境下有网和无网安装Docker

1、 服务器有网环境 1.1、手动卸载旧版本 sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine1.2、安装yum-utils sudo yum install -y yum-utils \device-mapper-per…

项目并行管理指南:如何做好多项目管理?

多项目并行已经是大部分企业的现状&#xff0c;多项目并行同时进行已然是大部分企业的现状&#xff0c;同时管理多个项目是一件具有挑战性的&#xff0c;但是有一些方法和工具可以帮助我峨嵋你有条理地实施项目&#xff0c;提高效率&#xff0c;降低工作压力。 一&#xff0c;设…

【C++系列P4】模板搞不懂?脑阔抖三抖!!精讲一篇过!

前言 大家好吖&#xff0c;欢迎来到 YY 滴 C系列 &#xff0c;热烈欢迎&#xff01;本章主要内容面向接触过C的老铁&#xff0c;主要内容含 目录 一.模板 1.函数模板 一.函数模板概念 二.函数模板的格式 三.函数模板的实例化 1.隐式实例化 2.显式实例化 3.模板参数的…

多模态应用展望——看图聊天、BLIP2

看图聊天 BLIP2 是 salesforce 公司开源的多模态模型&#xff0c;其大致的原理&#xff0c;可以类比看图写作&#xff0c;当前 AI 在文生图模式之外&#xff0c;也支持图生文模式&#xff0c;可以将照片中的核心元素识别出来。然后把这些元素作为上下文&#xff0c;交给 ChatG…

MYSQL 8 中间字段有NULL 值,还是无法走索引,所以我高估了MYSQL 的查询智商

开头还是介绍一下群&#xff0c;如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题&#xff0c;有需求都可以加群群内有各大数据库行业大咖&#xff0c;CTO&#xff0c;可以解决你的问题。加群请联系 liuaustin3 &#xff0c;在新加的朋友会分到2群&#xff08;共…

并查集(算法)

目录 一、并查集的概念二、并查集的使用合并集合连通块中点的数量食物链带权并查集扩展域并查集 一、并查集的概念 最裸并查集&#xff1a; 将两个集合合并。 询问两个元素是否在一个集合当中 &#xff0c;近乎 O ( 1 ) O(1) O(1) 时间内支持两个操作 基本原理&#xff1a…

chatgpt赋能python:Python文件大小:如何优化和管理您的文件大小

Python 文件大小&#xff1a;如何优化和管理您的文件大小 Python 是世界上最流行的编程语言之一&#xff0c;被广泛用于各种不同的应用程序。但是&#xff0c;随着项目变得越来越复杂&#xff0c;并且在需要处理大量数据的情况下&#xff0c;文件大小经常成为一个问题。因此&a…

数据包伪造、替换、劫持,https劫持之探索和测试

&#xff08;一&#xff09;数据包替换攻击 该攻击过程如下&#xff1a;伪造服务器响应客户端的数据包。监听客户端的数据包&#xff0c;用预先伪造的数据包&#xff0c;伪装成服务器返回的数据发送给客户端。 因为攻击者跟目标在同一个局域网&#xff0c;所以攻击者发送的数…