有偏估计的发展及其在球谐函数拟合中的应用研究

news2024/11/28 8:24:18

有偏估计的发展及其在球谐函数拟合中的应用研究

阚昊宇

专业:大地测量与测量工程

学号:XXX

邮箱:XXX

电话:XXX

摘要:球谐函数在大地测量等领域具有重要意义,然而在观测量不多或空间分布不均匀时进行高阶球谐函数拟合,法方程系数矩阵容易严重病态,导致拟合结果不可靠。而有偏估计方法常被应用于解决由于法方程系数阵病态而导致的最小二乘估计计算不稳定问题。以中国西藏地区的GPT2w气象模型气压参数为例,对比了普通最小二乘与不同岭参数选取下的岭估计结果。结果表明,较小的岭参数能更有效的解决球谐函数拟合的不适定问题。

关键词:有偏估计;岭参数;球谐函数;GPT2w模型

Development of biased estimation and its application in spherical harmonic function fitting

Abstract: Spherical harmonic function is of great significance in geodesy and other fields. However, when high-order spherical harmonic function is fitted or when there are few observations or uneven spatial distribution, the coefficient matrix of the normal equation is prone to be seriously ill conditioned, resulting in unreliable fitting results. The biased estimation method is often used to solve the problem of unstable calculation of the least square estimation that caused by the ill conditioned coefficient matrix of the normal equation. Taking the atmospheric pressure parameters of the GPT2w meteorological model in Tibet, China as an example, the results of ordinary least squares and ridge estimation under different ridge parameters are compared. The results show that smaller ridge parameters can effectively solve the ill conditioned posed problem of spherical harmonic function fitting.

Keywords: Biased Estimation, Ridge Parameter, Spherical Harmonics; GPT2w Model

1 研究背景与意义

测量数据的参数估计是测量工作中最重要的环节之一,其对测量精度产生直接影响。最小二乘估计(Least Square Estimation,LS)是最常用的一种估计方法,在观测值误差服从正态分布的前提下,最小二乘估计为最优线性无偏估计(Best Linear Unbiased Estimate)。因此,最小二乘估计是被广泛采用的重要估计方法。但是在实际应用中,由于建立数学模型时过度参数化或是有效观测数不足,导致参数之间存在一定程度的复共线性(Multicollinearity),进而造成法方程系数矩阵病态[1],此时需要设法减轻其对最终测量精度的影响。有偏估计的提出就是为了消除矩阵病态影响,常用的有偏估计方法有岭估计(Ridge Estimation,RE)、广义岭估计(Generalized Ridge Estimation,GRE)、主成分估计(Principal Component Estimation,PCE)等[2]。

岭估计是目前最有影响、应用最为广泛的一种有偏估计[3],由Hoerl和Kennard于1970年提出[4]。它是根据最小二乘估计提出的一种改进的有偏估计,主要通过确定一个岭参数k来打破法方程系数阵N的复共线性,进而减弱数据呈病态性对参数估计的影响[5]。

2 国内外研究现状

 

 

3 待解决的问题及进一步研究的有关想法

线性模型发展到现在,其参数估计理论和方法研究已经具有十分丰富的理论体系,但是在一些新算法方面和特殊应用情况下还需要进一步的探讨。例如:

在评估准则方面,大部分文献考虑的是在均方误差最小化准则下进行比较,少部分文献从误差分位数进行推导,后续可以在其他准则下探讨估计的优良性,例如绝对值准则(L1正则化)、参数数量(L0正则化)等。

在参数估计方法上,有最近新提出的新型Liu估计、r-k类估计、新型主成分估计、混合估计等[14]还需进一步讨论。

最后,在约束条件方面上,大部分文献考虑的是带随机约束的线性模型,对于一些更加复杂的约束条件,例如区间约束、椭球约束、整数约束等的论述还较为缺乏,但是这些约束在实际情况中往往经常出现。例如,本文第4章将在球面上采用岭估计拟合模型。

4 算法验证:GPT2w气象模型球谐函数建模结果与分析

4.1 GPT2w经验气象模型

GPT2w是GNSS精密数据处理等领域中广泛使用的先验气象模型,由Vienna University Of Technology的Bohm等人于2014年提出[15],列出了包括气压、温度及其垂直递减率等多项气象参数在全球范围内的1°×1°经纬分辨率的平均项、年周期项和半年周期项。

由于1°×1°的经纬分辨率,每个气象参数在全球有180×360=64800个采样,本文以中国西藏地区(经度25°~40°,纬度70°~100°)的450个采样点为例进行计算。由于气压参数的精度对于GNSS定位中天顶对流层静力学延迟(Zenith Hydrostatic Delay)的计算影响很大,因此本次实验采用其中的气压平均项参数pa0,单位为Pa,原始数据如图 2所示(为方便对比,与最小二乘估计结果、岭估计结果一起置于文末),可见西藏地区由于高原气候及山脉影响,气压变化剧烈,拟合难度较高。

4.2球谐函数

 

 

4.3最小二乘估计结果

按照普通最小二乘,其法方程系数阵N的条件数为2.7×1020,为严重病态,其最小二乘解得到的拟合参数复原结果如图 3所示,不能得到合理的模型。模型最大值超过了原始数据的三倍,最小值甚至出现了负数,这对于气压这个物理量来说是不能接受的。

4.4 岭估计结果

选取不同的岭参数k=1e-9, 1e-6, 1e-3, 1e-1和1,得到估计结果统计量为下表所示。

表 1 不同岭参数下岭估计结果统计

岭参数k

cond(N)

RMSE

单位(Pa)

残差95%分位数

单位(Pa)

预计对ZHD计算影响

单位(cm)

1e-9

2.0e+12

3241

5381

6

1e-6

2.0e+8

4391

7734

8

1e-3

2.0e+6

5412

9865

10

1e-1

2.0e+4

6192

10812

12

1

2.0e+3

6503

10907

12

为篇幅所限,这里仅绘出k=1e-9和1时的岭估计结果(分别为图 4和图 5),可见k=1e-9时对应的拟合样式最接近与原始数据分布,并且此时拟合的RMSE和残差95%分位数也是最小的。因此,在本次实验中,应当采用k=1e-9的岭估计。

结果表明,在球谐函数拟合时,最小二乘估计法方程病态而不能得到很好的解,但岭估计方法拟合结果较好,具有更好的可行性与有效性。

 

参考文献

[1] 王振杰. 大地测量中不适定问题的正则化解法研究 [D]. 中国科学院研究生院(测量与地球物理研究所), 2003.

[2] 王其腾, 吴风华. 广义岭估计在矩阵病态问题中的应用 [J]. 华北理工大学学报(自然科学版), 2022, 44 (02): 29-34.

[3] García García C, Salmerón Gómez R, García Pérez J. A review of ridge parameter selection: minimization of the mean squared error vs. mitigation of multicollinearity [J]. Communications in Statistics - Simulation and Computation, 2022, 1-13.

[4] Hoerl A E, Kennard R W. Ridge Regression: Biased Estimation for Nonorthogonal Problems [J]. Technometrics, 1970, 12 (1): 55-67.

[5] Lukman A F, Ayinde K. Review and Classifications of the Ridge Parameter Estimation Techniques [J]. Hacettepe Journal of Mathematics and Statistics, 2016, 46 (113): 1-.

[6] Rifkin R M, Lippert R A. Notes on Regularized Least Squares [J]. 2007,

[7] J. F L, P W. A simulation study of ridge and other regression estimators [J]. Communications in Statistics - Theory and Methods, 2010, 5 (4): 307-23.

[8] Alkhamisi M, Khalaf G, Shukur G. Some Modifications for Choosing Ridge Parameters [J]. Communications in Statistics - Theory and Methods, 2006, 35 (11): 2005-20.

[9] Muniz G, Kibria B M G, Shukur G. On Developing Ridge Regression Parameters: A Graphical investigation [J]. FIU Digital Commons, 2012,

[10] Suhail M, Chand S, Kibria B M G. Quantile based estimation of biasing parameters in ridge regression model [J]. Communications in Statistics - Simulation and Computation, 2019, 49 (10): 2732-44.

[11] 黄海兰, 牛犇. 岭参数确定的研究 [J]. 测绘科学, 2011, 36 (04): 31-2.

[12] 王乐洋, 许才军, 鲁铁定. 病态加权总体最小二乘平差的岭估计解法 [J]. 武汉大学学报(信息科学版), 2010, 35 (11): 1346-50.

[13] 鲁铁定. 总体最小二乘平差理论及其在测绘数据处理中的应用 [D]. 武汉大学, 2010.

[14] 周星晔. 测量误差模型下的三种新的有偏估计方法 [D]. 重庆大学, 2021.

[15] Böhm J, Möller G, Schindelegger M, 等. Development of an improved empirical model for slant delays in the troposphere (GPT2w) [J]. GPS Solutions, 2014, 19 (3): 433-41.

[16] Ambs P, Sanchez-Mondragon J, Beyette J F R, 等. Data fitting on a spherical shell [A], Wave Optics and Photonic Devices for Optical Information Processing II [C]. 2003.

[17] 覃宇欣, 黄海兰. 吉洪诺夫正则化总体最小二乘的圆曲线拟合 [J]. 测绘科学, 2021, 46 (05): 33-7+65.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/428643.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

视频编解码(一)之virtio-gpu环境搭建

一、基础概念 VA-API Video Acceleration API 是一组开源应用API接口,赋能应用(比如VLC播放器、GStreamer等)使用hardware video acceleration(一般是GPU提供硬件视频加速功能),VA-API主要由开源库libva和…

机器学习算法系列(三)

机器学习算法之–对数几率回归(逻辑斯蒂回归)算法 上个算法(算法系列二)介绍了如何使用线性模型进行回归学习,但若要做的是分类任务,则需要找一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值…

Scons自动大型系统构建工具

1、先了解一下make 在Linux系统上做过c/c++开发的同学们都知道一个项目工程管理工具:make和Makefile。 make 这个工具自上个世纪 70 年代 Stuart Feldman 在贝尔实验室开发出以来,就一直是类 UNIX 程序员的最爱之一。 通过检查文件的修改时间,make 工具可以知道编译目标文…

关于原子服务的思考

在我们以往的工作中经常会遇到“原子服务”或“原子化服务”的概念,如果没有一个清晰的概念边界,会使大家的沟通和讨论无法在同一个共识上展开,大家不在同一频道上,割裂于不同的领域空间,难以产生一致性的进展。那么&a…

SAR ADC系列26:系统设计

目录 串一下知识点: 设计一个高速异步SAR ADC 设计目标: 电路架构:(具体电路看前文) 采样网络: 采样电容: CDAC开关切换策略: CDAC阵列冗余设计: SAR 逻辑 比…

谈谈内存模型happen-before讲的什么?

大家好我是易安! 今天我要讲述的是Java内存模型中的happen-before。 Java语言在设计之初就引入了线程的概念,以充分利用现代处理器的计算能力。多线程机制既带来了强大、灵活的优势,也带来了线程安全等令人混淆的问题。在这种情况下&#xff…

二叉查找树

目录 一、二叉查找树概念 二、结点内部类代码实现: 三、二叉查找树的插入原理​编辑 四、遍历的方式(中序遍历): 五、二叉查找树实现指定值删除对应的结点 六、main方法测试 一、二叉查找树概念 二、结点内部类代码实现&…

聚类问题的算法总结

目录 一、K-means算法 1、算法原理 2、如何确定K值 3、算法优缺点 二、DBScan聚类 1、算法原理 2、处理步骤 3、算法优缺点 聚类代码实现 聚类算法属于无监督学习,与分类算法这种有监督学习不同的是,聚类算法事先并不需要知道数据的类别标签&am…

高效释放数据价值,数智融合平台有门道

在数字经济时代,数据上升为新的关键生产要素,逐渐超越土地、资本等传统要素,成为社会经济发展和企业创新更加重要的驱动力。 但如何充分释放数据价值在当下依然是一个世界性难题。一方面,企业与组织逐渐拥有海量数据规模和丰富应…

基于CBC、ECB、CTR、OCF、CFB模式的AES加密算法

1、什么是AES加密算法 什么是加密算法?我在文章《从个人角度看什么是加密算法》中描述了我对加密算法的一些浅薄的理解。我不是信息安全领域的大神,只求有一个入门罢了! 这篇文章是文章《从个人角度看什么是加密算法》的延伸,所…

【C++初阶】:缺省函数和函数重载

c入门一.缺省函数二.函数重载1.参数类型不同2.参数个数不同3.参数顺序不同一.缺省函数 缺省函数,顾名思义就是可以在传参时不传或者少传参数的函数。这里举个例子: 完全缺省 上面的就属于全缺省,可以不传任何参数,当然也可以传参…

Codeforces Round 862 (Div. 2) -- D. A Wide, Wide Graph(树的直径 贪心 简单的树形dp)

题目如下: 题意简说: 树上两点 u,vu, vu,v,如果 u,vu, vu,v 的距离大于等于 kkk 则在图 GkG_kGk​ 上 u,vu, vu,v 有一条无向边。 求当 kkk 等于 [1, n] 的时候,图 GkG_kGk​ 的连通块数量。 思路 or 题解: 我们可以…

【服务器】Dell PowerEdge R750 安装GPU

各种教程 官方教程 https://www.dell.com/support/manuals/zh-cn/poweredge-r750/per750_ism_pub/%E5%AE%89%E8%A3%85-gpu?guidguid-6bb1c301-7595-4c6d-b631-b6a5761c6052&langzh-cn 手册PDF版: https://dl.dell.com/content/manual16153190-dell-emc-powe…

OKR与敏捷开发的结合

当你想达成某件事情时,你在内心会有一个设想的期望结果。这是一个非常简单、基本的概念,并且是从很多人小时候就培养起来的。我们可以将这种现象总结一句话: 通过 ________ 来衡量__________ 。 这就是 John Doerr 在其著作《Measure what Ma…

JavaWeb开发 —— Maven

目录 一、概述 1. 介绍 2. 安装 二、maven-idea 集成 1. 配置及创建Maven项目 2. IDEA 创建Maven项目 3. IDEA导入 Maven 项目 三、依赖管理 1. 依赖配置 2. 依赖传递 3. 依赖范围 4. 生命周期 一、概述 1. 介绍 ① Apache Maven 是一个项目管理和构建工…

【UDP报文和TCP协议特性】

目录1.UDP报文1.1报文长度1.2校验和2.TCP协议特性2.1确认应答2.2超时重传2.3连接管理2.3.1三次握手2.3.2四次挥手2.4滑动窗口2.5流量控制2.6拥塞控制2.7延时应答2.8捎带应答2.9面向字节流2.10异常情况3.小结3.1tcp小结3.2tcp和UDp应用场景的差异4.寄语1.UDP报文 udp是传输层最…

【Android】之【内存管理】

一、Android内存运行是如何运行的? 物理内存即移动设备上的ram,当启动一个android程序时,会启动一个dalvik vm进程,系统会给它分配固定的内存空间【16m,32m,64m,不定,没有统一标准,每个虚拟机会有堆内存阈…

【Minecraft开服教程】使用 MCSM 面板一键搭建我的世界服务器,并内网穿透公网远程联机

文章目录前言1.Mcsmanager安装2.创建Minecraft服务器3.本地测试联机4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射内网端口5.远程联机测试6. 配置固定远程联机端口地址6.1 保留一个固定TCP地址6.2 配置固定TCP地址7. 使用固定公网地址远程联机前言 MCSManager是一个开源…

C++ float 数据的保存格式

总体上,在计算机中, float 数据的的保存按照如下转换逻辑:10进制数 >二进制数>科学计数法二进制数>c 条件下下浮点数在内存中的保存格式(这里面有个转换算法,需要理清楚)。 下面举出一个案例&…

Python+selenium自动化测试实战项目(全面,完整,详细)

前言 之前的文章说过, 要写一篇自动化实战的文章, 这段时间比较忙再加回家过清明一直没有更新,今天整理一下实战项目的代码共大家学习。(注:项目是针对我们公司内部系统的测试,只能内部网络访问,外部网络无…