Weighted A* 改进型(1):XDP

news2025/1/9 10:12:00

本文的主要内容来自于文献[1],总的来说这篇文献给我的感觉就是理论证明非常精妙,最后的实际效果也是提升的非常明显。

在Introduction中作者给出了一般Best first search(BFS,常用的包括A *,weighted A * ,Focal search( A ε   ∗ A_{\varepsilon}^{\ *} Aε ),Dynamical Potential search (DPS)和 Bounded suboptimal search(BSS)等在内)的通用框架如下:

在这里插入图片描述

一般来说作为weighted A * 的改进型算法一般都能保证 w w w-optimality,即算法所搜索到的路径代价不超过 w C ∗ w C^{*} wC,其中 C ∗ C^{*} C是一个optimal的路径代价。作者主要的改进在于设计了一种相比于原有启发式函数 f ( n ) f(n) f(n)的新的启发式函数 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n))用于BFS搜索,避免了open表中结点的重复查找(reopenings),并从理论上证明了该启发式函数的 w w w-optimality性能。

在这里插入图片描述

关于为啥要减少open表中的重复查找呢?作者认为主要是在open表中进行结点的重复查找可能会导致一个大的时间复杂度 O ( N 2 ) O(N^2) O(N2),尤其是当状态结点 N N N的个数非常大的时候,这可能会导致寻路成本的增加。

在这里插入图片描述

全文的主体思路是通过给出了一类 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n))函数能保证 w w w-optimality的条件,并加以证明。说明了直接在采用这个函数的情况下,可以避免reopenings。对于 f ( n ) = h ( n ) + w g ( n ) f(n)=h(n)+wg(n) f(n)=h(n)+wg(n) 来说,算法由于常权重 w w w,在起终时刻始终保证固定的 w w w-optimality;而对于 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n)),算法同样也可以保证最终代价的 w w w-optimality,但是在open表搜索过程中的代价却可以不为 w w w-optimality。

w w w-optimality的相关条件

在证明 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n)) w w w-optimality之前,作者首先证明了在finite state space中,对于任意priority function Φ \Phi Φ在不用re-open的情况下,采用BFS搜索都可以保证完备性(complete,即从起点start到goal如果存在路径,BFS总能找到一条合适的路径),证明见Lemma1:

在这里插入图片描述

在说明了完备性的情况下,作者首先给出了 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n))函数应当具有的4条性质:
{ ∂ Φ ∂ x > 0 , ∂ Φ ∂ y > 0 ∂ Φ ∂ y ≤ ∂ Φ ∂ x Φ ( 0 , w t ) = Φ ( t , 0 ) = t ∂ Φ ∂ x + ∂ Φ ∂ y ≤ 2 \begin{cases} \frac{\partial \Phi}{\partial x} > 0,\frac{\partial \Phi}{\partial y} > 0\\ \frac{\partial \Phi}{\partial y} \leq \frac{\partial \Phi}{\partial x} \\ \Phi(0,wt)=\Phi(t,0)=t\\ \frac{\partial \Phi}{\partial x} + \frac{\partial \Phi}{\partial y} \leq 2 \end{cases} xΦ>0,yΦ>0yΦxΦΦ(0,wt)=Φ(t,0)=txΦ+yΦ2
另外,作者还给出了 Φ \Phi Φ-inequality的定义: Φ ( h ( p ) , g ( p ) ) ≤ Φ ( 0 , w ( h ( p ) + g ∗ ( p ) ) ) = Φ ( h ( p ) + g ∗ ( p ) , 0 ) \Phi (h(p),g(p))\leq \Phi(0,w(h(p) + g^{*}(p)))=\Phi(h(p) + g^{*}(p),0) Φ(h(p),g(p))Φ(0,w(h(p)+g(p)))=Φ(h(p)+g(p),0)(原文中Definition 1 )。在上面4条性质和1个定义的基础上,作者首先证明了:

Theorem 2)对于满足性质1的函数 Φ \Phi Φ,在搜索过程中,如果对于每个第一次扩展的状态结点 p p p都有 Φ \Phi Φ-inequality成立,那么搜索出的路径具有 w w w-optimality性质,且没必要进行re-open(或者说re-expand)。

Proof. 首先由Lemma1,我们知道一定可以扩展出一条以代价 g ( g o a l ) g(goal) g(goal)到goal的路径,那么对于目标状态 g o a l goal goal而言,由 Φ \Phi Φ-inequality不等式:
Φ ( h ( g o a l ) , g ( g o a l ) ) = Φ ( 0 , g ( g o a l ) ) ≤ Φ ( 0 , w ( h ( g o a l ) + g ∗ ( g o a l ) ) ) = Φ ( 0 , w g ∗ ( g o a l ) ) \Phi(h(goal),g(goal))=\Phi(0,g(goal)) \\ \leq \Phi(0,w(h(goal)+g^{*}(goal))) \\ =\Phi(0,wg^{*}(goal)) Φ(h(goal),g(goal))=Φ(0,g(goal))Φ(0,w(h(goal)+g(goal)))=Φ(0,wg(goal))
由于性质1说明了 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n))对于 g g g的单调递增性,因此 g ( g o a l ) ≤ w g ∗ ( g o a l ) g(goal) \leq w g^{*}(goal) g(goal)wg(goal),说明最后的搜索路径具有 w w w-optimality性质。

对于这个不用re-open的说明,我实在没看懂,希望后面能有机会再看看。

下面给出Deepl机翻的结果:

在这里插入图片描述

因此,我们只需证明 Φ-inequality 对每个以给定优先级函数展开的状态都成立。图 4(b) 是证明这一点的高级方法。假设我们计划扩展一个状态 q,其中 p 是通往 q 的最优路径上扩展的最后一个状态。与之前一样,p 下方的蓝色点代表通往 p 的最优路径,(a) 处的曲线是该点的隔离线。根据 Φ-inequality 我们可以知道,p 在(a)点开始的隔离线之下。因此,如果搜索以最优方式从 p 移动到 q,那么 q(以及从 p 到 q 的最优路径上的所有状态)仍应位于 h 轴上 (b) 点的 h(q) + g∗(q) 分割线之下,因为最优路径不会积累任何额外的次优状态。如果这一点成立,那么总有至少一条路径(最优路径的剩余部分)可以在最优约束下达到目标,而无需重新扩展先前扩展的状态。虽然在实践中搜索可能会扩展出一条不那么理想的路径,但所探索的路径仍能保证在 Φ 允许的范围内。

因此,对于Theorem 2而言,如果我们能证明在满足某些性质的条件下,对于每个第一次扩展的状态结点 p p p都有 Φ \Phi Φ-inequality成立,哪么根据Theorem 2的结论, w w w-optimality和不需要re-open的性质就能得到满足。下面的Theorem 8给出了 Φ \Phi Φ所需要满足的条件:

Theorem 8)假设BFS所采用的优先级函数 Φ \Phi Φ满足性质1-4,哪么对于所有的扩展结点都有 Φ \Phi Φ-inequality成立。

Proof. 首先需要不加证明(证明见原论文)的给出以下引理作为证明条件,

Lemma 3. 对于 p p p的后继(descendant)结点 q q q而言,其在 h h h- g g g坐标系下分别为 ( h ( p ) , g ( p ) ) (h(p),g(p)) (h(p),g(p)) ( h ( q ) , g ( p ) + d ( p , q ) ) (h(q),g(p)+d(p,q)) (h(q),g(p)+d(p,q))。对于任意从 p p p q q q上位于optimal path上的中间结点 p 1 p_1 p1,其必位于 p p p q q q所处的矩形对角点上,如Figure 4(b)所示。

根据原文中Definition 2中定义的最右角点 ( x r , y r ) (x_r,y_r) (xr,yr)
{ x r = h ( p ) + d ( p , q ) + h ( q ) − h ( p ) 2 y r = g ( p ) + d ( p , q ) + h ( q ) − h ( p ) 2 \begin{cases} x_r = h(p) + \frac{d(p,q) + h (q) - h(p)}{2}\\ y_r = g(p) + \frac{d(p,q) + h (q) - h(p)}{2}\\ \end{cases} {xr=h(p)+2d(p,q)+h(q)h(p)yr=g(p)+2d(p,q)+h(q)h(p)
原文Lemma 6说明了对于从 p p p q q q的所有在optimal path上的状态 s s s,角点是使 Φ \Phi Φ最大的点,即: Φ ( h ( s ) , g ( p ) + d ( p , s ) ) ≤ Φ ( x r , y r ) \Phi(h(s),g(p)+d(p,s)) \leq \Phi(x_r,y_r) Φ(h(s),g(p)+d(p,s))Φ(xr,yr)

另外,有Corollary 7: Φ ( x + t , y + t ) ≤ Φ ( x , y ) + 2 t \Phi(x+t,y+t)\leq \Phi(x,y) + 2t Φ(x+t,y+t)Φ(x,y)+2t。证明利用了性质4和 Φ \Phi Φ的Lipschitz连续性条件。

下面进入正式的论证,采用数学归纳法证明 Φ \Phi Φ-inequality的成立:

首先Base case: 对于初始状态start,必然有 Φ ( h ( s t a r t ) , g ( s t a r t ) ) = Φ ( h ( s t a r t ) + g ∗ ( s t a r t ) , 0 ) \Phi (h(start),g(start))=\Phi(h(start) + g^{*}(start),0) Φ(h(start),g(start))=Φ(h(start)+g(start),0)成立,因为 g ( s t a r t ) = g ∗ ( s t a r t ) = 0 g(start)=g^{*}(start)=0 g(start)=g(start)=0

再对于Inductive step:假设对于所有已扩展的路径(expanded paths)上的结点都有 Φ \Phi Φ-inequality成立,并且状态 q q q是从open表中选出来的要扩展的下一个结点,我们需要证明结点 q q q满足 Φ \Phi Φ-inequality,即: Φ ( h ( q ) , g ( q ) ) ≤ Φ ( h ( q ) + g ∗ ( q ) , 0 ) \Phi(h(q),g(q))\leq \Phi(h(q)+g^{*}(q),0) Φ(h(q),g(q))Φ(h(q)+g(q),0)
作为在closed表中optimal path上的, q q q的上一个结点 p p p,由递推假设满足:
Φ ( h ( p ) , g ( p ) ) ≤ Φ ( h ( p ) + g ∗ ( p ) , 0 ) = h ( p ) + g ∗ ( p ) \Phi(h(p),g(p))\leq \Phi(h(p)+g^{*}(p),0) = h(p)+g^{*}(p) Φ(h(p),g(p))Φ(h(p)+g(p),0)=h(p)+g(p) 这里必然存在一个在open表中,由 p p p所扩展出的successor结点 p x p_x px,其位于从 p p p q q q的optimal path上,满足 Φ ( h ( q ) , g ( q ) ) ≤ Φ ( h ( p x ) , g ( p x ) ) \Phi(h(q),g(q))\leq \Phi(h(p_x),g(p_x)) Φ(h(q),g(q))Φ(h(px),g(px))。这是因为BFS在结点扩展时会先扩展 Φ \Phi Φ最小的 q q q,而不是 p x p_x px。令 t = ( d ( p , q ) + h ( q ) − h ( p ) ) / 2 t=(d(p,q)+h(q)-h(p))/2 t=(d(p,q)+h(q)h(p))/2,根据Lemma6有:
Φ ( h ( q ) , g ( q ) ) ≤ Φ ( h ( p x ) , g ( p ) + d ( p , p x ) ) ≤ Φ ( h ( p ) + t , g ( p ) + t ) ≤ Φ ( h ( p ) , g ( p ) ) + 2 t = Φ ( h ( p ) , g ( p ) ) + d ( p , q ) + h ( q ) − h ( p ) ≤ g ∗ ( p ) + h ( q ) + d ( p , q ) ≤ g ∗ ( q ) + h ( q ) = Φ ( g ∗ ( q ) + h ( q ) , 0 ) \Phi(h(q),g(q))\leq \Phi(h(p_x),g(p)+d(p,p_x)) \\ \leq \Phi(h(p) + t,g(p)+t) \\ \leq \Phi(h(p),g(p))+2t \\ =\Phi(h(p),g(p)) + d(p,q)+h(q)-h(p) \\ \leq g^*(p)+h(q) + d(p,q) \\ \leq g^{*}(q) + h(q) =\Phi(g^{*}(q) + h(q),0) Φ(h(q),g(q))Φ(h(px),g(p)+d(p,px))Φ(h(p)+t,g(p)+t)Φ(h(p),g(p))+2t=Φ(h(p),g(p))+d(p,q)+h(q)h(p)g(p)+h(q)+d(p,q)g(q)+h(q)=Φ(g(q)+h(q),0)这对 q q q证明了 Φ \Phi Φ-inequality的成立,因此假设成立。

上面的Theorem2和Theorem8综合起来说明了,对于满足4条性质的 Φ ( h ( n ) , g ( n ) ) \Phi(h(n),g(n)) Φ(h(n),g(n)),其能保证 w w w-optimality和避免reopening。

XDP函数

XDP函数是一类特殊的 Φ \Phi Φ函数 Φ X D P ( x , y ) = U \Phi_{XDP}(x,y)=U ΦXDP(x,y)=U,其具有 y = a x 2 + b x + c y=ax^2+bx+c y=ax2+bx+c的二次函数形式,并且满足 Φ \Phi Φ的4条性质,同时经过 ( 0 , w U ) (0,wU) (0,wU) ( U , 0 ) (U,0) (U,0)点。在 ( U , 0 ) (U,0) (U,0)处的斜率为 − 1 -1 1。得到:
{ c = w U a U 2 + b U + c = 0 2 a U + b = − 1 \begin{cases} c = wU\\ aU^2+bU+c=0 \\ 2aU + b =-1 \end{cases} c=wUaU2+bU+c=02aU+b=1解算出的:
Φ X D P ( x , y ) = U = y + ( 2 w − 1 ) x + ( y − x ) 2 + 4 w y x 2 w \Phi_{XDP}(x,y)=U=\frac{y+(2w-1)x+\sqrt{(y-x)^2+4wyx}}{2w} ΦXDP(x,y)=U=2wy+(2w1)x+(yx)2+4wyx

参考文献

[1] Chen, J., Conditions for Avoiding Node Re-expansions in Bounded Suboptimal Search, in Proceedings of the . AAAI Conference on Artificial Intelligence. 2019, Proceedings of the . AAAI Conference on Artificial Intelligence.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1820617.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FPGA - 滤波器 - FIR滤波器设计

一,数字滤波器 滤波器是一种用来减少或消除干扰的器件,其功能是对输入信号进行过滤处理得到所需的信号。滤波器最常见的用法是对特定频率的频点或该频点以外的频率信号进行有效滤除,从而实现消除干扰、获取某特定频率信号的功能。一种更广泛的…

一杯咖啡的艺术 | 如何利用数字孪生技术做出完美的意式浓缩咖啡?

若您对数据分析以及人工智能感兴趣,欢迎与我们一起站在全球视野关注人工智能的发展,与Forrester 、德勤、麦肯锡等全球知名企业共探AI如何加速制造进程, 共同参与6月20日由Altair主办的面向工程师的全球线上人工智能会议“AI for Engineers”…

考研计组chap3存储系统

目录 一、存储器的基本概念 80 1.按照层次结构 2.按照各种分类 (41)存储介质 (2)存取方式 (3)内存是否可更改 (4)信息的可保存性 (5)读出之后data是否…

Sui Bridge在测试网上线并推出10万SUI激励计划

是一种为Sui设计的原生桥接协议,专门用于在Sui与其他网络之间桥接资产和数据。今天,Sui Bridge宣布在测试网上线。作为一种原生协议,Sui Bridge能够在Ethereum和Sui之间轻松且安全地转移ETH、wBTC、USDC和USDT,使其成为Sui基础设施…

法考报名必看,99%高过审率证件照片电子版制作技巧

在2024年,法考备战已经如火如荼进行中,作为进入法律行业的第一步,参加法考的重要性不言而喻。而作为报名过程中必不可少的一环,报名照片要求以及证件照制作技巧更是需要我们特别重视的部分。想要在这个过程中顺利通过审核&#xf…

windows 下 docker 入门

这里只是具体过程,有不清楚的欢迎随时讨论 1、安装docker ,除了下一步,好像也没有其他操作了 2、安装好docker后,默认是运行在linux 下的,这时我们需要切换到windows 环境下, 操作:在右下角d…

docker拉取镜像失败超时的解决方法,docker配置国内镜像源

更换国内源 创建或修改 /etc/docker/daemon.json 文件 安装docker后一般只有 /etc/docker 这个目录 下面并没有 daemon.json 文件 我们直接创建 : vim /etc/docker/daemon.json {"registry-mirrors" : ["https://registry.docker-cn.com"…

jfif格式怎么转换成jpg?关于将jfif转成jpg的几种方法

jfif格式怎么转换成jpg?JFIF格式是一种常见的图像文件格式,通常用于存储数字照片。然而,在某些情况下,你可能需要将JFIF格式转换为JPG格式。JPG格式是一种广泛使用的图像格式,它被支持和接受的程度比JFIF更高。PNG是一…

长沙干洗服务,打造您的专属衣橱

长沙干洗服务,用心呵护您的每一件衣物!致力于为您打造专属的衣橱,让您的每一件衣物都焕发出独特的魅力。 我们深知每一件衣物都承载着您的故事和情感,因此我们会以更加细心的态度对待每一件衣物。无论是您心爱的牛仔裤&#xff0c…

虚拟化 之三 详解 jailhouse(ARM 平台)的构建过程、配置及使用

嵌入式平台下,由于资源的限制,通常不具备通用性的 Linux 发行版,各大主流厂商都会提供自己的 Linux 发行版。这个发行版通常是基于某个 Linux 发行版构建系统来构建的,而不是全部手动构建,目前主流的 Linux 发行版构建系统是 Linux 基金会开发的 Yocto 构建系统。 基本环…

Python基础教程(十六):正则表达式

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 💝&#x1f49…

企业多云策略的优势与实施指南

企业在选择云服务提供商时,常见的选项包括亚马逊AWS、微软Azure、谷歌云GCP、阿里云、腾讯云和华为云。为了避免过度依赖单一供应商,许多企业选择采用多云策略,这样可以充分利用不同云服务的优势,同时避免重复工作和其他额外的工作…

16个不为人知的资源网站,强烈建议收藏!

整理了16个不为人知的资源网站,涵盖了课程学习、办公技能、娱乐休闲、小说音乐等多种资源,强烈建议收藏! #学习网站 1、中国大学MOOC icourse163.org/ 这是一个汇集了国内顶尖大学免费课程资源的平台,众多985工程院校如北京大…

现代易货模式:重塑物品价值,引领交换新潮流

在日益繁荣的现代社会,物品交换文化正逐渐兴起,一种新型的交易模式——现代易货模式,正在成为市场的新宠。它不仅是对传统“以物易物”模式的现代化演绎,更是对物品价值再认识和交换方式创新的体现。 现代易货模式,简言…

人工智能入门学习教程分享

目录 1.首先安装python,官网地址:Download Python | Python.org,进入网址,点击Windows链接 2.下载完成之后,进行傻瓜式安装,如果不选安装路径,默认会安装到C:\Users\Administrator\AppData\Loc…

找不到xinput1_3.dll文件要怎么修复?有哪些有效修复xinput1_3.dll文件的方法

要解决xinput1_3.dll文件缺失的问题,首先我们需要对这个文件有所了解。理解了这个文件的性质和作用后,才能更科学、有效地解决因其丢失而导致的问题。那么接下来,让我们不浪费时间,直接深入研究如何修复xinput1_3.dll文件的最佳方…

三、网络服务协议

目录 一、FTP:文件传输协议 二、Telnet:远程登录协议 三、AAA认证 四、DHCP 五、DNS 六、PPP协议 七、ISIS协议 一、FTP:文件传输协议 C/S架构,现多用于企业内部的资料共享和网络设备的文件传输,企业内部搭建一…

pdf书签怎么做?这三款软件轻松驾驭文档!

在数字化时代,PDF文件已成为我们工作、学习中的重要组成部分。然而,面对海量的PDF内容,如何快速定位关键信息,提高阅读效率呢?答案就是——制作PDF书签。今天,我将为大家介绍三款实用的软件,助你…

人脸匹配——OpenCV

人脸匹配 导入所需的库加载dlib的人脸识别模型和面部检测器读取图片并转换为灰度图比较两张人脸选择图片并显示结果比较图片创建GUI界面运行GUI主循环运行显示全部代码 导入所需的库 cv2:OpenCV库,用于图像处理。 dlib:一个机器学习库&#x…

opencv-python(八)

import cv2 import numpy as npheight 160 width 280 image np.zeros((height, width),np.uint8) cv2.imshow(image,image) cv2.waitKeyEx(0) cv2.destroyAllWindows() 二维数组代表一幅灰度图像。 import cv2 import numpy as npheight 160 width 280 image np.zeros((he…