行为树保姆级教程(以机器人的任务规划为例

news2024/9/23 11:23:42

行为树

目录

  • 什么是行为树(behavior tree)?
  • 行为树的相关术语
    • 行为节点和控制节点
    • 不同类型的控制结点:
      • 顺序节点
      • 选择节点
      • 并行节点
      • 装饰结点
  • 机器人的例子:物体搜索
    • 1:如果只存在一个地点A,那么行为树很简单,到A处,找到物体。如下图所示:
    • 2:接下来我们使用一个条件结点,用来判断机器人是否找到了物体(具体实现可以通过相机拍摄照片,然后进行图像识别)。
    • 3:我们的机器人工作的环境可能包含了多个地点,我们期望它可以尝试到所有已知的地点搜寻物体,在搜寻到物体后结束搜索。这可以通过添加一个选择结点作为根节点来实现,如下图所示:
    • 4:如果我们期望机器人可以同时搜寻多个不同的物体(比如苹果和橘子),可以通过添加并行结点实现。
  • 装饰器(decorator)和黑板(blackboard)
  • 行为树和有限状态机的比较
    • 1:以机器人捡起一个物体的任务为例,这需要机器人先移动到物体附近,然后夹起物体,最后再移动回机器人原来所处的位置。我们分别用行为树和状态机实现它们,如下图所示:
    • 2:如果我们想要进一步修改行为,比如检测夹子是否处于可以抓起物体的位置,然后再夹紧夹子。对于行为树,我们只需要插入一个子树就能完成期望的修改。但对于状态机,我们需要重写多个转换操作。也就是说行为树更便于进行组合(modularity)和模块化。下图给出了修改后的行为树和状态机图示:
    • 3:对于反应式行为,比如机器人低电量时需要马上回到电源处,即使它还在执行某个任务的过程中。如果使用行为树来实现,这会非常麻烦,我们需要在任意任务的子树中支持充电行为。但对于状态机来说,实现起来就很简单,只需要从所有其它动作连线到充电动作即可。
    • 状态机和行为树联合使用

参考原文:https://robohub.org/introduction-to-behavior-trees/

参考翻译:https://zhuanlan.zhihu.com/p/463182588

什么是行为树(behavior tree)?

行为树(behavior tree)是用来实现非人工角色复杂行为的工具,它具有下面这些特征:

  1. 行为树是树: 执行时从根结点开始按照指定的顺序遍历,直到到达终结状态
  2. **叶子结点都是可执行的行为:**叶子结点会进行具体的操作,可以是一个简单的检测操作,也可以是一个更复杂的操作,结点会返回状态信息(成功,失败,运行中)。
  3. 内部结点控制树的遍历:内部结点会根据孩子结点返回的状态信息,按照特定的规则确定下一个执行的结点。

在这里插入图片描述

行为树的相关术语

行为节点和控制节点

下图给出了行为树的不同结点类型及其对应的图示:

  1. tick:行为树从根节点开始按照预定义的顺序遍历各个节点并执行他们的行为的过程称为一次tick,会返回成功(success)失败(failure)运行中(running) 的状态信息给它的父结点。
  2. 行为结点(execution node):行为树的叶子结点,可以是动作结点(action node)或条件结点(condition node)。对于条件结点(condition node)会在一次tick后立马返回成功或失败的状态信息。对于动作结点(action node)则可以跨越多个tick执行,直到到达它的终结状态。一般来说,条件结点用于简单的判断(比如钳子是否打开?),动作结点用于表示复杂的行为(比如打开房门)。
  3. 控制结点(control node):控制结点是行为树的内部结点,它们定义了遍历其孩子结点的方式。控制结点的孩子可以是行为结点,也可以是控制结点顺序(Sequence)备选(Fallback)并行(Parallel)这3种类型的控制结点可以有任意数量的孩子结点,它们的区别在于对其孩子结点的处理方式。而装饰(Decorator)结点只能有一个孩子结点,用来对孩子结点的行为进行自定义修改。

不同类型的控制结点:

顺序节点

按顺序执行孩子结点直到其中一个孩子结点返回失败状态或所有孩子结点返回成功状态。

在这里插入图片描述

选择节点

按顺序执行孩子结点直到其中一个孩子结点返回成功状态或所有孩子结点返回失败状态。一般用来实现角色的选择行为。

并行节点

“并行执行”所有孩子结点。直到至少M个孩子(M的值在1到N之间)结点返回成功状态或所有孩子结点返回失败状态。

在这里插入图片描述

装饰结点

装饰结点:以自定义的方式修改孩子结点的行为。比如Invert类型的装饰结点,可以反转其孩子结点返回的状态信息。为了方便他人理解,应该尽可能使用比较常见的装饰结点。

机器人的例子:物体搜索

接下来我们通过一个机器人搜索物体的例子来理解行为树的执行过程。

在这里插入图片描述

1:如果只存在一个地点A,那么行为树很简单,到A处,找到物体。如下图所示:

上图中我们使用了一控制结点表示到A处这一动作。在机器人还没有移动到A处前,这一动作结点会返回运行中(running)状态。

2:接下来我们使用一个条件结点,用来判断机器人是否找到了物体(具体实现可以通过相机拍摄照片,然后进行图像识别)。

行为树的一个很常用的设计规则就是使用显式成功条件(explicit success condition)。简单来说,就是在执行动作前总是先进行条件检测。比如,先检测机器人是否已经在A处,如果在就不执行去A处的动作,直接返回成功状态。如下图所示:

3:我们的机器人工作的环境可能包含了多个地点,我们期望它可以尝试到所有已知的地点搜寻物体,在搜寻到物体后结束搜索。这可以通过添加一个选择结点作为根节点来实现,如下图所示:

在这里插入图片描述

我们可以使用选择结点(fallback node)定义角色的反应行为。当一种反应行为无法工作后,自动尝试下一种。

4:如果我们期望机器人可以同时搜寻多个不同的物体(比如苹果和橘子),可以通过添加并行结点实现。

下图给出了在多个地点,同时搜寻苹果和橘子的行为树图示:

我们可以使用并行结点组合多个动作,比如:让机器人原地打转直到连续5个tick识别到一个人为止。

装饰器(decorator)和黑板(blackboard)

📌装饰器(decorator)

我们可以使用装饰器结点(decorator node)来对行为树进行优化。考虑上面的在多个地点搜寻物体的行为树,如果地点数目达到20个以上,整个行为树看上去就会变得非常庞大,也为我们进一步添加新的结点带来麻烦。

下面是避免这些麻烦的常用方法:

  • 引入装饰器结点(decorator node) 相较于每增加一个搜寻地点就复制一份完全相同的子树,我们可以定义一个规则为Repeat的装饰器结点,用来重复执行它的孩子结点,完成搜寻多个地点。
  • 在每一次迭代更新目标位置**:** 使用一个队列存储所有待搜寻地点,每次迭代从队列中取出一个地点进行搜寻,当队列为空时,所有地点都被搜寻完毕。

📌黑板(blackboard)

为了存储可以被多个结点访问的共享信息(比如上面提到的存储有所有待搜寻地点的队列),我们引入黑板(blackboard)的概念。黑板是一块可以被结点读写的公共存储区。

针对我们的例子,我们为行为树添加一个Repeat装饰器结点和一个GetLoc的动作结点,用来在每一次迭代读取新的搜寻地址,如下图所示:

我们也可以利用黑板(blackboard)实现其它一些任务。比如:在找到苹果或橘子后在黑板上记录下它们的位置信息,然后在添加的Speak动作结点中读取它们,让机器人说出在哪里找到了苹果或橘子。还有对于找到的物体不同,后续结点可以根据黑板记录的信息采取不同的处理规则。

行为树和有限状态机的比较

读者可能想了解行为树和有限状态机哪个更好。下面这些观点可以供大家参考:

  • 理论上,行为树和状态机具有相同的表达能力,可以实现相同的功能。
  • 行为树更好还是状态机更好主要看所要定义的行为是更偏向模块化,还是更偏向反应式。一般来说,行为树更方便进行组合和修改,状态机更方便进行反应式动作设计。
1:以机器人捡起一个物体的任务为例,这需要机器人先移动到物体附近,然后夹起物体,最后再移动回机器人原来所处的位置。我们分别用行为树和状态机实现它们,如下图所示:

在这里插入图片描述

​ 左侧为行为树实现,右侧为状态机实现

2:如果我们想要进一步修改行为,比如检测夹子是否处于可以抓起物体的位置,然后再夹紧夹子。对于行为树,我们只需要插入一个子树就能完成期望的修改。但对于状态机,我们需要重写多个转换操作。也就是说行为树更便于进行组合(modularity)和模块化。下图给出了修改后的行为树和状态机图示:

在这里插入图片描述

修改后的行为树和状态机

3:对于反应式行为,比如机器人低电量时需要马上回到电源处,即使它还在执行某个任务的过程中。如果使用行为树来实现,这会非常麻烦,我们需要在任意任务的子树中支持充电行为。但对于状态机来说,实现起来就很简单,只需要从所有其它动作连线到充电动作即可。

在这里插入图片描述

​ 有限状态机可以在任意两个结点添加转换方便地实现反应式行为​

更进一步,通过对状态分层(也就是层次状态机,HFSM),建立超级状态Nominal,我们可以简化状态间的转换实现

状态机和行为树联合使用

行为树更好还是状态机更好需要看具体要解决的问题,个人认为有限状态机更方便管理高优先级的操作行为(比如机器人处于正常状态还是充电状态),行为树更适合定义复杂的行为,比如处理错误恢复等等。实践中,混合使用两者可能会是更好的选择。下图给出了混合使用行为树和状态机定义我们例子中的机器人行为的图示:

​ 高优先级行为使用状态机,复杂行为使用行为树实现​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1311333.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实验:BGP配置

1.实验目的: 本实验旨在掌握BGP协议的基本概念和配置方法,以及使用Packet Tracer模拟网络环境进行BGP配置的方法。 2.实验要求: 理解BGP协议的基本概念和原理;掌握BGP协议的配置方法;能够使用Packet Tracer模拟网络…

MyBatisPlus使用时报错Invalid value type for attribute ‘factoryBeanObjectType‘

目录 问题 探索过程 总结 问题 今天在学习MyBatisPlus过程中突然报了个错,信息如下 Invalid value type for attribute factoryBeanObjectType: java.lang.String Caused by: java.lang.IllegalArgumentException: Invalid value type for attribute factoryB…

json Deserialization of Python Objects

openweathermap.json {"coord": {"lon": 114.0683, "lat":22.5455},"weather":[ {"id": 803, "main":"Clouds", "description":"多云", "icon":"04d"}],"…

MacOS多屏状态栏位置不固定,程序坞不小心跑到副屏

目录 方式一:通过系统设置方式二:鼠标切换 MacOS多屏状态栏位置不固定,程序坞不小心跑到副屏 方式一:通过系统设置 先切换到左边 再切换到底部 就能回到主屏了 方式二:鼠标切换 我的两个屏幕放置位置如下 鼠标在…

R语言【rgbif】——什么是多值传参?如何在rgbif中一次性传递多个值?多值传参时的要求有哪些?

rgbif版本:3.7.8.1 什么是多值传参? 您是否在使用rgbif时设想过,给某个参数一次性传递许多个值,它将根据这些值独立地进行请求,各自返回独立的结果。 rgbif支持这种工作模式,但是具体的细节需要进一步地…

蓝牙物联网智慧物业解决方案

蓝牙物联网智慧物业解决方案是一种利用蓝牙技术来提高物业管理和服务效率的解决方案。它通过将蓝牙技术与其他智能设备、应用程序和云服务相结合,为物业管理和服务提供更便捷、高效和智能化的支持。 蓝牙物联网智慧物业解决方案包括: 1、设备管理&#…

Crypto基础之密码学

FLAG:20岁的年纪不该困在爱与不爱里,对吗 专研方向: 密码学,Crypto 每日emo:今年你失去了什么? Crypto基础之密码学 前言一、编码Base编码base64:Base32 和 Base16:uuencode:xxencod…

计算机网络——网络层——OSPF协议的介绍

什么是 OSPF ? OSPF 是一个基于链路状态的自治系统内部路由协议,在 TCP/IP 的网络层中进行路由选择,常用于构建大型企业网络或者服务上的骨干网络。在互联网核心路由器之间也可以使用。 OSPF 概述 OSPF 使用的是 Dijkstra(最短…

智能优化算法应用:基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.黏菌算法4.实验参数设定5.算法结果6.参考文献7.MA…

记录 | mac打开终端时报错:login: /opt/homebrew/bin/zsh: No such file or directory [进程已完成]

mac打开终端时报错:login: /opt/homebrew/bin/zsh: No such file or directory [进程已完成],导致终端没有办法使用的情况 说明 zsh 没有安装或者是安装路径不对 可以看看 /bin 下有没有 zsh,若没有,肯定是有 bash 那就把终端默…

QT- QT-lximagerEidtor图片编辑器

QT- QT-lximagerEidtor图片编辑器 一、演示效果二、关键程序三、下载链接 功能如下: 1、缩放、旋转、翻转和调整图像大小 2、幻灯片 3、缩略图栏(左、上或下);不同的缩略图大小 4、Exif数据栏 5、内联图像重命名 6、自定义快捷方式…

JS加密/解密之JSX解密解析(photoshop插件)

简介 Adobe Photoshop 插件通常使用 JSX(JavaScript XML)脚本语言。这是一种基于JavaScript的扩展,专门设计用于处理Adobe Creative Suite(包括Photoshop)的任务。JSX脚本允许开发者编写自定义脚本以扩展和增强Photos…

【Eureka】自定义元数据消失原因?

【Eureka】自定义元数据运行很长一段时间后,自定义元数据(scheduler.server.enabled)偶尔会消失,但服务元数据信息还在 eureka是单节点的,这个应用服务也是单节点的 代码实现方式如下 我看过eureka服务的日志信息&…

在做题中学习(33):只出现一次的数字 II

137. 只出现一次的数字 II - 力扣(LeetCode) 思路: 1.首先想到出现三次的数,它们仨的任意一位都是相同的(1/0) 2.可以发现出现三次的数的某一位和a某一位在所有情况下%3最后的结果都和a的那一位相同&…

06.迪米特法则(Demeter Principle)

明 嘉靖四十年 江南织造总局 小黄门唯唯诺诺的听完了镇守太监杨金水的训斥,赶忙回答:“知道了,干爹!” “知道什么?!!” 杨金水打断了他的话,眼神突然变得凌厉起来: “有…

企业计算机服务器中了halo勒索病毒如何解密,halo勒索病毒恢复流程

网络技术的不断发展与应用,为企业的生产运营提供了极大便利,越来越多的企业使用数据库存储企业的重要数据,方便工作与生产,但网络是一把双刃剑,网络安全威胁一直存在,并且网络威胁的手段也在不断升级。在本…

我的隐私计算学习——匿踪查询

笔记内容来自多本书籍、学术资料、白皮书及ChatGPT等工具,经由自己阅读后整理而成。 (一)PIR的介绍 ​ 匿踪查询,即隐私信息检索(Private InformationRetrieval,PIR),是安全多方计算…

C# OpenVINO 直接读取百度模型实现印章检测

目录 效果 模型信息 项目 代码 下载 其他 C# OpenVINO 直接读取百度模型实现印章检测 效果 模型信息 Inputs ------------------------- name:scale_factor tensor:F32[?, 2] name:image tensor:F32[?, 3, 608, 608] …

Windows更改远程桌面端口并添加防火墙入站规则

1.运行 快捷键winR组合键,win就是键盘上的windows系统图标键。 2.打开注册表 Regedit,在对话框中输入regedit命令,然后回车 3.打开注册表,输入命令后,会打开系统的注册表,左边是目录栏,右边是…

基于STM32的智能小区环境监测

一、概述 本系统应用STM32F407VET6单片机为控制处理器,加上外设备组成单片机最小系统。配以输入输出部分,通过采集温湿度、甲醛、PM2.5等数据在LCD液晶上显示,内加单独时钟晶振电路,保护断电后时间参数不变,外接5v电源…