Datawhale 202301 设计模式 | 第二章 人工智能 现代方法 智能体

news2024/12/29 10:30:11

智能体和环境

理性智能体 (rational agent) 需要为取得最佳结果或在存在不确定性时取得最佳期望结果而采取行动。

任何通过传感器(sensor) 感知 环境(environment) 并通过 执行器(actuator) 作用于该环境 的事物都可以被视为 智能体(agent)

智能体通过传感器和执行器与环境交互

行为

理性智能体 (rational agent)是做正确事情的事物,人工智能通常坚持一种称为 结果主义 (consequentialism)的概念:我们通过结果来评估智能体的行为。

作为一般规则,更好的做法是根据一个人在环境中真正想要 实现的目标 ,而不是根据一个人认为智能体应该如何表现来设计性能度量。

全知、学习和自主:

  • 全知:全知的智能体能预知其行动的实际结果, 并能据此采取行动;
  • 学习:理性智能体不仅要收集信息,还要尽可能多地从它所感知到的东西中学习 (learn)。
  • 自主:如果在某种程度上,智能体依赖于其设计者的先验知识,而不是其自身的感知和学习过 程,我们就说该智能体缺乏自主性(autonomy)。

环境

任务环境 (task environment),本质上是“问题”,理性智能体 是“解决方案”。

PEAS (Performance,Environment,Actuator,Sensor),详细地讨论每个元素:性能度量、环境、执行器、传感器;
自动驾驶出租车司机任务环境的 PEAS 描述
智能体类型及其 PEAS 描述的示例

任务环境的属性:

  • 完全可观测的(fully observable)、部分可观测的(partially observable)、不可观测的(unobservable);
  • 单智能体的(single-agent)与多智能体的(multiagent);
  • 竞争性(competitive)与合作 的(cooperative);
  • 确定性的(deterministic)、非确定性的(nondeterministic)、随机的(stochastic);
  • 回合式的(episodic)与序贯的(sequential);
  • 静态的(static)、动态的(dynamic)、半动态的(semidynamic);
  • 离散的(discrete)与连续的(continuous);
  • 已知的(known)与未知的(unknown);

智能体的结构

人工智能的工作是设计一个 智能体程序 (agent program)实现智能体函数,即从感知到动作的映射。

假设该程序将运行在某种 具有物理传感器和执行器的计算设备上,我们称之为 智能体架构 (agent architecture):智能体 = 架构 + 程序

  • 简单反射型智能体 (simple reflex agent):智能体根据当前感知选择动作, 忽略感知历史的其余部分。

  • 基于模型的反射型智能体 :处理部分可观测性的最有效方法是让智能体追踪它现在观测不到的部分世界, 智能体应该维护某种依赖于感知历史的内部状态(internal state),从而至少反映当前状态的一 些未观测到的方面。(其中包含概念:世界的转移模型(transition model)、传感器模型(sensor model)、基于模型的智能体(model-based agent))

  • 智能体的效用函数 (utility function)本质 上是性能度量的内部化。内部效用函数和外部性能度量一致,那么根据外部性能度量选择 动作,以使其效用最大化的智能体是理性的。

  • 学习型智能体 ,学习型智能体可分为 4 个概念组件:区别在于负责提升的学习元素(learning element)和负责选择外部行动的性能元素(performance element)。

智能体组件间的工作方式:

  • 原子表示(atomic representation):将变量拆解为单一的知识原子。搜索和博弈中的标准算法、隐马尔可夫模型以及马尔可夫决策过程都基于原子表示;
  • 因子化表示(factored representation):每个状态拆分为一组固定的变量或属性,每个变量或属性都可以有一个值。约束满足算法、命题逻辑、规划、贝叶斯网络以及各种机器学习算法。
  • 结构化表示(structured representation):可以明确地描述对象及其各种不同的关系。关系数据库和一阶逻辑、一阶概率模型和大部分自然语言理解的基础。

表示状态及其之间转移的 3 种方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/174988.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux常用命令——systemctl命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) systemctl 系统服务管理器指令 补充说明 systemctl命令是系统服务管理器指令,它实际上将 service 和 chkconfig 这两个命令组合到一起。 任务旧指令新指令使某服务自动启动chkconfig --level 3 ht…

属性值的计算过程 css样式显示的计算过程 页面的渲染流程

目录属性值的计算过程属性值计算过程简介通过例子来理解:详细解释:方法例子属性值的计算过程 一个元素一个元素依次渲染,顺序按照页面文档的树形目录结构进行 渲染每个元素的前提条件:该元素的所有CSS属性必须有值 一个元素&am…

数学魔法结局:muldiv

介绍了一些棘手的数学魔法,但我一直没有抽出时间说出妙语。目标是计算 同时正确处理溢出。我们的秘密武器是 EVM 的mulmod指令。这条指令完全符合我们的要求,只是它返回的是余数而不是商。那么我们的策略是什么? 计算 512 位乘积一种⋅b使用…

【数据结构】6.5 图的遍历

文章目录遍历定义深度优先搜索(DFS)算法步骤邻接矩阵上的遍历邻接矩阵深度优先算法DFS算法效率分析广度优先搜索(BFS)邻接表的广度优先算法BFS算法效率分析DFS与BFS算法效率比较遍历定义 和树的遍历类似,图的遍历也是从图中的某一个顶点出发,按照某种方法…

UPS BP650CH实现nas自动关机

家里有个自己拼凑的nas需要防止断电不正常关机,因此购买了施耐德后背式BP650CH,之所以选这款是因为带了串口,串口终究还是很方便的东西。不管linux还是window还是其他系统都能够使用,通过串口直接获得ups的信息,就不需…

JDBC Maven MyBatis

文章目录JDBC(Java Database Connectivity)入门API详解DriverManger(驱动管理类)Connection(数据库连接对象)作用StatementResultSet(结果集对象)PreparedStatement连接池MavenMaven模型Maven 常用命令依赖…

简单二叉树的介绍

1.树的结构(了解)1.1概念树是一种非线性的数据结构,它是由n(n>0)个有限节点总成一个具有层次关系的集合。把它叫做树是因为它看起来像一颗倒挂的树,也就是说它的根是朝上,而叶子是朝下的(本人…

工作玩手机识别监测系统 YOLOv5

工作玩手机识别监测系统通过YOLOV5网络深度学习算法模型对画面中人员玩手机行为进行实时监测,当识别到有人在玩手机行为时,无需人为干预立即抓拍存档触发告警。YOLO算法- YOLO算法是一种基于回归的算法,它不是选择图像中有趣的部分&#xff0…

WT588D语音芯片介绍

WT588D语音芯片简介WT588D 语音芯片是一款功能强大的可重复擦除烧写的语音单片机芯片。WT588D 让语音芯片不再为控制方式而寻找合适的外围单片机电路,高度集成的单片机技术足于取代复杂的外围控制电路。配套WT588DVoiceChip 上位机操作软件可随意更换WT588D 语音单片…

基于 docker 搭建 mysql5.7 主从复制

安装 docker 的教程可以看我的另一篇文章,拉取 mysql 镜像的步骤也在里面,在这不再重复:https://blog.csdn.net/wanzijy/article/details/128695674 1. 主机搭建 因为本人虚拟机中已经存在了 mysql ,所以在使用镜像创建容器的时…

【论文翻译】End-to-End Human Pose and Mesh Reconstruction with Transformers

【cvpr论文】End-to-End Human Pose and Mesh Reconstruction with Transformers (thecvf.com) 【github】microsoft/MeshTransformer: Research code for CVPR 2021 paper "End-to-End Human Pose and Mesh Reconstruction with Transformers" (github.com) 摘要 我…

学习笔记:Java 并发编程③

若文章内容或图片失效,请留言反馈。 部分素材来自网络,若不小心影响到您的利益,请联系博主删除。 视频链接:https://www.bilibili.com/video/av81461839配套资料:https://pan.baidu.com/s/1lSDty6-hzCWTXFYuqThRPw&am…

在甲骨文云容器实例(Container Instances)上部署Ubuntu Desktop

甲骨文云推出了容器实例,这是一项无服务器计算服务,可以即时运行容器,而无需管理任何服务器。 今天我们尝试一下通过容器实例部署Ubuntu Bionic Desktop。 创建容器实例 在甲骨文容器实例页面,单击"创建容器实例"&…

Java 笔试题

Java 笔试题目录概述需求:设计思路实现思路分析1.java 面试题参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wait for change,challenge Surviv…

分享151个PHP源码,总有一款适合您

PHP源码 分享151个PHP源码,总有一款适合您 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下..., 151个PHP源码下载链接:https://pan.baidu.com/s/1T_Hs4j0t39b-Y8UWHmAKyw?pwd7ao0 提取码&#…

论文浅尝 | DB4Trans:数据库内置知识图谱嵌入模型训练引擎

笔记整理:柳鹏凯,天津大学硕士发表期刊:计算机学报 第45卷Vol.45, 第9期 No.9链接:http://cjc.ict.ac.cn/online/onlinepaper/lpk-202297212908.pdf动机知识图谱嵌入技术主要将知识图谱中的实体和关系嵌入到连续的向量空间中&…

Centos Java1.8+Nginx+redis+pgsql 手工配置

一、系统升级,安装系统常用工具及配置 1.1 升级软件及Centos 内核 yum update -y yum clean all cat /etc/redhat-release 1.2 安装虚拟机守护进程 yum install qemu-guest-agent -y 1.3 安装系统常用工具包 yum install lrzsz vim wget dnf -y 1.4关…

2023牛客寒假算法基础集训营3 -- E-勉强拼凑的记忆(贪心 + 二分)

题目如下: 题解 or 思路: 我们可以发现:除了 n2n 2n2 无解, 其他情况答案至少为 n12\frac{n 1}{2}2n1​ 答案在 n12\frac{n 1}{2}2n1​ 到 nnn 之间 我们可以假设 答案为 ansansans 最优摆放为: 所以可以二分去求…

软件工程 黄金点游戏

这个故事最初出现在 《移山之道》中,我经常拿来做和创新的时机相关课堂练习和讨论,效果很好。我把这个练习和它的一些延伸话题都搬到这个新博客里。 黄金点游戏 N个同学(N通常大于10),每人写一个 0~100之间的有理数 …

1、认识IntelliJ IDEA

文章目录1、认识IntelliJ IDEA1.1 JetBrains公司介绍1.2 IntelliJ IDEA介绍1.3 IDEA的主要优势(对比Eclipse)1.3.1 功能强大1.3.2 符合人体工程学1.4 IDEA的下载【尚硅谷】idea实战教程-讲师:宋红康 生活是属于每个人自己的感受,不…