【人工智能】— 学习与机器学习、无/有监督学习、强化学习、学习表示

news2024/11/27 14:36:57

【人工智能】— 学习与机器学习、无/有监督学习、强化学习、学习表示

  • 上一章
  • Bayesian Networks
  • 本章:观测学习
  • 学习
  • 学习元素
  • 机器学习概论
    • 机器学习对什么有用
    • 自动语音识别
    • 计算机视觉
    • Information retrieval—信息检索
  • 机器学习
    • 机器学习:定义
  • 电子邮件过滤问题
  • 学习类型
    • 监督学习
    • 无监督学习
    • 半监督学习
    • 强化学习
  • 在机器学习中表示“对象”
  • 特征向量表示
  • 关键要素

上一章

Bayesian Networks

贝叶斯网络提供了一个自然的表示方式,用于描述(因果引起的)条件独立性。

  • 拓扑结构 + 条件概率表 = 联合分布的紧凑表示。
  • 通常易于领域专家构建。
  • 通过变量消除进行精确推断:
    • 在有向无环图上的时间复杂度是多项式级别的,但在一般图上为 NP-hard。
    • 空间复杂度与时间复杂度相同,非常敏感于拓扑结构。
  • Naive Bayes 模型是一种特殊的贝叶斯网络。

本章:观测学习

观测学习是机器学习的一种方法,其目标是从数据中推断出未知的模型或概率分布。观测学习通常包括数据收集、选择假设空间、使用学习算法选择最优模型、评估和调整等步骤。它可以应用于多种任务,包括分类、回归、聚类、降维和异常检测等。观测学习的优点是可以自动学习模型,无需手动指定模型的形式或参数。常见的观测学习算法包括决策树、神经网络、支持向量机、朴素贝叶斯、最大熵模型和隐马尔可夫模型等。

学习

学习在人工智能和机器学习中扮演着重要的角色,它允许智能体从经验中提取知识和信息,并将其应用于新的任务和环境中。学习可以分为有监督学习、无监督学习和强化学习等不同类型,每种类型都有其独特的应用和算法。学习的重要性在于它可以使智能体适应不断变化的环境和任务,而不需要重新编写程序或重新设计系统。尽管学习有很多优点,但也存在一些挑战和限制,例如需要大量的数据和计算资源来训练模型,需要考虑数据偏差和过拟合等问题,还需要平衡探索和利用等问题。

学习元素

设计学习元素受以下因素的影响:

  • 需要学习哪些性能元素的组成部分。
  • 可用于学习这些组成部分的反馈信息是什么。
  • 用于这些组成部分的表示方法是什么。

学习元素是机器学习系统的核心组成部分,包括算法、模型和数据等组成部分。学习元素的目的是让智能体能够从经验中学习知识和信息,以优化其性能和决策。学习元素的设计需要考虑到任务和环境,并根据具体情况进行调整和优化。反馈信息、算法和模型的选择、以及表示方法也是学习元素设计的重要因素。

机器学习概论

机器学习对什么有用

自动语音识别

现在,大多数语音识别器或翻译器都能学习——你使用它们越多,它们就越聪明

计算机视觉

例如物体、人脸和笔迹识别
在这里插入图片描述

Information retrieval—信息检索

阅读、消化和分类庞大的文本数据库对人类的网页检索来说太多了
(检索) 分类(分类) 聚类(聚类) 页面之间的关系在这里插入图片描述

机器学习

机器学习是一个交叉学科的领域,涵盖了数学、计算机科学、工程学、统计学、认知科学、心理学、计算神经科学、经济学等领域。

其目的是通过利用数据来训练模型或算法,以便能够自动化地完成某些任务,并且能够从经验中不断改进自身的性能。

机器学习涉及的模型和算法包括线性回归、逻辑回归、决策树、支持向量机、神经网络、贝叶斯网络、隐马尔可夫模型、聚类、降维等。通过学习机器学习,可以掌握一些重要的概念、技术和工具,为今后的学习和实践打下基础。

机器学习:定义

Tom Mitchell(1998)提出了机器学习的定义:如果一个计算机程序在某个任务T上的性能,通过某种性能度量P,随着经验E的增加而提高,那么它就可以说是从经验E中学习到了任务T。

这个定义强调了机器学习的本质:通过从数据中获取知识和经验,来提高计算机程序在某些任务上的性能。其中,任务T可以是各种各样的,包括分类、回归、聚类、识别等;性能度量P可以是准确率、精确率、召回率、F1值、AUC值等;经验E可以是训练数据、验证数据、测试数据等。

电子邮件过滤问题

假设您的电子邮件程序观察您标记为垃圾邮件或非垃圾邮件的邮件,并基于此学习如何更好地过滤垃圾邮件。在这种情况下,任务T是什么?

A. 将电子邮件分类为垃圾邮件或非垃圾邮件。
B. 观察您标记为垃圾邮件或非垃圾邮件的邮件。
C. 正确分类为垃圾邮件/非垃圾邮件的电子邮件数量(或比例)。
D. 以上都不是——这不是一个机器学习问题。

答案:A. 将电子邮件分类为垃圾邮件或非垃圾邮件。

学习类型

假设有一个智能体或机器,它接收到一系列的感知输入: x 1 , x 2 , x 3 , x 4 , . . . x_1, x_2, x_3, x_4, ... x1,x2,x3,x4,...

监督学习

在监督学习中,机器还会收到所需的输出 y 1 , y 2 , . . . y_1, y_2, ... y1,y2,...,其目标是在给定新输入的情况下学习生成正确的输出。这被称为监督学习。在这种类型的学习中,机器被提供带有标签的示例,目标是学习一个将输入映射到输出的函数。常见的示例包括图像分类和语音识别。

无监督学习

在无监督学习中,没有给出所需的输出 y 1 , y 2 , . . . y_1, y_2, ... y1,y2,...,但智能体仍然希望构建一个可以用于推理、决策、预测和通信等目的的 x x x 模型。目标是发现输入数据中的模式、结构和关系。示例包括聚类、降维和异常检测。

半监督学习

半监督学习是监督学习和无监督学习的结合。在这种类型的学习中,机器被提供一些带标签的示例和一些无标签的示例。目标是学习一个可以推广到新的、未见过的示例的函数。当标记数据稀缺或昂贵时,这种类型的学习非常有用。

强化学习

强化学习是一种学习类型,智能体在与环境交互并获得奖励或惩罚的形式的反馈时进行学习。目标是学习一个策略,以在复杂、动态的环境中最大化预期的累积奖励。这种类型的学习在机器人、游戏和其他需要学习在复杂、动态环境中做出决策的应用程序中使用。

在机器学习中表示“对象”

  • 一个例子或实例 x x x 代表一个特定的对象
  • 通常用一个 d d d 维特征向量 x = ( x 1 , . . . , x d ) ∈ R d x = (x_1, . . . , x_d) \in \mathbb{R}^d x=(x1,...,xd)Rd 表示 x x x
  • 每个维度称为特征或属性
  • 特征可以是连续或离散的
  • x x x 是特征空间中的一个点,维度为 d d d
  • 对象的抽象表示。忽略任何其他方面(例如,两个具有相同体重和身高的人可能被认为是相同的)

特征向量表示

  • 对于文本文档:

    • 词汇表的大小为 d d d (大约100,000个词)
    • “词袋模型”:计算每个词汇项的出现次数
    • 通常会删除停用词:the、of、at、in等
    • 特殊的“未知词汇”(OOV)条目可以捕获所有未知词汇
  • 对于图像:

    • 像素、颜色直方图等
    • 通过卷积进行特征提取
  • 对于软件:

    • 执行概况:每行代码执行的次数
  • 对于银行账户:

    • 信用评级、余额、最近一天、一周、一个月、一年的存款次数、取款次数等
  • 对于你和我:

    • 医学检测1、检测2、检测3等

关键要素

  • 数据
    数据集 D D D 包含 N N N 个数据点:
    D = { x 1 , x 2 , . . . , x N } D = \{x_1, x_2, ..., x_N\} D={x1,x2,...,xN}

  • 预测
    我们通常希望基于观察到的数据集进行预测。
    给定 D D D,我们能否预测 x N + 1 x_{N+1} xN+1

  • 模型
    为了进行预测,我们需要做一些假设。我们通常可以用模型的形式来表达这些假设,其中包含一些参数。
    给定数据 D D D,我们从中学习模型参数 θ \theta θ,从而可以预测新的数据点。在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/607916.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全志V3S嵌入式驱动开发(gpio输出)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 不管是对mcu,还是对soc来说,gpio肯定是越多越好。但是一个芯片上,它的引脚总是有限的,特别对于非BG…

修改邻接变量-0day漏洞利用原理(6)

大多数情况下,局部变量在栈中的分布是相邻的,但也有可能出于编译优化等需要而有所例外。具体情况我们需要在动态调试中具体对待,这里出于讲述基本原理的目的,可以暂时认为局部变量在栈中是紧挨在一起的。 提供理论基础 下一篇利用:非法的超长密码去修改 bufer 的邻接变量…

支持向量机练习

练习5:支持向量机 介绍 在本练习中,我们将使用支持向量机(SVM)来构建垃圾邮件分类器。 在开始练习前,需要下载如下的文件进行数据上传: data.tgz -包含本练习中所需要用的数据文件 其中: e…

2. 卷积的经典模型

一、什么是卷积神经网络 卷积神经网络就是含有卷积层的网络。 二、有哪些经典的模型?每一次的技术进步在哪里? 卷积神经网络(LeNet) LeNet第一次将卷积神经网络推上舞台,通过梯度下降训练卷积神经网络可以达到手写数字…

chatgpt赋能python:Python中取出中间文本的方法

Python中取出中间文本的方法 在Python开发中,我们常常需要从字符串中取出特定位置的文本,例如从一个网页源码中提取出指定的内容。而且,一份好的代码需要清晰易懂、高效可靠。那么,在Python中如何取出中间文本呢?下面…

超详细Redis入门教程——Redis 主从集群(下)

前言 本文小新为大家带来 Redis 主从集群 相关知识,具体内容包括哨兵机制实现(包括:哨兵机制简介,Redis 高可用集群搭建,Redis 高可用集群的启动,Sentinel 优化配置),哨兵机制原理&a…

史上最全网络安全面试题汇总

最近有不少小伙伴跑来咨询: 想找网络安全工作,应该要怎么进行技术面试准备?工作不到 2 年,想跳槽看下机会,有没有相关的面试题呢? 为了更好地帮助大家高薪就业,今天就给大家分享一份网络安全工…

vmware创建ubuntu服务器>>(使用xshell)配置连接

目录 引言服务器创建准备镜像创建服务器全过程新建虚拟机选择虚拟机硬件兼容性镜像选择服务器目录名和基础信息设置虚拟机命名和存储位置设置处理器配置内存配置网络选型下一步连续点击启动 服务器配置root用户密码设置root用户切换安装ssh服务并启动vmware-ssh配置链接 xshell…

算法(三)—— 双指针

文章目录 27 移除元素344 反转字符串(手写reverse)剑指 Offer 05 替换空格19 删除链表的倒数第N个节点面试题 02.07. 链表相交15 三数之和二、使用步骤1.引入库2.读入数据 总结 27 移除元素 题目:原地移除数组中值为val的元素 思路&#xff…

Jetson Orin Nano nvme系统备份和恢复

大家好,我是虎哥,Jeston Orin nano 8G模块,我自己也玩了一段时间,配置了很多环境后,我就在琢磨如何将系统像之前的模块一样捞取出来后,在新模块上进行恢复。过程是曲折的,结果也是曲折的&#x…

开源字节 考研集训营小程序

考研集训营的价格要比普通的班课贵很多,价格通常在上万元。考研集训营分为春季、暑期、秋季等短期集训营,还有半年和全年长期集训,为学生提供英语、数学、政治的公共课辅导和各种专业课的教学。想要了解更多的考研相关信息,获得适…

自然语言处理从入门到应用——自然语言处理的基本问题:结构预测问题

分类目录:《自然语言处理从入门到应用》总目录 与文本分类问题不同,在结构预测问题中,输出类别之间具有较强的相互关联性。例如,在词性标注任务中,一句话中不同词的词性之间往往相互影响,如副词之后往往出现…

1、mysql的安装与配置

下载安装配置 下载zip文件解压之后配置环境变量 在path后面添加mysql bin文件夹的路径:C:\Program Files (x86)\MySQL\bin 配置完环境变量后,在C:\Program Files (x86)\MySQL目录下新建一个配置文件mysql.ini,同时在bin的同级目录C:\Program …

算法的复杂度【数据结构】

1、时间复杂度 算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源,因此衡量一个算法的好坏一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要…

Jenkins安装配置

前言:Jenkins是一款CICD(持续集成与持续交付)工具。Jenkins可以帮你在写完代码后,一键完成开发过程中的一系列自动化部署的工作。 Jenkins 2.346.1 版本支持 jdk1.8 和 jdk11,最后一版支持jdk1.8的版本。 安装Jenkins前…

windows修改Pycharm的右键打开方式

title: windows中open floder as Pycharm太长了怎么修改 date: 2023-06-04 author: IoT_H2 tags: windows系统问题 categories: Markdown 问题描述: Pycharm这一栏这么长,长的我实在是很难受,事实上Jetbrains家的软件都是这个鸟模样 导…

RocketMq的单机版安装以及可视化软件的安装

一 RocketMq的单机版安装 1.1 RocketMq的上传 1.2 解压 [rootlocalhost export]# unzip rocketmq-all-4.9.6-bin-release.zip 1.3 修改配置 使用 vim 命令打开 bin/runserver.sh 文件。现将这些值修改为如下: [rootlocalhost bin]# vi runserver.sh 使用vim命令…

tinkerCAD入门操作(3):创建和操作分组对象

tinkerCAD入门操作(3):创建和操作分组对象 介绍 我们现在将探索Tinkercad的超能力 - 组合简单的形状来制作复杂的对象。 组合形状是实体建模的基本目的。这就是汽车、建筑物和宇宙飞船等有趣东西的制作方式。现在,我们要教你这个超能力。 创建复合形状…

Stable-Diffusion|window10安装GPU版本的 Stable-Diffusion-WebUI遇到的一些问题(一)

教程主要参考: AI绘画第一步,安装Stable-Diffusion-WebUI全过程 ! Stable Diffusion WebUI使用手冊(正體中文)|Ivon的部落格 具体记录一下笔者除了按照上述教程,遇到坑的地方 文章目录 1 git PYTHON2 Nvidia设置3 stable-diffus…

如何解决构建安防监控系统的技术难点?快解析来助力

在安防领域,大数据具有广阔的应用场景,能带来深度的价值。随着应用普及越来越广,安防监控系统被人们日益重视起来,科技含量越来越高,几乎所有高新科技都可促进其发展,尤其是信息时代的来临,更给该专业的发展提供了契机…