机器学习/人工智能中的学习证明

news2024/11/16 23:33:17

一、说明

        在进行任何数学发展之前,我们必须首先了解学习的基础以及它如何与错误的概念密切相关。关于代价函数,它的工作原理是梯度下降原理。本文将回顾梯度下降原理。

二、假想的厨师

        想象一下,在任何一天,你决定复制你在一家著名餐厅吃过的美味佳肴。你完全记得这种美味的味道。基于此,您在线搜索食谱并尝试在家中复制它。

        让我们将您在餐厅吃到的美味佳肴的味道表示为 T,这将代表预期的口味,即您的目标。根据你在网上找到的食谱,你希望实现这个目标,即味道T

        要复制此食谱,您需要按照所有指示的步骤进行操作,使用所有成分、必要的温度、烹饪时间等。让我们将所有这些方法和成分表示为 X

        完成整个过程后,您将品尝这道菜。此时,您判断它是否与预期的味道T相似。你注意到它比预期的更咸或更甜。您在家中复制的美味佳肴的味道将用 Y 表示。

        因此,在意识到味道与目标 T 不同时,您可以根据味道 Y 分配一个定量度量,以衡量它与目标味道的差异程度。换句话说,你可以加更多的盐或更少的盐,更多的调味料或更少的调味料。

        T 和 Y 之间的差值可以定义为误差 E和 Y 之间的区别是由你的味觉记忆做出的。因此,您的味觉此时执行特定功能,我们可以将其定义为 P(Y) = E。换句话说,当体验到味觉 Y 时,味觉会根据目标味觉 T 分配误差 E

        有了误差 E 的定量度量,我们可以每天重现这个配方,这样随着时间的推移,误差 就会减少。换句话说,目标口味 T 和口味 Y 之间的距离减小,直到 T = Y

        基于这个假设的场景,我们可以将错误定义为与观察到的现实不一致的判断,其中总有一个函数执行判断动作。因此,在上述情况下,味觉和记忆创造了这种判断功能。

        在这种特定情况下,学习行为的特点是能够减少错误。换句话说,它是以不同方式与复制对象交互的能力,以减少判断功能的输出。

三、厨师的专业知识

        回到假设的情况,我们有食谱所示的成分和方法 X。所有的食材和设备都与餐厅使用的相同;因此,结果完全取决于您正确操纵它们以实现目标口味 T 的能力。

        换句话说,你操纵 X 来获得 Y。因此,我们可以定义 U 本质上是一个将 X 转换为 Y 的函数,表示为 f(X) = Y

        函数f(X)代表操纵成分的行为,也取决于你的大脑如何运作。换句话说,如果你有烹饪经验,你会发现把X变成Y更容易。

        让我们将 W 定义为神经元的权重或操纵 X 的神经能力。如果 W 已经根据烹饪经验进行了预先调整,则将 X 转换为 Y 会更容易。否则,我们将需要调整 W,直到我们可以将 X 转换为 Y

        因此,我们知道 f(X) = Y 也取决于 W,即我们可以在 f(X) = WX 中线性表示它。

        因此,我们的目标是发现如何修改 W,直到生成的 Y 非常接近或等于 T。换句话说,我们如何调整 W,直到误差 E 显着减小或变为零。

四、成本函数

        评估结果与预期结果之间差值的函数是成本函数。将食材和烹饪方法转化为美味的功能是我们的模型,它可以是人工神经网络,也可以是其他机器学习模型。

式(1)

        在等式(1)中,成本函数E的定义,它取决于n个权重w。换句话说,它是一个根据 w 的值指示错误的函数。在未调整所有 n 个权重 w 的特定情况下,误差 E 的值会很大。相反,在权重调整正确的情况下,误差 E 的值将很小或为零。

方程(2)

        因此,我们的目标是找到 n 个权重 w 的值,使得上述条件为真。

五、梯度

        为了便于理解我们将如何做到这一点,我们将定义以下函数:

图片(1)

        因此,我们直观地知道,当 x = 0 且 y = 0 时,f(x, y) = 0。但是,我们想要一种算法,在给定随机 x 和 y 值的情况下,调整 x 和 y 的值,直到函数 f(x, y) 等于零。

        为了实现这一点,我们可以使用函数的梯度。在向量演算中,梯度是一个向量,它指示方向和大小,通过从指定点的位移,我们获得了数量值的最大可能增加。

        式(3)

        也就是说,通过将梯度应用于函数 f(x, y),我们得到了一个向量,如等式 (3) 所示,它告知如何增加 x 和 y 的值以使 f(x, y) 的值增长。但是,我们的目标是找到函数 f(x, y) = 0 所需的 x 和 y 值。因此,我们可以使用负梯度。

        下面是函数 f(x, y) 的两维表示,其中着色表示 z 的值。使用负梯度,我们看到向量指向函数的最小值。

图片(2)

        基于此,我们可以开发一种方法,使用函数 f(x, y) 的梯度场更新 x 和 y,以找到 f(x, y) = 0 的必要值。

六、学习的证明

        我们将定义一个简单的函数 f(x) 用于算法测试。我们的目的是找到此函数的最小值。为此,我们可以应用 f(x) 的梯度。

        方程(4)

        上面,我们有函数 f(x) 的梯度。我们不会在本文中深入定义导数的概念,但我们建议您阅读有关其定义以及为什么我们可以以这种方式表示它。

        知道 h 趋于零,我们可以将 f(x) 的梯度表示为如下:

        方程 (5)

        基于此,我们可以用以下术语替换 h

        式 (6)

        我们定义元素 alpha 以保持项 h 的必要性,其中 alpha 必须严格为正,并且始终趋于零,与项 h 相同。将新关系代入导数的定义中,我们有:

        式 (7)

        现在我们有一个宝贵的关系来证明。我们知道任何元素的平方都是正的。根据这个概念,需要用减去 alpha 乘以 f(x) 的梯度来代替 h

        所以:

        方程 (8)

        因此,只要 alpha 始终为正值,我们就可以判断 (8) 中的条件为真。

        方程 (9)

        也就是说,用严格的正值减去 f(x) 的值将始终小于 f(x) 的原始值。因此,我们可以使用式(7)和(9)将其替换为以下关系:

        方程 (10)

        因此,对于如何更新 的值,使函数 f(x) 至少小于其先前的状态,我们有一个经过验证的关系。

        方程 (11)

        因此,我们知道如何减小当前的 x 以满足不等式 (11):

        方程 (12)

        为了确认这种关系的有效性,我们可以将此方法应用于 img 中的函数 f(x, y)。(1)我们知道谁的行为。所以:

        方程 (13)

        将此算法多次应用于函数 f(x, y),我们期望看到函数的值减小,直到达到最小值。为此,我们进行了一个模拟,此外,我们还将噪声应用于更新的 x 和 y 的分配,以可视化 f(x, y) 值的减少。

        图片(3)

        请注意,当 alpha 的值趋于零时,我们观察到 x 和 y 的值趋于函数的最小值。当这不是真的时,例如,在 alpha = 0.6 时,我们观察到找到函数 f(x, y) 的最小值有一定的困难。

七、梯度下降

        该算法被称为“梯度下降”或“最陡下降方法”,是一种优化方法,用于找到函数的最小值,其中每一步都在负梯度方向上进行。此方法不保证会找到函数的全局最小值,而是局部最小值。

        关于找到全局最小值的讨论可以在另一篇文章中展开,但在这里,我们已经从数学上展示了梯度如何用于此目的。

        现在,将其应用于依赖于 n 个权重 w 的成本函数 E,我们有:

        方程 (14)

        为了根据梯度下降更新 W 的所有元素,我们有:

        方程 (15)

        对于向量 W 的任何第 n个元素 w,我们有:

        方程 (16)

        因此,我们有了自己的理论学习算法。从逻辑上讲,这并不适用于厨师的假设想法,而是适用于我们今天所知道的众多机器学习算法。

八、结论

        根据我们所看到的,我们可以得出结论,理论学习算法的演示和数学证明。这种结构适用于许多学习方法,例如 AdaGrad、Adam 和随机梯度下降 (SGD)。

        此方法不能保证在成本函数产生零结果或非常接近它的结果时找到 n 权重值 w。但是,它向我们保证,将找到成本函数的局部最小值。

        为了解决局部最小值的问题,有几种更鲁棒的方法,例如 SGD 和 Adam,它们通常用于深度学习。然而,理解基于梯度下降的理论学习算法的结构和数学证明将有助于理解更复杂的算法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2049701.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

8.13 Day19 Windows服务器(Windows service 2008 R2)上域的搭建 (1)

域服务器(DC):安装了活动目录服务的服务器就称为DC。 将三台设备配置在同一网络中,此处将外部网络隔离开,只将他们放在局域网中 服务端网络配置,此时与外部网络彻底隔绝开,且已无法和主机通信&…

XSS game复现(DOM型)

目录 1.Ma Spaghet! 2.Jefff 3.Ugandan Knuckles 4.Ricardo Milos 5.Ah Thats Hawt 6.Ligma 7.Mafia 8.Ok, Boomer 1.Ma Spaghet! 通过简单的尝试发现传递参数可以直接进入h2标签 接下来我们尝试传入一个alert(1) 可以看到并没有触发。原因是在innerHTML中官方禁用了sc…

二进制安装php

下载php二进制包: 官网地址:https://www.php.net/releases/ PHP: Releaseshttps://www.php.net/releases/在里边可以选择自己要下载的包进行下载; 下载完成后进行解压: tar xvzf php-7.3.12.tar.gz 解压后 进入目录进行预编…

xss案例

首先进入XSS Game - Learning XSS Made Simple! | Created by PwnFunction打开环境 Ma Spaghet 在script里面给使用get传参给somdbody传一个值,若没有传值,默认传SomebodyToucha Ma Spaghet!,赋值给spaghet,放在h2标签中,spaghet后会有一个in…

Linux根目录下的各个目录的用途介绍

在Linux系统中,我们可以通过cd /命令进入根目录,然后ls -l(或者ll命令)即可查看根下目前的目录情况: 这些不同目录的用途说明如下: /bin:包含基本命令文件,如ls、cp等,这个文件中的文件都是可执…

基于协同过滤算法的黔醉酒业白酒销售系统_p091v--论文

TOC springboot349基于协同过滤算法的黔醉酒业白酒销售系统_p091v--论文 绪论 1.1背景及意义 中国经济快速发展,人均GDP逐年上涨,非生活必须品的消费比重也随之增加 ,酒类销售额度,尤其是酱香型白酒销售额近些年可谓发展迅猛&…

STM32通过I2C硬件读写MPU6050

目录 STM32通过I2C硬件读写MPU6050 1. STM32的I2C外设简介 2. STM32的I2C基本框图 3. STIM32硬件I2C主机发送流程 10位地址与7位地址的区别 7位主机发送的时序流程 7位主机接收的时序流程 4. STM32硬件与软件的波形对比 5. STM32配置硬件I2C外设流程 6. STM32的I2C.h…

Hadoop如何搭建计算和存储节点分离

在业内存在着一种看起来比较离谱的搭建方式,叫计算节点与存储节点分离,说它比较离谱,是因为hadoop架构本身不直接支持将这两者分开,因为hadoop本身的一大优势就是计算本地化,这种分开搭建的方式抛弃了这种优势&#xf…

Linux 软件编程学习第十五天

1.TCP粘包问题: TCP发送数据是连续的,两次发送的数据可能粘连成一包被接收到 1.解决粘包问题方法: 1.接收指定长度:(不稳定) 发送5个字节 接收5个字节 2.睡眠&#x…

用户画像实时标签数据处理流程图

背景 在用户画像中,有一类实时标签,我们既要它能够实时的对外提供数据统计,也要保存到大数据组件中用于后续的对数,圈选的逻辑,本文就看一下用户画像的实时标签的数据流转图 实时标签数据流转图 首先我们肯定是要使…

GoMail发送邮件的性能优化策略有哪些方法?

GoMail发送邮件如何配置服务器?GoMail发信功能如何? GoMail是一款广受欢迎的Go语言邮件发送库,具备高效、易用等优点,但在高并发场景下,GoMail发送邮件的性能优化显得尤为重要。AokSend将探讨几种有效的GoMail发送邮件…

图像数据处理14

三、空域滤波 3.3 统计排序滤波器 统计排序滤波器属于非线性空域滤波器,常见的统计排序滤波器有中值滤波器、最大值滤波器、最小值滤波器。 中值滤波器、最大值滤波器和最小值滤波器是三种常见的统计排序滤波器,它们在图像处理和信号处理中发挥着重要…

WUP-MY-LABEL-PRINTER 旻佑热敏打印机标签打印uniapp插件使用说明

插件地址:WUP-MY-LABEL-PRINTER 旻佑热敏打印机标签打印安卓库 简介 本插件主要用于旻佑热敏打印机打印标签,不支持票据打印。适用于旻佑的各型支持标签打印的热敏打印机。本插件开发时使用的打印机型号为MY-805嵌入式面板打印机,其他型号请…

Cisco交换机SSH使用RSA公钥免密登录(IOS与Nexus,服务器以RHEL8为例)

目录 需求实验步骤0. 实验环境1. Linux2. CiscoIOS基础设置保存密钥登陆测试 3. CiscoNexus基础配置保存密钥登陆测试 需求 在实际工作中,常会遇到自动化的需求,那么在自动采集、配置等对网络设备的自动化需求中,不可避免的会遇到需要登录-&…

tensorboard显示一片空白解决方案

OK艾瑞巴蒂 不知道看这个视频几个小土堆过来的,今天已经发了一篇博文探讨快速下载tensorboard了 下面用的时候叒出现问题了 from torch.utils.tensorboard import SummaryWriter writer SummaryWriter("logs")# writer.add_image() # Yx for i in range…

实时手势识别(1)- 基于手部检测+手部分类

目录 前言 1.实现效果 2.非端到端实现的原因 3.分类网络与数据准备 4.训练结果 5.测试结果 6.训练代码 7.训练日志 7.1ResNet18训练日志 7.2ShuffleNet_v2训练日志 前言 利用YOLOv8获取手部区域,然后对手部区域进行分类,实现手势识别。 本文使…

powershell 终端 执行 pnpm -v报错

1.问题描述: 明明全局已安装 pnpm ,但在vscode默认终端 powershell 执行 pnpm -v 却报错: 2.问题根因: 原因是 PowerShell 执行策略问题。 3.解决方案: 以管理员身份运行 PowerShell 查看 PowerShell 的执行策略…

初探systemⅡ·慢思考

本篇笔记记录于 May 30th, 2023 oai联合创始人Andrej曾在微软大会上的报告中有提到LLMs对于人类快、慢思考两种认知推理模式的当下探索与未来展望,这里曾经得到的启示是:未来在模型的训练与推理侧是否会出现一种新的长链认知范式?如在RLHF过程…

秋招突击——8/13——并查集——复习{有塔一面}——新作{亲戚关系}

文章目录 引言复习并查集模板复习——有塔一面 新作亲戚关系 总结 引言 这两天准备腾讯的第二面,看了很多人的面经,发现考并查集的题目蛮多的,这里整理学习一下! 复习 并查集模板 这里学习了B站的麦克老师的课程,对…

MySQL与SQLserver

与MySQL的差别 SQL Server和MySQL都是广泛使用的关系数据库管理系统(RDBMS),它们的SQL语法有很多相似之处,但也存在一些差异。以下是一些主要的语法区别: 1. 数据库和表的创建 SQL Server CREATE DATABASE databas…