1.极限与连续-——“机器学习中的数学”

news2025/1/12 1:39:51

1.通过集合相等来讲解什么是映射关系

上面问的这个问题(2N+ = N2)说明了什么?

——两个无穷集合,如果能找到一种对应关系(映射关系),那么我们就可以说这两个集合是等价的。

  数列的极限就是趋势

极限就是无限接近,但是不等于

下面这是一个数列的极限,当n趋近于正无穷,数列趋近于自然数e

\LARGE \lim _{n \rightarrow+\infty}\left(1+\frac{1}{n}\right)^n=\mathrm{e}

用画图表示就是这样,无限逼近于自然数e

 洛必达法则

若函数f(x)和g(x)满足下列条件:

随着x逼近a, 本身f(x)和g(x)都是逼近于正无穷的,但是通过f(x)和g(x)做比,可以得出这个“比”趋近于某个数A。如果A大于1,比如说A等于2,说明f(x)比g(x)趋近于正无穷的速度快。A表示的是一种趋近速度。

        (1)随着x不断向a逼近,如果f(x)和g(x)是趋近于一个常数,那么A越大,f(x)的收敛速度越快。

        (2)随着x不断向a逼近,如果f(x)和g(x)趋近于无穷,那么A越大,f(x)发散的速度越快

 像我们做机器学习追求的就是“单调有界收敛”,像下面这个图,

        单调:从小于e到逼近e这个方向走,说明这个数据是有规律的。如果方向一会增,一会减就是无规律的,就是噪声。

        有界:收敛的过程中,走了一段时间,和e的差距小于某个值,epsilon,比如0.1

和单调有界收敛相反的是“无界发散”,其实就是噪声

夹逼准则

假设一个函数是c,这个c介于a和b之间。这个函数c的极限不好求,我去求c所在区间的两个端点的极限值,进而推出c的极限值。这个过程可以叫做双参设计

 上夹逼趋近于c,下夹逼也趋近于c。上夹逼和下夹逼不断逼近c,离c越来越近,直到我们找到上夹逼或者下夹逼中的一个更加贴近c,我们就把这个夹逼拿出来作为c的近似函数。这个无限接近的过程就是我们所所的“拟合“。

        过拟合就是上夹逼和下夹逼趋近到最中间了(我认为不对

        欠拟合就是,上下夹逼距离我们的的拟合目标c距离太远了。

函数的极限

什么是函数?

函数表达式 是为了以数学符号的形式 表示函数图像。

函数起源于信号学里面的函数图像。(1)比如一个函数图像像下面这样,每一次我们给别人说我们讨论一下下面这样的一个函数的时候,我们都得把这个函数的图像画一遍。每次都要画图真的很累,于是这帮专家发现我们可以用sin(x)这样一个简单的函数表达式来表示下面这张图,所以才有了函数表达式的广泛应用。(2)只有把函数图像转换成数学表达式以后,就可以使用丰富多彩的数学工具,运用过去数学家积累的一些定理和推论。单单拿过一张函数图像,我们是没有工具来处理和分析的。

函数的间断点

一个连续的函数,它一直走,走着走着,到一个点,它忽然断了,后面有继续连续走下去。对于这种间断点,我们该如何处理呢?

(a)这个间断点叫缺失值。因为他是和左右两侧的趋势是相同的。这种情况,如何填充这个缺失值呢?让这个点继续保持左右两点的趋势,就得出缺失值的预测值了。

(b)缺失的值是异常值outlier。这个值反映不出整体趋势,应该舍弃掉这个值,否则会影响到我们模型对于数据的拟合。

(c)这种间断,间断的两侧,属于不同的cluster。这种数据,适合用聚类。

因此我们得出结论,如果数据能够保持连续、没有间断点的话,它的泛化能力很大可能性是不错的(比如上面这个b情况,这种有间断点的情况,如果把间断点再引入进来,训练出来模型泛化性就不好)

介值定理

        介值定理的定义:如果定义域为[a,b]的连续函数f,那么在区间内的某个点,它可以在f(a)和f(b)之间取任何值,也就是说,介值定理是在连续函数的一个区间内的函数值肯定介于最大值和最小值之间。

        我的理解::对于定义域为[a,b]的连续函数f。我们可以拿到函数f的最大值最小值。对于函数值y介于这个最大值和这个最小值之间,一定发 能找到至少一个对应的自变量x的取值范围介于[a,b]之间。

利普希茨连续性

 这个性质将(a-b)这个问题,转换成了f(a)-f(b)的问题。f(a)-f(b)始终"小于等于"K(a-b)体现的就是f(a-b)逼近K(a-b).

\large |f(a)-f(b)|- K|a-b| \leq 0

我们可以把利普西斯连续性的公式移项,得到上面这个式子。我们可以发现,K|a-b|是我们的目标|f(a) - f(b)|无限的逼近于K|a - b|。实际上这个逼近的程度,可以用0这么小,我们自己是可以调整的,比如小于\large \epsilon,比如0.1,0.01这样一个人为可控的小量。


本文来自于,笔者收听“点头教育”的课程《机器学习数学基础》过程中记录的笔记。为了尊重教学视频的版权,这里列举一下点头教育的联系方式。

点头教育官网:

https://www.diantouedu.cn/index

《机器学习数学基础》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/326.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

字符串转二叉树

一. 题目介绍 二. 题目分析 首先 题目让我们以先序遍历的方式用字符串建立一个二叉树 输入是一个字符串 输出是是以中序遍历二叉树打印 我们先来看最简单的输入 这里只要建立一个字符数组 然后等测试用例输入就好了 // 接受输入值char arr[100]{0};scanf("%s",…

网络原理 --- 传输层Ⅳ TCP协议中的延迟应答、捎带应答、面向字节流、TCP中的异常处理

文章目录网络原理传输层TCP协议7.延迟应答8.捎带应答9. 面向字节流10.TCP中的异常处理总结网络原理 介绍TCP/IP协议中每一层里面的核心内容~ 应用层传输层网络层数据链路层物理层 传输层TCP协议 7.延迟应答 提高传输效率的机制 又是基于流量控制,来引入的提高效率的机制 实…

数据在内存中的存储

目录 数据在内存中的存储:: 整型及其浮点型存储方式: 1.数据类型介绍 2.整形在内存中的存储:原码 反码 补码 3.大小端字节序介绍及判断 4.浮点型在内存中的存储 5.两道经典指针选择题 C语言编程训练(牛客网) 1.喝汽水问题 2.字符串逆序 3.打…

Python编程运算符 ——算数运算符

作者简介:一名在校计算机学生、每天分享Python的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.运算符 1.在Python运算符中分为 2.算数运算符 3.比较重要的运算符 4…

网络原理——No.1 传输层_TCP的确认应答机制与超时重传

JavaEE传送门JavaEE JavaEE——网络原理_应用层 网络原理——传输层_UDP 目录传输层TCPTCP 的基本特性确认应答机制超时重传传输层 端到端之间的传输, 重点关注的是起点和终点 核心的协议有两个: UDP: 无连接, 不可靠传输,面向数据报, 全双工 TCP: 有链接, 可靠传输, 面向字…

黑猫带你学UFS协议第11篇:什么是逻辑单元(LU)与逻辑块(Sector)

本文依据UFS3.1 JEDEC协议及个人工作经验整理而成,如有错误请留言。 文章为个人辛苦整理,付费内容,已加入原创维权,禁止私自转载。 文章所在专栏:《黑猫带你学:UFS协议详解》 1 LU简介 我们对与UFS、emmc一类存储芯片,最重要的功能是什么?无非就是存数据和取出数据,也…

神经网络的输入稀疏矩阵,神经网络中的矩阵运算

1、BP神经网络模型各个参数的选取问题 样本变量不需要那么多,因为神经网络的信息存储能力有限,过多的样本会造成一些有用的信息被丢弃。如果样本数量过多,应增加隐层节点数或隐层数目,才能增强学习能力。 一、隐层数 一般认为&am…

牛客前端刷题(九)—— 打包篇

还在担心面试不通过吗?给大家推荐一个超级好用的刷面试题神器:牛客网,里面涵盖了各个领域的面试题库,还有大厂真题哦! 赶快悄悄的努力起来吧,不苒在这里衷心祝愿各位大佬都能顺利通过面试。 面试专栏分享&a…

greenplum 源码解析 FTS辅助进程--ReadMe

简介 在greenplum数据库中master节点有一个专属进程Fault Tolerance Service (FTS: 容错服务),其主要功能是检测所有segment节点的健康信息,如果其检测到segment节点的primary出现异常[硬件故障/宕机],会在第一时间将其对应的mirror提升为新的…

MySql(50)MySQL日志

文章目录MySQL支持的日志日志类型日志的弊端慢查询日志(slow query log)通用查询日志查看当前状态启动日志永久启动临时启动查看日志删除\刷新日志错误日志(error log)删除\刷新日志二进制日志(bin log)查看默认情况日志参数设置查看日志使用日志恢复数据删除二进制日志PURGE M…

vue3 响应式对象的 api ,你全用过了吗?

文章目录Ⅰ. ref、reactive ( 递归监听 )Ⅱ. isRef、isReactive ( 判断 )Ⅲ. toRef 和 toRefs ( 解构 )Ⅳ. toRaw 、 markRaw ( 解除代理)Ⅴ. unref ( 拷贝 )Ⅵ. shallowRef 、shallowReactive( 非递归监听 )Ⅶ. triggerRef (强制更新&#x…

红黑树原理及旋转

红黑树,本质上来说就是一棵二叉查找树 但它在二叉查找树的基础上增加了着色和相关的性质使得红黑树相对平衡 保证了红黑树的查找、插入、删除的时间复杂度最坏为O(log n) 但它是如何保证一棵n个结点的红黑树的高度始终保持在h logn的呢?这就引出了红黑…

相似度_对抗学习:SimCSE: Simple Contrastive Learning of Sentence Embeddings

SimCSE: Simple Contrastive Learning of Sentence Embeddings 这篇论文,我觉得有意思。在创造对抗学习的正负例时,正例直接使用它本身。将同一个句子传递给预先训练好的编码器两次:通过应用两次dropout,我们可以得到两个不同的嵌…

云计算基础:云计算越来越广泛,我们应该如何去学习云计算

随着时代的发展,云计算越来越普及,越大众化,使用的人越来越多,我们应该如何去学习这门技术呢?这篇文章我们就来介绍如何学习我们的云计算。 学前介绍: 学前介绍 学习资料:HedEX Lite、产品文档、笔记、P…

非科班程序员被裁员后反而涨薪了200%,这两个月他都经历了哪些?

今年年初开始,裁员潮一浪接着一浪翻滚而来,让互联网人胆颤心惊,时刻担心下一波裁员是否就要降临到自己身上。 小帅(化名)是一个原本月薪8k,在小外包公司做政府项目的一名普通员工,前不久就被裁员…

数据仓库建模(四):维度表的设计

数据仓库建模(四):维度表的设计一、维度表的整体结构1.1 维度表的结构设计1.2 维度代理键1.3 自然键、超久键和超自然键1.4 下钻与上卷1.5 维度退化1.6 非规范化的扁平维度1.7 多层次维度1.8 维度属性的标识与状态信息1.9 维度表中的空值属性…

趣学算法(2)

14天阅读挑战赛 目录前言一 几类时间复杂度二 兔子数列1.问题分析2.方法13.方法24.方法3最后前言 这篇文章是《趣学算法》的读书笔记,也对数据结构与算法的初步介绍,阅读这篇文章,我会带你改进一个算法。 一 几类时间复杂度 常见的算法时间复…

Vue项目的记录(十三)

1.登录注册静态组件 assets这个文件夹放所有的组件公用的静态资源 在样式当中也可以使用符号,(src目录的别名),要注意的是在前面你加上~ 2.注册业务 这里的验证码,正常来说应该是要后台发送到用户手机上&#xff0c…

拓端tecdat|R语言辅导配对检验分析案例

全文链接:http://tecdat.cn/?p3424 原文出处:拓端数据部落公众号 什么是检验对? 检验对的形式 (x1,x2) 出现在两种情况中: 对同一实体执行两次测量。例如,一项评估新型胰岛素疗效…

C-文件操作实现数据持久化,帮你快速了解文件操作函数

目录 一.了解文件 二.文件的打开和关闭 三.顺序读写文件函数 fputc字符输入函数 fgetc字符输入函数 fputs文本行输出函数 fgets文本行输入函数 fprintf格式化输出函数 fscanf格式化输入函数 fwrite二进制输出函数 fread二进制输入函数 四. 解析上述的流 五.文件的随机…