什么是微分和导数?

news2025/3/15 0:14:20

文章目录

  • 设立问题
  • 微分特性
    • 指数特性
    • 线性特性
    • 常数特性
  • 多项式微分
  • 导数

在机器学习领域,有多种解决最优化问题的方法,其中之一就是使用微分

通过微分,可以得知函数在某个点的斜率,也可以了解函数在瞬间的变化。

设立问题

请想象一下开车行驶在大街上的场景。设横轴为经过时间、纵轴为行驶距离,那么下面的图1应该可以表现二者的关系。

图1

图1

从图中可以看出,车辆在40 s内大约行驶了120 m,所以用下述表达式可以很快地计算出这一期间的行驶速度。

120  m 40  s = 3  m/s \frac{120 \text{ m}}{40 \text{ s}} = 3 \text{ m/s} 40 s120 m=3 m/s

不过这是平均速度,车辆并没有一直保持3 m/s的速度。从图中也可以看出,车辆在刚发动时速度较慢,缓缓前进,而在因红灯而停止时速度变为0,完全不动了。

就像这样,一般来说各个时间点的瞬时速度都取值不同。

刚才我们计算了40 s内的速度,为了求出“瞬间的变化量”,我们来渐渐缩小时间的间隔。看一下图2中10 s到20 s的情况。这一期间车辆跑了大约60 m,所以可以这样求出它的速度。

图2

图2

这与求某个区间内图形的斜率是一回事

使用同样的做法,接着求10 s和11 s之间的斜率,进而求10.0 s和10.1 s之间的斜率。逐渐缩小时间的间隔,最终就可以得出10 s那一瞬间的斜率,也就是速度像这样缩小间隔求斜率的方法正是微分

为了求得这种“瞬间的变化量”,我们设函数为f(x)、h为微小的数,那么函数f(x)在点x的斜率就可以用以下表达式表示。

d d x f ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \frac{\mathrm{d}}{\mathrm{d}x} f(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h} dxdf(x)=h0limhf(x+h)f(x)

上述数学表达式解释如下:

d d x \frac{d}{dx} dxd
称为微分运算符,在表示f(x)的微分时可以写作
d f ( x ) d x \frac{df(x)}{dx} dxdf(x)

d d x f ( x ) \frac{d}{dx} f(x) dxdf(x)
此外,同样用于表示微分的符号还有撇(′), f(x)的微分也可以表示为f′(x)。用哪一种写法都没有问题,本文统一使用
d d x \frac{d}{dx} dxd

我们代入具体的数字来看看,这样有助于理解数学表达式。

比如,考虑一下刚才那个计算10.0 s和10.1 s之间的斜率的例子。在那种情况下x=10、h=0.1。假设车辆在10.0 s那个时间点行驶了40.0 m,在10.1s的时间点行驶了40.6 m,那么可以进行如下计算:

f ( 10 + 0.1 ) − f ( 10 ) 0.1 = 40.6 − 40 0.1 = 6 \frac{f(10 + 0.1) - f(10)}{0.1} = \frac{40.6 - 40}{0.1} = 6 0.1f(10+0.1)f(10)=0.140.640=6

这里的6就是斜率,在这个例子中它表示速度。本来h应当无限接近0,所以要用比0.1小得非常多的值来计算,但这里只是一个例子,姑且就用h=0.1了。

通过计算这样的表达式,可以求出函数f(x)在点x的斜率,也就是说可以微分

微分特性

实际上,直接用如下表达式也不太容易计算,但微分有一些很有用的、值得我们去记住的特性(特性感兴趣可以自己查资料推导)

d d x f ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h \frac{\mathrm{d}}{\mathrm{d}x} f(x) = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h} dxdf(x)=h0limhf(x+h)f(x)

指数特性

当f(x)= x n x^n xn时,对它进行微分可以得到以下表达式。
d d x f ( x ) = n x n − 1 \frac{d}{dx} f(x) = nx^{n-1} dxdf(x)=nxn1

线性特性

若有函数f(x)和g(x),以及常数a,那么下述微分表达式成立。它们体现出来的特性被称为线性

d d x ( f ( x ) + g ( x ) ) = d f ( x ) d x + d g ( x ) d x \frac{d}{dx}(f(x) + g(x)) = \frac{df(x)}{dx} + \frac{dg(x)}{dx} dxd(f(x)+g(x))=dxdf(x)+dxdg(x)

d d x ( a f ( x ) ) = a d f ( x ) d x \frac{d}{dx}(af(x)) = a\frac{df(x)}{dx} dxd(af(x))=adxdf(x)

常数特性

与x无关的常数a的微分为0
d d x a = 0 \frac{d}{dx}a = 0 dxda=0

多项式微分

通过组合上述微分特性,即便是多项式也可以简单地进行微分。如下所示例子。

  • 使用常数特性推导
    d d x 5 = 0 \frac{d}{dx}5=0 dxd5=0

  • 使用指数特性推导
    d d x x = d d x x 1 = 1 ⋅ x 0 = 1 \frac{d}{dx}x=\frac{d}{dx}x^1=1\cdot x^0=1 dxdx=dxdx1=1x0=1

d d x x 3 = 3 x 2 \frac{d}{dx}x^3=3x^2 dxdx3=3x2

d d x x − 2 = − 2 x − 3 \frac{d}{dx}x^{-2}=-2x^{-3} dxdx2=2x3

  • 使用指数特性和线性特性推导
    d d x 10 x 4 = 10 d d x x 4 = 10 ⋅ 4 x 3 = 40 x 3 \frac{d}{dx}10x^4=10\frac{d}{dx}x^4=10\cdot 4x^3=40x^3 dxd10x4=10dxdx4=104x3=40x3

d d x ( x 5 + x 6 ) = d d x x 5 + d d x x 6 = 5 x 4 + 6 x 5 \frac{d}{dx}(x^5+x^6)=\frac{d}{dx}x^5+\frac{d}{dx}x^6=5x^4+6x^5 dxd(x5+x6)=dxdx5+dxdx6=5x4+6x5

  • 含有求和符号的表达式的微分可以像下面这样交换求和符号和微分运算符的顺序
    d d x ∑ i = 0 n x n = ∑ i = 0 n d d x x n \frac{d}{dx}\sum_{i=0}^{n}x^n = \sum_{i=0}^{n}\frac{d}{dx}x^n dxdi=0nxn=i=0ndxdxn

导数

所谓导数,就是微分后的函数求导就是进行微分后的数学函数

例如:
d d x f ( x ) \frac{d}{dx} f(x) dxdf(x)
导数就是
n x n − 1 nx^{n-1} nxn1

参考内容来源于:《白话机器学习的数学》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1850673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++/Qt 小知识记录7

工作中遇到的一些小问题,总结的小知识记录:C/Qt 小知识7 编译FFMPEG遇到的问题CMakeLists.txt配置FFMPEG的依赖方式: x264在Windows下编译生成*.libVS编译Qt工程时,遇到提示Change Qt Version的情况在QtOsg的窗口上嵌入子窗口&…

Map集合之HashMap细说

最近在看面试题,看到了hashmap相关的知识,面试中问的也挺多的,然后我这里记录下来,供大家学习。 Hashmap为什么线程不安全 jdk 1.7中,在扩容的时候因为使用头插法导致链表需要倒转,从而可能出现循环链表问…

图像分割(四)---(图像显示、灰度直方图和三维灰度图综合分析选取最佳分割方法)

一、引言 对彩色图像进行分割的一种常用方法,是先把彩色图像转灰度图像,然后再选择合适的阈值进行二值分割。但有时彩色图像转灰度图像后不具有典型的双峰特性,二值分割效果不好。本文章提出一种确定彩色图像分割方法的新思路。首先读入一幅彩…

2024山东大学软件学院创新项目实训(9)使用OpenCompass进行模型评估

下载好OpenCompassData-core-20231110.zip 之后,解压压缩包 unzip OpenCompassData-core-20231110.zip 运行代码: python run.py --datasets ceval_gen --hf-path /hy-tmp/7B21/merged --tokenizer-path /hy-tmp/7B21/merged --tokenizer-kwargs p…

【数据结构】线性表之《栈》超详细实现

栈 一.栈的概念及结构二.顺序栈与链栈1.顺序栈2.链栈1.单链表栈2.双链表栈 三.顺序栈的实现1.栈的初始化2.检查栈的容量3.入栈4.出栈5.获取栈顶元素6.栈的大小7.栈的判空8.栈的清空9.栈的销毁 四.模块化源代码1.Stack.h2.Stack.c3.test.c 一.栈的概念及结构 栈:一种…

WDG开门狗

WDG开门狗简介 独立看门狗,它的特点就是独立运行,对时间精度要求较低。独立运行就是独立看门狗的时钟是专用的,LSI内部低速时钟,即使主时钟出现问题了,看门狗也能正常工作,这也是独立看门狗独立的得名原因&…

【34W字CISSP备考笔记】域1:安全与风险管理

1.1 理解、坚持和弘扬职业道德 1.1.1.(ISC)职业道德规范 1、行为得体、诚实、公正、负责、守法。 2、为委托人提供尽职、合格的服务。 3、促进和保护职业。 4、保护社会、公益、必需的公信和自信,保护基础设施。 1.1.2.组织道德规范 1、RFC 1087 &#xff0…

本科生大厂算法岗实习经验复盘:从投递到面试的底层思维!

目录 投递渠道boss直聘官网邮箱内推 面试准备leetcode八股深挖项目自我介绍mock面试技巧答不出来怎么办coding反问 复盘技术交流群用通俗易懂方式讲解系列 节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面…

实战电商大数据项目搭建||电商大数据采集||电商API接口

我会提供给你大概1亿条真实的互联网用户上网数据,至于来源,我先不告诉你,绝对是你在网络上无法找到的宝贵数据源。 此外,还会给你提供一个基于当前数据特点而设计的大数据处理方案。 当然,为了防止用户的隐私部分被泄露…

【已解决】SpringBoot图片更新需重启服务器才能显示

问题描述 1、更新头像,并跳转回列表页,发现显示不出来 2、但是前端获取用户头像的信息是在加载页面就会被调用的,同时前端也不存在所谓的缓存问题,因为没有动这部分代码。 但查看响应是能获得正确的信息(前端打印图片…

GitHub Copilot 登录账号激活,已经在IntellJ IDEA使用

GitHub Copilot 想必大家都是熟悉的,一款AI代码辅助神器,相信对编程界的诸位并不陌生。 今日特此分享一项便捷的工具,助您轻松激活GitHub Copilot,尽享智能编码之便利! GitHub Copilot 是由 GitHub 和 OpenAI 共同开…

2024年安全员-A证证考试题库及安全员-A证试题解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年安全员-A证证考试题库及安全员-A证试题解析是安全生产模拟考试一点通结合(安监局)特种作业人员操作证考试大纲和(质检局)特种设备作业人员上岗证考试大纲随机出的…

合并有序链表

合并有序链表 图解代码如下 图解 虽然很复杂,但能够很好的理解怎么使用链表,以及对链表的指针类理解 代码如下 Node* merge_list_two_pointer(List& list1, List& list2) {Node* new_head1 list1.head;Node* new_head2 list2.head;Node* s…

FFmpeg编译4(1)

ffmpeg.cffmpeg.h 修改ffmpeg文件 修改刚刚拷贝的ffmpeg.c文件,找到int main(int argc, char **argv)函数,将其替换为int run(int argc, char **argv)在修改后的run(int argc, char **argv) 末尾(retrun 之前)加上如上如下代码&…

跟TED演讲学英文:How language shapes the way we think by Lera Boroditsky

How language shapes the way we think Link: https://www.ted.com/talks/lera_boroditsky_how_language_shapes_the_way_we_think? Speaker: Lera Boroditsky Date: November 2017 文章目录 How language shapes the way we thinkIntroductionVocabularySummaryTranscriptA…

【完全复现】基于改进粒子群算法的微电网多目标优化调度(含matlab代码)

目录 主要内容 部分代码 结果一览 下载链接 主要内容 程序完全复现文献模型《基于改进粒子群算法的微电网多目标优化调度》,以微电网系统运行成本和环境保护成本为目标函数,建立了并网方式下的微网多目标优化调度模型,通过改进…

数组和链表的区别是什么?

引言:本文旨在深入探讨数组和链表之间的区别,分析它们在不同情境下的优缺点,并探讨如何根据应用需求选择合适的数据结构。通过深入理解数组和链表的内部工作原理和应用场景,读者将能够更好地应用这些知识解决实际问题,…

【Gradio】从 BigQuery 数据创建实时仪表板

Google BigQuery 是一个基于云的服务,用于处理非常大的数据集。它是一个无服务器且高度可扩展的数据仓库解决方案,使用户能够使用类 SQL 查询分析数据。 在本教程中,我们将向您展示如何在 Python 中查询 BigQuery 数据集,并使用 g…

【论文阅读】-- 评估叠加时间序列和时间事件序列可视化中的对齐方法

中文标题 摘要1 引言2 相关工作2.1 时间事件序列可视化2.2 理解时间事件序列的任务 3个假设4 对比评价4.1 刺激和任务4.2 程序4.3 参与者4.4 测量与分析 5 结果与讨论5.1 前兆和后果事件5.2 中间事件 6 反思和设计意义7 结论致谢参考文献 期刊: IEEE VIS (发表日期:…

2024年【T电梯修理】免费试题及T电梯修理考试总结

题库来源:安全生产模拟考试一点通公众号小程序 T电梯修理免费试题参考答案及T电梯修理考试试题解析是安全生产模拟考试一点通题库老师及T电梯修理操作证已考过的学员汇总,相对有效帮助T电梯修理考试总结学员顺利通过考试。 1、【多选题】TSGT7005-2012《…