【变分法】【书籍阅读笔记】Calculus of Variation by gelfand 第一章 总结与习题题解 【更新中】

news2024/11/27 4:34:04

文章目录

  • 前言
  • 1 第一章 变分法基础
    • 1.1 泛函 与 一些简单的变分问题
    • 1.2 Function Spaces/ 赋范线性空间
    • 1.3 泛函的变分: 具有极值的必要条件
      • 1. 重要引理/线性泛函的等零条件
      • 2. 泛函变分
    • 1.4 最简单的变分问题:欧拉方程
      • 1. 欧拉方程
      • 2. 证明/欧拉方程的得出
      • 3. 欧拉方程的求解
    • 1.5 The Case of Several Variables
    • 1.6 A Simple Variable End Poi nt Problem
    • 1.7 The Variational Derivative
    • 1.8 I nvariance of Euler's Eq u ation
  • 2 一些有用的重要结论/公式/例题
  • 3 习题题解
  • 4 总结

前言

之前看 PRML 时碰到了 变分相关的问题,所以找了一本书特地来学习一下

1 第一章 变分法基础

1.1 泛函 与 一些简单的变分问题

该节引出泛函的定义 ,介绍一个基本的泛函问题 并且 沿用经典的微积分有限元分析,对泛函做出类似的分析

变化量(variable quantities)被称为 泛函,指的是 自变量本身是一个函数的函数

例如 J [ y ] = ∫ a b y ′ 2 ( x ) d x J[y]=\int_a^b y^{\prime 2}(x) d x J[y]=aby′2(x)dx 定义了一个泛函

一个更加一般的情形是
J [ y ] = ∫ a b F [ x , y ( x ) , y ′ ( x ) ] d x J[y]=\int_a^b F\left[x, y(x), y^{\prime}(x)\right] d x J[y]=abF[x,y(x),y(x)]dx

涉及泛函概念的问题的特定实例在三百多年前就被考虑过了,事实上,这一领域的第一个重要结果要归功于欧拉(1707 - 1783)。然而,迄今为止,"函数微积分 "仍不具备可与经典分析方法(即普通的 “函数微积分”)相媲美的通用方法。

要理解变分问题和方法的基本含义 要理解变分微积分的问题和方法的基本含义,很重要的一点是要了解它们与经典微分析的关系,即与 n个变量函数的关系。 因此,考虑一个形式为
J [ y ] = ∫ a b F ( x , y , y ′ ) d x , y ( a ) = A , y ( b ) = B J[y]=\int_a^b F\left(x, y, y^{\prime}\right) d x, \quad y(a)=A, \quad y(b)=B J[y]=abF(x,y,y)dx,y(a)=A,y(b)=B
的泛函。

沿用经典微积分理论,我们可以切分 [ a , b ] [a,b] [a,b] 区间 进行求和
a = x 0 , x 1 , … , x n , x n + 1 = b , a=x_0, \quad x_1, \ldots, \quad x_n, \quad x_{n+1}=b, a=x0,x1,,xn,xn+1=b,
J ( y 1 , … , y n ) = ∑ i = 1 n + 1 F ( x i , y i , y i − y i − 1 h ) h J\left(y_1, \ldots, y_n\right)=\sum_{i=1}^{n+1} F\left(x_i, y_i, \frac{y_i-y_{i-1}}{h}\right) h J(y1,,yn)=i=1n+1F(xi,yi,hyiyi1)h
where
y i = y ( x i ) , h = x i − x i − 1 . y_i=y\left(x_i\right), \quad h=x_i-x_{i-1} . yi=y(xi),h=xixi1.

利用这种方式解决 泛函问题被称为 有限差分法(finite differences。通过用多边形线代替 通过用多边形线代替平滑曲线,他将寻找函数极值的问题简化为寻找 n 个变量的函数极值的问题。

1.2 Function Spaces/ 赋范线性空间

本章讨论了 函数空间、重要的赋范线性空间(使得我们可以定义函数之间的距离),以及定义泛函的连续性(根据函数空间中函数之间的距离)

当我们去讨论 n 个变量(函数)的问题时,我们会很自然的去使用代数的语言:将 ( y 1 , … , y n ) \left(y_1, \ldots, y_n\right) (y1,,yn)当成时 n 维空间中的点。

函数空间:空间中的元素是函数时,即为 函数空间。

事实上,我们的函数空间很多时候取决于我们讨论的问题,例如当我们讨论这样的问题时:
∫ a b F ( x , y , y ′ ) d x \int_a^b F\left(x, y, y^{\prime}\right) d x abF(x,y,y)dx我们希望我们的函数是一维可导的连续函数,而这样的问题时即为二维可导的连续函数 ∫ a b F ( x , y , y ′ , y ′ ′ ) d x \int_a^b F\left(x, y, y^{\prime}, y^{\prime \prime}\right) d x abF(x,y,y,y′′)dx

赋范线性空间中我们可以定义 x x x and y y y 的距离为 ∥ x − y ∥ \|x-y\| xy的值.

在接下来的讨论中,下面这些 赋范线性空间是很重要的:

  1. C ( a , b ) \mathscr{C}(a, b) C(a,b) : 即所有 [a,b] 间的连续函数,norm的定义为 ∥ y ∥ 0 = max ⁡ a ⩽ x ⩽ b ∣ y ( x ) ∣ \|y\|_0=\max _{a \leqslant x \leqslant b}|y(x)| y0=maxaxby(x), 因此如果 y ∗ ( x ) y^*(x) y(x)和 y(x) 的距离为 ε \varepsilon ε,y(x)不会超过 y ∗ ( x ) y^*(x) y(x) 上下两个 ε \varepsilon ε 带的距离
  2. D 1 ( a , b ) \mathscr{D}_1(a, b) D1(a,b): 即所有 [a,b] 间的含有一阶导的连续函数
    • norm的定义: ∥ y ∥ 1 = max ⁡ a ⩽ x ⩽ b ∣ y ( x ) ∣ + max ⁡ a ⩽ x ⩽ b ∣ y ′ ( x ) ∣ \|y\|_1=\max _{a \leqslant x \leqslant b}|y(x)|+\max _{a \leqslant x \leqslant b}\left|y^{\prime}(x)\right| y1=maxaxby(x)+maxaxby(x).
  3. D n ( a , b ) \mathscr{D}_n(a, b) Dn(a,b): 即所有 [a,b] 间的含有一阶导的连续函数
    • norm的定义: ∥ y ∥ n = ∑ i = 0 n max ⁡ a ⩽ x ⩽ b ∣ y ( i ) ( x ) ∣ \|y\|_n=\sum_{i=0}^n \max _{a \leqslant x \leqslant b}\left|y^{(i)}(x)\right| yn=i=0nmaxaxb y(i)(x)

由此,我们可以给出 泛函连续性的定义:
在这里插入图片描述

1.3 泛函的变分: 具有极值的必要条件

1. 重要引理/线性泛函的等零条件

这一节我们引出 泛函的变分,类比 n个变量的微分 来 得到结果

  1. 线性泛函:首先我们给出线性泛函 的定义

在这里插入图片描述

我们给出一个 线性泛函空间的重要例子:

Example 4. More generally, the integral
φ [ h ] = ∫ a b [ α 0 ( x ) h ( x ) + α 1 ( x ) h ′ ( x ) + ⋯ + α n ( x ) h ( n ) ( x ) ] d x , \varphi[h]=\int_a^b\left[\alpha_0(x) h(x)+\alpha_1(x) h^{\prime}(x)+\cdots+\alpha_n(x) h^{(n)}(x)\right] d x, φ[h]=ab[α0(x)h(x)+α1(x)h(x)++αn(x)h(n)(x)]dx,
where the α i ( x ) \alpha_i(x) αi(x) are fixed functions in C ( a , b ) \mathscr{C}(a, b) C(a,b), defines a linear functional on D n ( a , b ) \mathscr{D}_n(a, b) Dn(a,b).

α 0 ( x ) \alpha_0(x) α0(x) 是一个固定的函数

如果 φ [ h ] \varphi[h] φ[h] 为 0,我们会得到什么结果呢,对于 α 0 ( x ) h ( x ) \alpha_0(x) h(x) α0(x)h(x) 的积分, α 1 ( x ) h ′ ( x ) \alpha_1(x) h^{\prime}(x) α1(x)h(x) 的积分 , α 2 ( x ) h ′ ′ ( x ) \alpha_2(x) h^{\prime \prime}(x) α2(x)h′′(x),以及 α ( x ) h ( x ) + β ( x ) h ′ ( x ) \alpha(x) h(x)+\beta(x) h^{\prime}(x) α(x)h(x)+β(x)h(x)我们可以给出一般性的结论

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2. 泛函变分

本节类比微积分中 增量与可微的定义,给出 可变分的定义 δ J [ h ] \delta J[h] δJ[h].

  1. 定义 泛函 J [ y ] J[y] J[y]增量 (increment)
    Δ J [ h ] = J [ y + h ] − J [ y ] \Delta J[h]=J[y+h]-J[y] ΔJ[h]=J[y+h]J[y]
  2. 如果我们把y看成固定的,那么 Δ J [ h ] \Delta J[h] ΔJ[h] 是 h 的泛函
    Δ J [ h ] = φ [ h ] + ε ∥ h ∥ \Delta J[h]=\varphi[h]+\varepsilon\|h\| ΔJ[h]=φ[h]+εh,一般来说他是 非线性的泛函,为了沿用上面的引理我们让 φ [ h ] \varphi[h] φ[h] 是个 线性泛函,并且 当 ∥ h ∥ → 0 \|h\| \rightarrow 0 h0 时, ε → 0 \varepsilon \rightarrow 0 ε0,则 J [ y ] J[y] J[y] 被称为 可变分的
  3. 变分: 线性部分 φ [ h ] \varphi[h] φ[h] (和增量的差为 比 ∥ h ∥ \|h\| h 的阶数要高的无穷小) 被称作变分,记为 δ J [ h ] \delta J[h] δJ[h]

对于变分泛函,以下几个定理是重要:

  1. 变分泛函是唯一的
  2. 可变分泛函 在 y = y ^ y=\hat{y} y=y^ 有极值的必要条件是:对于所有 h 有 δ J [ h ] = 0 \delta J[h]=0 δJ[h]=0

上述定理2的证明如下:
在这里插入图片描述

1.4 最简单的变分问题:欧拉方程

本节证明 具有 J [ y ] = ∫ a b F ( x , y , y ′ ) d x J[y]=\int_a^b F\left(x, y, y^{\prime}\right) d x J[y]=abF(x,y,y)dx 形式的 泛函的解的一般结论。

1. 欧拉方程

我们直接给出问题和结论,并且根据刚刚的变分理论给出证明在这里插入图片描述

  1. 方程 F y − d d x F y ′ = 0 F_y-\frac{d}{d x} F_{y^{\prime}}=0 FydxdFy=0被称为欧拉方程
  2. 欧拉方程的解被称为 extremal(极值曲线)

2. 证明/欧拉方程的得出

证明如下:

  1. 首先写出泛函 J 的增量形式
    Δ J = J [ y + h ] − J [ y ] = ∫ a b F ( x , y + h , y ′ + h ′ ) d x − ∫ a b F ( x , y , y ′ ) d x = ∫ a b [ F ( x , y + h , y ′ + h ′ ) − F ( x , y , y ′ ) ] d x , \begin{aligned} \Delta J=J[y+h]-J[y] & =\int_a^b F\left(x, y+h, y^{\prime}+h^{\prime}\right) d x-\int_a^b F\left(x, y, y^{\prime}\right) d x \\ & =\int_a^b\left[F\left(x, y+h, y^{\prime}+h^{\prime}\right)-F\left(x, y, y^{\prime}\right)\right] d x,\end{aligned} ΔJ=J[y+h]J[y]=abF(x,y+h,y+h)dxabF(x,y,y)dx=ab[F(x,y+h,y+h)F(x,y,y)]dx,

  2. 根据多元泰勒公式 ,增量可以写为 ∫ a b [ F y ( x , y , y ′ ) h + F y ′ ( x , y , y ′ ) h ′ ] d x \int_a^b\left[F_y\left(x, y, y^{\prime}\right) h+F_{y^{\prime}}\left(x, y, y^{\prime}\right) h^{\prime}\right] d x ab[Fy(x,y,y)h+Fy(x,y,y)h]dx 加上一个 h 的高阶无穷小。
    Δ J = ∫ a b [ F y ( x , y , y ′ ) h + F y ( x , y , y ′ ) h ′ ] d x + ⋯ \Delta J=\int_a^b\left[F_y\left(x, y, y^{\prime}\right) h+F_y\left(x, y, y^{\prime}\right) h^{\prime}\right] d x+\cdots ΔJ=ab[Fy(x,y,y)h+Fy(x,y,y)h]dx+
    即我们的变分为:

δ J = ∫ a b ( F y h + F y ′ h ′ ) d x = 0 \delta J=\int_a^b\left(F_y h+F_{y^{\prime}} h^{\prime}\right) d x=0 δJ=ab(Fyh+Fyh)dx=0

得到
F y − d d x F y ′ = 0 F_y-\frac{d}{d x} F_{y^{\prime}}=0 FydxdFy=0
该式子被称为 欧拉方程

3. 欧拉方程的求解

显然方程是一个 二阶微分方程,他的解通常取决于 A与B点的常数,然而微分方程理论中通常考虑的问题是求解的问题,该解定义在某点的邻域内并满足给定的初始条件(Cauchy’
s problem)。然而,在求解欧拉方程时,我们寻找的解是在所有固定区域上定义的函数,并且满足给定的边界条件。 因此,一个变分得出的微分方程的求解通常不能缩小到现有微分方程的理论上。

因此,我们现在陈述一个由Bernstein 给出的关于的存在唯一性的定理形式的方程 “总体” 解
y ′ ′ = F ( x , y , y ′ ) y^{\prime \prime}=F\left(x, y, y^{\prime}\right) y′′=F(x,y,y)

1.5 The Case of Several Variables

多个变量的 泛函定义为如下形式
J [ z ] = ∬ R F ( x , y , z , z x , z y ) d x d y J[z]=\iint_R F\left(x, y, z, z_x, z_y\right) d x d y J[z]=RF(x,y,z,zx,zy)dxdy

解如下(原书中有详细证明)
在这里插入图片描述

1.6 A Simple Variable End Poi nt Problem

1.7 The Variational Derivative

本节介绍 泛函的变分导数 variational (or functional) derivative δ J δ y \frac{\delta J}{\delta y} δyδJ

1.8 I nvariance of Euler’s Eq u ation

2 一些有用的重要结论/公式/例题

3 习题题解

4 总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/978288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习:基于梯度下降算法的线性拟合实现和原理解析

机器学习:基于梯度下降算法的线性拟合实现和原理解析 线性拟合梯度下降算法步骤算法实现数据可视化(动态展示)应用示例 当我们需要寻找数据中的趋势、模式或关系时,线性拟合和梯度下降是两个强大的工具。这两个概念在统计学、机器…

SQLI-labs-第五关

知识点:布尔盲注 思路: 1、判断注入点 首先,我们看看正常的回显内容 ?id1 接着输入?id1 ,结果出现语句错误 这里说明存在单引号的闭合错误 ?id1 and 11-- ?id1 and 12-- 这里没有任何回显信息,可以准确的确…

基于STM32程序万年历液晶1602显示-proteus仿真-源程序

一、系统方案 本设计采用STM32单片机作为主控器,液晶1602显示,按键设置万年历。 二、硬件设计 原理图如下: 三、单片机软件设计 1、首先是系统初始化 //通用定时器3中断初始化 //这里时钟选择为APB1的2倍,而APB1为36M //arr&…

官方YOLOV5的torch模型->ONNX模型->RKNN模型

1、环境配置 1.1 RKNN Toolkit2的环境配置 下载RKNN Toolkit2 git clone https://github.com/rockchip-linux/rknn-toolkit2.git打开一个终端命令行窗口,安装 Python3.6 和 pip3 sudo apt-get install python3 python3-dev python3-pip安装所需的依赖包 sudo apt-get inst…

机器学习笔记之最优化理论与方法(七)无约束优化问题——常用求解方法(上)

机器学习笔记之最优化理论与方法——基于无约束优化问题的常用求解方法[上] 引言总体介绍回顾:线搜索下降算法收敛速度的衡量方式线性收敛范围高阶收敛范围 二次终止性朴素算法:坐标轴交替下降法最速下降法(梯度下降法)梯度下降法的特点 针对最速下降法缺…

Vue + Element UI 前端篇(十二):用户管理模块

Vue Element UI 实现权限管理系统 前端篇(十二):用户管理模块 用户管理模块 添加接口 在 http/moduls/user.js 中添加用户管理相关接口。 import axios from ../axios/* * 用户管理模块*/// 保存 export const save (params) > {ret…

Unity中Shader的变体shader_feature

文章目录 前言一、变体的类型1、multi_compile —— 无论如何都会被编译的变体2、shader_feature —— 通过材质的使用情况来决定是否编译的变体 二、使用 shader_feature 来控制 shader 效果的变化1、首先在属性面板暴露一个开关属性,用于配合shader_feature来控制…

解决deepspeed框架的bug:不保存调度器状态,模型训练重启时学习率从头开始

deepspeed存在一个bug,即在训练时不保存调度器状态,因此如果训练中断后再重新开始训练,调度器还是会从头开始而不是接着上一个checkpoint的调度器状态来训练。这个bug在deepspeed的github中也有其他人提出:https://github.com/mic…

清理Maven仓库中下载失败的文件

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

【SpringBoot】统一功能处理

目录 🎃1 拦截器 🎀1.1 拦截器的代码实现 🎨1.2 拦截器的实现原理 🧶2 拦截器应用——登录验证 🦺3 异常统一处理 🎭4 统一数据返回格式 🧤4.1 为什么需要统一数据返回格式 🧣4.2 统…

Cisco Packet Tracer入门篇

💐 🌸 🌷 🍀 🌹 🌻 🌺 🍁 🍃 🍂 🌿 🍄🍝 🍛 🍤 📃个人主页 :阿然成长日记 …

Python中的文件I/O操作:常见问题与解决方案

在Python编程中,文件I/O操作是常见的任务。本文将介绍一些关于Python文件I/O操作的常见问题及其解决方案,并提供详细的代码示例。 1、问题:如何正确地打开和关闭文件? 解决方案:使用with语句可以确保文件在操作完成后…

查漏补缺 - ES6

目录 1,let 和 const1,会产生块级作用域。2,如何理解 const 定义的变量不可被修改? 2,数组3,对象1,Object.is()2,属性描述符3,常用API4,得到除某个属性之外的新对象。 4…

华为云云服务器评测|使用Docker可视化Portainer部署Yolov5项目进行AI识别

目录 初始化配置使用Xshell连接 项目准备 docker-compose Dockerfile .dockerignore 在服务器中启动Docker项目 初始化配置使用Xshell连接 因为我比较喜欢用xshell来操作服务器,如果你是使用华为在线的CloudShell或其他方式,可以跳过第一步的连接…

【Redis专题】Redis持久化、主从与哨兵架构详解

目录 前言课程目录一、Redis持久化1.1 RDB快照(Snapshot):二进制文件基本介绍开启/关闭方式触发方式bgsave的写时复制(COW,Copy On Write)机制优缺点 1.2 AOF(append-only file)&…

Git—版本控制系统

git版本控制系统 1、什么是版本控制2、常见的版本控制工具3、版本控制分类3.1、本地版本控制3.2、集中版本控制 SVN3.3、分布式版本控制 Git 4、Git与SVN的主要区别5、Git环境配置6、启动Git7、常用的Linux命令8、Git配置9、设置用户名与邮箱(用户标识,必…

数学建模--逻辑回归算法的Python实现

首先感谢CSDN上发布吴恩达的机器学习逻辑回归算法任务的各位大佬. 通过大佬的讲解和代码才勉强学会. 这篇文章也就是简单记录一下过程和代码. CSDN上写有关这类文章的大佬有很多,大家都可以多看一看学习学习. 机器学习方面主要还是过程和方法. 这篇文章只完成了线性可分方面的任…

Mac Homebrew中常用的 Brew 命令

Mac 中常用的 Brew 命令集 Brew(Homebrew)是一个强大的包管理器,用于在 macOS 上安装、更新和管理各种软件包。它使得在 Mac 上安装开发工具、应用程序和库变得轻松和便捷。本博客将介绍一些在 Mac 中常用的 Brew 命令,以帮助您更…

SpringMVC_SSM整合

一、回顾SpringMVC访问接口流程 1.容器加载分析 容器分析 手动注册WebApplicationContext public class ServletConfig extends AbstractDispatcherServletInitializer {Overrideprotected WebApplicationContext createServletApplicationContext() {//获取SpringMVC容器An…

UDP的可靠性传输

UDP系列文章目录 第一章 UDP的可靠性传输-理论篇(一) 第二章 UDP的可靠性传输-理论篇(二) 文章目录 UDP系列文章目录前言1.TCP 和UDP格式对比2.UDP分片原理3.UDP 传输层应该注意问题4.MTU5.UDP 分片机制设计重点 一、ARQ协议什么…