引言

这是中科大最优化理论的笔记，中科大凌青老师的凸优化课程，详尽易懂，基础扎实。不论是初学者还是从业多年的人，都值得系统地好好学一遍。

本文主要介绍什么是凸优化，通过几个例子来阐述什么是凸优化问题。让大家有一个感性的认知。

优化/数学规划

优化(Optimization)或称为数学规划(Mathematical Programming)是从一个可行解的集合中，寻找出最优的元素。

任何一个优化问题，可以写成下面这样的形式：
$\begin{aligned} \text{minimize}\ &f_0(x)\\ \text{subject to}\ &f_i(x)\leq b_i,\ \ \ i=1,\dots,m\\ \end{aligned} \tag{1}$
我们要最小化 $f_0(x)$ ，同时有一些约束，使得 $f_i(x) \leq b_i$ ，总共有 $m$ 个约束。

这里 $x$ 一般来说是一个 $n$ 维的向量， $x=[x_1,\cdots,x_n]^T$ ，称为优化变量(ptimization variable)；

函数 $f_0: R^n \rightarrow R$ ，称为目标函数(objective function)，是一个从 $n$ 维到 $1$ 维的映射。

函数 $f_i:R^n \rightarrow R, i=1,\cdots,m$ 为不等式约束(inequality constraint)函数，而一个等式约束可以写成两个不等式约束，这里为了简便，就不写出等式约束了；

优化问题的解，最优的 $x$ 记为 $x^*$ ，等价于 $\forall z \in R^n$ ，对于 $\in \{f_i(z) \leq b_i, i=1,\cdots,m \}$ ，总是有 $f_0(z) \geq f_0(x^*)$ ，即对于所有满足约束条件的 $z$ ，其结果都不会好于最优解。

集合 $\{f_i(z) \leq b_i, i=1,\cdots,m \}$ 是可行解集合(feasible set)，即所有满足约束点的集合。

这里描述的是一般的优化问题，任何一般的优化问题都可以写成这样的形式。

这里的数学公式优点抽象，下面我们来看一些优化问题的例子。

一维例子1

如上图，假设我们要优化这样一个目标函数，约束是：
$\leq a \\ -x \leq a$
相当于 $\in [-a,a]$ 之间，可行解集为 $- a$ 到 $a$ 之间所有的点所构成的点集。最优解是在上图 $x^*$ 处。

如果我们把该曲线改一下：

一维例子2

同样于 $\in [-a,a]$ 之间，这个问题看起来有两个最优解，没错，该问题的最优解集是由这两个点所构成的集合。

所以最优解并不一定只有一个，一般只有一个最优解的问题会简单一点。

应用

本小节介绍几个例子。

数据拟合问题

假设我们通过一个实验得到一些散点，我们想把这些散点拟合成一条线。

IMG_6CB7BBFAA16C-1

如上图，现在有 $(x_1,y_1),\cdots,(x_n,y_n)$ 这些点，假设这条线是一个二次曲线。

可以写成： $y=ax^2 + bx+c$

其中 $x, y$ 可以通过测量知道，而 $a, b, c$ 是需要估计的参数。

而测量是有误差的，我们目标是使得测量误差尽可能小，所以用最小二乘准则
$\min \quad \epsilon_1^2 + \epsilon_2^2 + \cdots + \epsilon_n^2$
其中 $\epsilon_i = y_i - (ax_i^2 + bx_i +c), \quad i=1,\cdots ,n$

即，我们要使所有测量误差的平方和尽可能的小，这就是一个最小二乘问题。这是一个很典型的优化问题。

图像处理

假设给定一个二维图像 $\Phi_0(x,y)$ ，且该图像是带噪声的，希望恢复出一个不带噪声的图像 $\Phi(x,y)$ 。

其中 $x, y$ 两个坐标轴。

我们知道所有的图像都是有一定的规律，图像具有分片光滑性，即图片中通常具有很大的色块。这些色块为我们提供了先验知识，使得图像的TV范数尽可能小。

TV范数(Total Variation)表示的意义是使图像分片光滑的，可以定义如下：
$||\Phi||_{TV} = \sum_y\sum_x \sqrt{(\Phi(x,y)-\Phi(x,y-1))^2 + (\Phi(x,y)-\Phi(x-1,y-1))^2}$
表示对图像做两个方向上的差分，然后计算平方，再求和，最后取根号。

对于任何一个分片光滑的图像，它的TV范数一定都是比较小的。有了这样一个先验知识后，我们就可以写出这样一个优化问题：
$\min_\Phi \quad ||\Phi||_{TV} + \lambda ||\Phi - \Phi_0||_F^2$
我们要找到一个这样的 $\Phi$ ，它的TV范数要尽可能的小，实际上就是一个分片光滑的图片。上式后面那一项是规范化项，因为我们要求 $\Phi$ 不光是分片光滑的，还希望 $\Phi$ 与 $\Phi_0$ 比较接近。即这两个矩阵之差的F范数要尽可能的小。

这个模型就是图像中非常著名的TV-L2模型。

优化问题的分类

优化问题按照不同的角度可以分成哪些类呢？

线性规划/非线性规划

线性规划就是说，优化问题的目标函数和所有的约束函数均为线性函数。

那什么是线性函数？

若某数学函数或数量关系的函数图像呈现一条直线或线段，那么这种关系就是一种线性的关系，该函数称为线性函数。

在线性代数中，线性函数时一个线性映射，是在两个向量空间之间，维持向量加法与标量乘法的映射。
$\begin{aligned} f(a + b) &= f(a) + f(b) \\ f(ka) &= kf(a) \end{aligned}$
回到凸优化中，线性规划的函数满足
$f_i(\alpha x + \beta y) = \alpha f_i(x) + \beta f_i(y) \quad i=0,1,\cdots,m$
对于一个优化问题，它的这些函数都是线性函数的化，那么这个问题就是线性规划问题。