1.吴恩达机器学习课程笔记：正规方程法

笔记来源：
1.吴恩达机器学习课程笔记：正规方程法
2.神经网络 - 多元线性回归 - 正规方程法

仅作为个人学习笔记，若各位大佬发现错误请指正

正规方程法区别于梯度下降法的迭代求解，属于直接求解方程得到参数的最优解
正规方程法可直接使用特征的值，无需对特征的值进行缩放，而梯度下降法需要对特征的值进行缩放

假设函数
$h_{\theta}(x)=\theta_0\vec{x_0}+\theta_1\vec{x_1}+\theta_2\vec{x_2}+\cdots+\theta_n\vec{x_n}\\ ~\\ h_{\theta}(x)=\bold{X\cdot \vec{\theta}}\\ ~\\ \vec{\theta}=\begin{pmatrix}\theta_0\\\theta_1\\ \vdots\\ \theta_n \end{pmatrix}\ X=\begin{pmatrix}\vec{x_0},\vec{x_1},\vec{x_2},\cdots,\vec{x_n}\end{pmatrix}\\$
$h_{\theta}(x)=\bold{X\cdot \vec{\theta}}=\vec{y}$
我们需要求解出矩阵 $\vec{\theta}$ ，所以我们需要 $X$ 为可逆矩阵，也就是需要其为方阵，但由于样本数量与特征数量不一定是相等的，故 $X$ 不一定是方阵，但我们可以构造出方阵，即 $X^TX$ ，如果此方阵可逆，这样我们就可以求解出矩阵 $\vec{\theta}$
下面我们左右同乘矩阵 $X^T$
本人笔记：最小二乘估计（Least Squares Approximations）、拟合（Fitting）
$X^TX\cdot \vec{\theta}=X^T\vec{y}$
求出 $X^TX)^{-1}$
$\vec{\theta}=(X^TX)^{-1}X^T\vec{y}$
什么原因会造成矩阵 $X^TX$ 变为不可逆矩阵？
笔记来源：正规方程在矩阵不可逆情况下的解决方法