最小二乘法拟合直线、曲线

news2026/2/9 5:32:24

参考文章：马同学马同学提供线性代数,微积分,概率论与数理统计,机器学习等知识讲解https://www.matongxue.com/madocs/818/

C++最小二乘法拟合-（线性拟合和多项式拟合）_尘中远的博客-CSDN博客_namespace gsl

最小二乘法—多项式拟合非线性函数 - 简书

最小二乘法，即：最小化误差的平方和 $\epsilon$ ：

$\epsilon =\sum_{i=1}^{m}\left ( y-y_{i} \right )^{2}$

其中， $m$ 为样本点的数量， $y$ 为预测值， $y_{i}$ 为当前值。

直线拟合：线性拟合（一元函数）

如果想要根据输入数据拟合一条直线，那么 $y$ 可以表示为：

$y=ax+b$

则 $\epsilon$ 为：

$\epsilon =\sum_{i=1}^{m}\left ( ax_{i}+b-y_{i} \right )^{2}$

当a、b偏导数为0时， $\epsilon$ 最小：

$\frac{\partial \epsilon }{\partial a}=2\sum_{i=1}^{m}\left ( ax_{i}+b-y_{i} \right )x_{i}=0$

$\frac{\partial \epsilon }{\partial b}=2\sum_{i=1}^{m}\left ( ax_{i}+b-y_{i} \right )=0$

展开累加符号得：

$a\sum_{i=1}^{m}x^{2}_{i}+b\sum_{i=1}^{m}x_{i}=\sum_{i=1}^{m}x_{i}y_{i}$

$a\sum_{i=1}^{m}x_{i}+bm=\sum_{i=1}^{m}y_{i}$

根据克拉默（克莱姆）法则求解线性方程组（省略累加符号的上下限）：

$D=\begin{vmatrix} \sum x^{2}_{i} & \sum x_{i}\\ \sum x_{i}& m \end{vmatrix} , D_{1}=\begin{vmatrix} \sum x_{i}y_{i} & \sum x_{i}\\ \sum y_{i}& m \end{vmatrix} , D_{2}=\begin{vmatrix} \sum x_{i}^{2} & \sum x_{i}y_{i}\\ \sum x_{i}& \sum y_{i} \end{vmatrix}$

$a=\frac{D_{1}}{D}=\frac{m\sum x_{i}y_{i}-\sum x_{i}y_{i}}{m\sum x_{i}^{2}-\sum x_{i}\sum x_{i}}$

$b=\frac{D_{2}}{D}=\frac{\sum x_{i}^{2}\sum y_{i}-\sum x_{i}y_{i}\sum x_{i}}{m\sum x_{i}^{2}-\sum x_{i}\sum x_{i}}$

C++代码

template<typename T>
bool linearFit(const T* x, const T* y,size_t length)
{
	factor.resize(2,0);
	typename T t1=0, t2=0, t3=0, t4=0;
	for(int i=0; i<length; ++i)
	{
		t1 += x[i]*x[i];
		t2 += x[i];
		t3 += x[i]*y[i];
		t4 += y[i];
	}
factor[1] = (t3*length - t2*t4) / (t1*length - t2*t2);
factor[0] = (t1*t4 - t2*t3) / (t1*length - t2*t2);
return true;
}

曲线拟合：多项式拟合（多元函数）

如果想要根据输入数据拟合一条曲线，那么 $y$ 可以表示为：

$y=a_{0}+a_{1}x+a_{2}x^{2}+...+a_{n}x^{n}$

则 $\epsilon$ 为：

$\epsilon =\sum_{i=1}^{m}\left [ (a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+...+a_{n}x_{i}^{n})-y_{i} \right ]^{2}$

当 $a_{0}$ 、 $a_{1}$ 、 $a_{2}$ 、... $a_{n}$ 偏导数为0时， $\epsilon$ 最小：

$\left\{\begin{matrix} \frac{\partial \epsilon }{\partial a_{0}}=2\sum_{i=1}^{m}\left [(a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+...+a_{n}x_{i}^{n})-y_{i}\right]=0\\ \frac{\partial \epsilon }{\partial a_{1}}=2\sum_{i=1}^{m}\left [(a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+...+a_{n}x_{i}^{n})-y_{i}\right]x_{i}=0\\ \frac{\partial \epsilon }{\partial a_{2}}=2\sum_{i=1}^{m}\left [(a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+...+a_{n}x_{i}^{n})-y_{i}\right]x_{i}^{2}=0\\ ...\\ \frac{\partial \epsilon }{\partial a_{n}}=2\sum_{i=1}^{m}\left [(a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+...+a_{n}x_{i}^{n})-y_{i}\right]x_{i}^{n}=0 \end{matrix}\right.$

展开累加符号得（省略累加符号的上下限）：

$\left\{\begin{matrix} a_{0}n+a_{1}\sum x_{i}+a_{2}\sum x_{i}^{2}+...+a_{n}\sum x_{i}^{n}=\sum y_{i}\\ a_{0}\sum x_{i}+a_{1}\sum x_{i}^{2}+a_{2}\sum x_{i}^{3}+...+a_{n}\sum x_{i}^{n+1}=\sum x_{i}y_{i}\\ a_{0}\sum x_{i}^{2}+a_{1}\sum x_{i}^{3}+a_{2}\sum x_{i}^{4}+...+a_{n}\sum x_{i}^{n+2}=\sum x_{i}^{2}y_{i}\\ ...\\ a_{0}\sum x_{i}^{n}+a_{1}\sum x_{i}^{n+1}+a_{2}\sum x_{i}^{n+2}+...+a_{n}\sum x_{i}^{2n}=\sum x_{i}^{k}y_{i} \end{matrix}\right.$

写成矩阵相乘的形式：

$Ax=b$

其中

$A=\begin{bmatrix} n & \sum x_{i}& \sum x_{i}^{2} & ... & \sum x_{i}^{n} \\ \sum x_{i} & \sum x_{i}^{2}& \sum x_{i}^{3} & ... & \sum x_{i}^{n+1} \\ \sum x_{i}^{2} & \sum x_{i}^{3}& \sum x_{i}^{4} & ... & \sum x_{i}^{n+2} \\ ...& ...& ...& ...& ...\\ \sum x_{i}^{n} & \sum x_{i}^{n+1}& \sum x_{i}^{n+2} & ... & \sum x_{i}^{2n} \end{bmatrix}$

$x=\begin{bmatrix} a_{0}\\ a_{1}\\ a_{2}\\ ...\\ a_{n} \end{bmatrix}$

$b=\begin{bmatrix} \sum y_{i}\\ \sum x_{i}y_{i}\\ \sum x_{i}^{2}y_{i} \\ ...\\ \sum x_{i}^{k}y_{i} \end{bmatrix}$

A、b可根据样本数据集计算得到，然后使用高斯列主元消元法解线性方程组，得到x

计算A、b的C++代码

void polyfit(const T* x,const T* y,size_t length,int poly_n)
		{
			//将最优化偏导数的方程组写为矩阵乘法形式：Ax=b，其中A、b可根据待拟合的点集坐标计算得到，x为最终待求的多项式系数矩阵
			//利用高斯列主元消元法来求解Ax=b
			//3阶多项式f(x)=ax^3 + bx^2 + cx^1 + dx^0,可见n阶多项式，具有n+1个待求系数，需要n+1个方程组才能解出
			std::vector<double> factor;
            factor.resize(poly_n+1,0);
			int i,j;
			//求x加和的相关项（系数矩阵中有重复项）
			std::vector<double> tempx(length, 1.0);
			std::vector<double> sumxx(poly_n * 2 + 1);
			for (i=0;i<2*poly_n+1;i++){
				for (sumxx[i]=0,j=0;j<length;j++)
				{
					sumxx[i]+=tempx[j];
					tempx[j]*=x[j];
				}
			}
			//根据重复项规律求matrix_A
			std::vector<double> matrix_A((poly_n + 1)*(poly_n + 1));
			for (i=0;i<poly_n+1;i++)
				for (j=0;j<poly_n+1;j++)
					matrix_A[i*(poly_n+1)+j]=sumxx[i+j];
			//求y加和的相关项matrix_b
			std::vector<double> tempy(y, y + length);//通过y中0到length-1个元素初始化向量
			std::vector<double> matrix_b(poly_n + 1);
			for (i = 0; i < poly_n + 1; i++) {
				for (matrix_b[i] = 0, j = 0; j < length; j++)
				{
					matrix_b[i] += tempy[j];
					tempy[j] *= x[j];
				}
			}
			//求多项式系数x，用变量factor代替
			gauss_solve(poly_n+1, matrix_A, factor, matrix_b);
		}

高斯列主元消元法计算x的c++代码

		template<typename T>
		void gauss_solve(int n
			, std::vector<typename T>& A
			, std::vector<typename T>& x
			, std::vector<typename T>& b)
		{
			GaussElimination(n, &A[0], &x[0], &b[0]);
		}
		template<typename T>
		void GaussElimination(int n, T* A, T* x, T* b)
		{
			int i, j, k;         //索引
			int r;               //主元所在行数
			double maxValue;     //当前列中绝对值最大的值，即列主元
			double factor;       //消元系数
			double temp;         //临时变量

			//逐列进行消元
			for (k = 0; k < n - 1; k++)
			{
				//获取列主元所在行数r
				r = k;
				maxValue = fabs(A[k*n + k]);
				for (i = k + 1; i < n; i++)
				{
					if (maxValue < fabs(A[i*n + k]))
					{
						maxValue = fabs(A[i*n + k]);
						r = i;
					}
				}

				//交换行元素，当r == k时，不需要交换
				if (r != k)
				{
					//交换等号左侧系数矩阵的行元素
					for (i = 0; i < n; i++)
					{
						temp = A[k*n + i];
						A[k*n + i] = A[r*n + i];
						A[r*n + i] = temp;
					}
					//交换等号右侧向量的行元素
					temp = b[k];
					b[k] = b[r];
					b[r] = temp;
				}
				//cout << "第" << k + 1 << "次选取主元并交换行的顺序" << endl;
				//DispalyMatrix(n, (double*)A, b);

				//按列消元过程
				for (i = k + 1; i < n; i++)
				{
					factor = A[i*n + k] / A[k*n + k];
					for (j = k+1; j < n; j++) //j = k时更便于观察结果，但是出现冗余计算
					{
						A[i*n + j] = A[i*n + j] - factor * A[k*n + j];
					}
					b[i] = b[i] - factor * b[k];
				}
				//cout << "第" << k + 1 << "次消元" << endl;
				//DispalyMatrix(n, (double*)A, b);
			}

			//判断系数矩阵的奇异性
			if (A[k*n + k] < 0.0001)
			{
				//cout << "系数矩阵是非奇异矩阵,方程无唯一解!" << "\n";
			}

			//回代法，将消元后的上三角矩阵变为单位矩阵，b即为系数
			for (i = n - 1; i >= 0; i--)
			{
				temp = 0;
				for (j = i + 1; j < n; j++)
				{
					temp = temp + A[i*n + j] * b[j];
				}
				b[i] = (b[i] - temp) / A[i*n + i];
				x[i] = b[i];
			}

			//cout << "回代计算后的矩阵:" << "\n";
			//for (i = 0; i < n; i++)
			//{
			//	for (j = 0; j < n; j++)
			//	{
			//		if (i == j)
			//			A[i*n + j] = 1;
			//		else
			//			A[i*n + j] = 0;
			//	}
			//}
			//DispalyMatrix(n, (double*)A, b);
			//cout << "最后得方程的根为:" << "\n";
			//for (i = 0; i < n; i++)
			//	cout << "x" << i + 1 << "=" << b[i] << "\n";
		}
		//void DispalyMatrix(int n, const double *A, const double *b)
		//{
		//	int i, j;
		//	for (i = 0; i < n; i++)
		//	{
		//		for (j = 0; j < n; j++)
		//			cout << setw(4) << setprecision(4) << *(A + i * n + j) << "   ";
		//		cout << b[i] << endl;
		//	}
		//	cout << endl;
		//}

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/100746.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！