【物联网】简要介绍最小二乘法

【物联网】简要介绍最小二乘法—C语言实现

news2026/2/14 2:39:29

最小二乘法是一种常用的数学方法，用于拟合数据和寻找最佳拟合曲线。它的目标是找到一个函数，使其在数据点上的误差平方和最小化。

文章目录

- 基本原理
- 最小二乘法的求解
- 应用举例
- 使用C语言实现最小二乘法
- 总结

基本原理

假设我们有一组数据点 $x_1, y_1), (x_2, y_2), ..., (x_n, y_n)$ ，我们想要找到一个函数 $y = f (x)$ ，使得这个函数能够最好地拟合这些数据点。最小二乘法的基本思想是，我们要找到一个函数 $y = f (x)$ ，使得所有数据点到这个函数的距离的平方和最小。

我们定义每个数据点到函数的距离为残差 $residual_i$ ，即 $residual_i = y_i - f(x_i)$ 。我们的目标是最小化所有残差的平方和，即最小化误差平方和 $\sum_{i=1}^{n} residual_i^2$ 。

最小二乘法的求解

为了求解最小二乘法问题，我们需要选择一个合适的函数形式 $y = f (x)$ 。常见的函数形式包括线性函数、多项式函数、指数函数等。以线性函数 $y = a x + b$ 为例，我们可以通过最小化误差平方和 $S$ 来求解系数 $a$ 和 $b$ 。

首先，我们定义一个目标函数 $J (a, b)$ ，即 $\sum_{i=1}^{n} (y_i - (ax_i + b))^2$ 。我们的目标是找到使得 $J (a, b)$ 最小的 $a$ 和 $b$ 。为了达到这个目标，我们需要求解目标函数的偏导数，并令其为0。

对于目标函数 $J (a, b)$ ，我们分别对 $a$ 和 $b$ 求偏导数，并令其为0，即：

$\frac{\partial J}{\partial a} = 0$

$\frac{\partial J}{\partial b} = 0$

通过求解上述方程组，我们可以得到 $a$ 和 $b$ 的解，从而得到最佳拟合直线。

应用举例

最小二乘法在实际应用中具有广泛的应用。例如，在经济学中，最小二乘法可以用于估计经济模型的参数。在物理学中，最小二乘法可以用于拟合实验数据并得到物理定律的参数。在机器学习中，最小二乘法可以用于线性回归问题。

下面以线性回归问题为例，假设我们有一组房屋面积和价格的数据点，我们想要找到一个线性函数，使得能够最好地拟合这些数据点。我们可以使用最小二乘法来求解线性函数的参数。

假设我们的数据点为 $x_1, y_1), (x_2, y_2), ..., (x_n, y_n)$ ，我们要找到一个线性函数 $y = a x + b$ ，使得误差平方和 $\sum_{i=1}^{n} (y_i - (ax_i + b))^2$ 最小化。

通过求解目标函数的偏导数，并令其为0，我们可以得到 $a$ 和 $b$ 的解。最终，我们可以得到最佳拟合直线的参数。

使用C语言实现最小二乘法

#include <stdio.h>

// 定义最大数据点数量
#define MAX_DATA_POINTS 100

// 定义数据点结构体
typedef struct {
    double x;
    double y;
} DataPoint;

// 定义线性回归函数
void linearRegression(DataPoint* data, int n, double* a, double* b) {
    double sumX = 0, sumY = 0, sumXY = 0, sumX2 = 0;
    for (int i = 0; i < n; i++) {
        sumX += data[i].x;
        sumY += data[i].y;
        sumXY += data[i].x * data[i].y;
        sumX2 += data[i].x * data[i].x;
    }
    double denominator = n * sumX2 - sumX * sumX;
    *a = (n * sumXY - sumX * sumY) / denominator;
    *b = (sumY * sumX2 - sumX * sumXY) / denominator;
}

int main() {
    int n;
    DataPoint data[MAX_DATA_POINTS];

    // 输入数据点数量
    printf("Enter the number of data points: ");
    scanf("%d", &n);

    // 输入数据点的 x 和 y 值
    printf("Enter the data points (x, y):\n");
    for (int i = 0; i < n; i++) {
        printf("Data point %d: ", i+1);
        scanf("%lf %lf", &data[i].x, &data[i].y);
    }

    double a, b;
    linearRegression(data, n, &a, &b);

    // 输出线性回归的结果
    printf("Linear regression equation: y = %.2fx + %.2f\n", a, b);

    return 0;
}