自动控制：最小二乘估计（LSE）、加权最小二乘估计（WLS）和线性最小方差估计

news2026/3/5 12:20:15

自动控制：最小二乘估计（LSE）、加权最小二乘估计（WLS）和线性最小方差估计

在数据分析和机器学习中，参数估计是一个关键步骤。最小二乘估计（LSE）、加权最小二乘估计（WLS）和线性最小方差估计（LMMSE）是几种常见的参数估计方法。这篇博客将详细介绍这些方法及其均方误差（MSE）的计算，并通过Python代码实现这些方法。

1. 最小二乘估计 (LSE)

公式与推导

给定一个线性模型：
$X\beta + \epsilon$
其中：

$y$ 是观测向量，
$X$ 是设计矩阵，
$\beta$ 是待估计的参数向量，
$\epsilon$ 是误差向量，假设其服从正态分布，均值为零，协方差矩阵为 $\sigma^2 I$ 。

最小二乘估计是通过最小化残差平方和来估计参数 $\beta$ ：
$\hat{\beta}_{\text{LSE}} = (X^T X)^{-1} X^T y$

均方误差 (MSE)

均方误差定义为：
$\text{MSE} = \mathbb{E}\left[ (\beta - \hat{\beta})^T (\beta - \hat{\beta}) \right]$

对于最小二乘估计，均方误差为：
$\text{MSE}_{\text{LSE}} = \sigma^2 \text{tr}\left( (X^T X)^{-1} \right)$

2. 加权最小二乘估计 (WLS)

公式与推导

当观测值有不同的方差时，使用加权最小二乘估计。假设误差向量 $\epsilon$ 的协方差矩阵为 $\Sigma$ ，加权最小二乘估计为：
$\hat{\beta}_{\text{WLS}} = (X^T \Sigma^{-1} X)^{-1} X^T \Sigma^{-1} y$

均方误差 (MSE)

加权最小二乘估计的均方误差为：
$\text{MSE}_{\text{WLS}} = \sigma^2 \text{tr}\left( (X^T \Sigma^{-1} X)^{-1} \right)$

3. 线性最小方差估计 (LMMSE)

公式与推导

线性最小方差估计考虑了观测误差和先验信息。假设 $\beta$ 是一个随机向量，均值为 $\mu_\beta$ ，协方差矩阵为 $\Sigma_\beta$ ，误差 $\epsilon$ 的协方差矩阵为 $\Sigma_\epsilon$ 。LMMSE的公式为：
$\hat{\beta}_{\text{LMMSE}} = \Sigma_\beta X^T (X \Sigma_\beta X^T + \Sigma_\epsilon)^{-1} y$

均方误差 (MSE)

LMMSE的均方误差为：
$\text{MSE}_{\text{LMMSE}} = \Sigma_\beta - \Sigma_\beta X^T (X \Sigma_\beta X^T + \Sigma_\epsilon)^{-1} X \Sigma_\beta$

示例代码

下面的Python代码展示了如何计算LSE、WLS和LMMSE以及相应的均方误差。

import numpy as np
import matplotlib.pyplot as plt

def compute_LSE(X, y):
    # 最小二乘估计
    beta_hat_LSE = np.linalg.inv(X.T @ X) @ X.T @ y
    return beta_hat_LSE

def compute_WLS(X, y, Sigma):
    # 加权最小二乘估计
    Sigma_inv = np.linalg.inv(Sigma)
    beta_hat_WLS = np.linalg.inv(X.T @ Sigma_inv @ X) @ X.T @ Sigma_inv @ y
    return beta_hat_WLS

def compute_LMMSE(X, y, mu_beta, Sigma_beta, Sigma_epsilon):
    # 线性最小方差估计
    Sigma_beta_XT = Sigma_beta @ X.T
    inv_term = np.linalg.inv(X @ Sigma_beta_XT + Sigma_epsilon)
    beta_hat_LMMSE = mu_beta + Sigma_beta_XT @ inv_term @ (y - X @ mu_beta)
    return beta_hat_LMMSE

def compute_MSE_LSE(X, sigma):
    # LSE的均方误差
    MSE_LSE = sigma ** 2 * np.trace(np.linalg.inv(X.T @ X))
    return MSE_LSE

def compute_MSE_WLS(X, Sigma, sigma):
    # WLS的均方误差
    Sigma_inv = np.linalg.inv(Sigma)
    MSE_WLS = sigma ** 2 * np.trace(np.linalg.inv(X.T @ Sigma_inv @ X))
    return MSE_WLS

def compute_MSE_LMMSE(X, Sigma_beta, Sigma_epsilon):
    # LMMSE的均方误差
    term = Sigma_beta @ X.T @ np.linalg.inv(X @ Sigma_beta @ X.T + Sigma_epsilon)
    MSE_LMMSE = np.trace(Sigma_beta - term @ X @ Sigma_beta)
    return MSE_LMMSE

# 示例数据
np.random.seed(0)
n = 100
p = 5
X = np.random.randn(n, p)
beta_true = np.random.randn(p)
y = X @ beta_true + np.random.randn(n)

# 计算LSE
beta_hat_LSE = compute_LSE(X, y)
print("LSE:", beta_hat_LSE)

# 计算WLS
Sigma = np.diag(np.random.rand(n))  # 假设误差的协方差矩阵为对角矩阵
beta_hat_WLS = compute_WLS(X, y, Sigma)
print("WLS:", beta_hat_WLS)

# 计算LMMSE
mu_beta = np.zeros(p)
Sigma_beta = np.eye(p)
Sigma_epsilon = np.eye(n)
beta_hat_LMMSE = compute_LMMSE(X, y, mu_beta, Sigma_beta, Sigma_epsilon)
print("LMMSE:", beta_hat_LMMSE)

# 计算均方误差
sigma = 1
MSE_LSE = compute_MSE_LSE(X, sigma)
MSE_WLS = compute_MSE_WLS(X, Sigma, sigma)
MSE_LMMSE = compute_MSE_LMMSE(X, Sigma_beta, Sigma_epsilon)
print("MSE_LSE:", MSE_LSE)
print("MSE_WLS:", MSE_WLS)
print("MSE_LMMSE:", MSE_LMMSE)

代码说明

compute_LSE: 计算最小二乘估计（LSE）。
compute_WLS: 计算加权最小二乘估计（WLS）。
compute_LMMSE: 计算线性最小方差估计（LMMSE）。
compute_MSE_LSE: 计算LSE的均方误差（MSE）。
compute_MSE_WLS: 计算WLS的均方误差（MSE）。
compute_MSE_LMMSE: 计算LMMSE的均方误差（MSE）。

在这里插入图片描述

运行上述代码，可以得到最小二乘估计、加权最小二乘估计和线性最小方差估计的结果以及相应的均方误差：

LSE: [ 0.00203471  0.21309766  1.05822246 -0.56680025  1.45839468]
WLS: [ 0.0597175   0.15308323  1.07124848 -0.59091883  1.47423845]
LMMSE: [-0.13400144  0.04498152  0.8584689  -0.71304874  1.25876277]
MSE_LSE: 5.008474
MSE_WLS: 0.13285989867054735
MSE_LMMSE: 1.2825935217514267