回归分析系列14— 多项式回归

news2026/2/20 16:56:10

17 多项式回归

17.1 简介

多项式回归是线性回归的一种扩展，它允许回归模型包括输入变量的高次项。这种方法特别适合处理非线性关系的数据。

17.2 多项式回归模型

在多项式回归中，模型形式如下：

$eq?y%20%3D%20%5Cbeta_0%20+%20%5Cbeta_1%20x%20+%20%5Cbeta_2%20x%5E2%20+%20%5Cdots%20+%20%5Cbeta_p%20x%5Ep%20+%20%5Cepsilon$

其中，p 是多项式的阶数，β0,β1,…,βp是待估计的系数。通过增加高次项，模型能够捕捉到输入变量与输出变量之间的非线性关系。

在Python中，我们可以使用scikit-learn中的PolynomialFeatures和LinearRegression类来实现多项式回归。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import make_pipeline

# 生成模拟数据
np.random.seed(42)
X = np.sort(np.random.rand(100, 1) * 10, axis=0)
y = 2 - 3 * X + X**2 + np.random.randn(100, 1) * 2

# 构建多项式回归模型
degree = 2  # 二次多项式
polyreg = make_pipeline(PolynomialFeatures(degree), LinearRegression())
polyreg.fit(X, y)

# 预测
X_fit = np.linspace(0, 10, 100).reshape(-1, 1)
y_pred = polyreg.predict(X_fit)

# 绘图
plt.scatter(X, y, color='blue')
plt.plot(X_fit, y_pred, color='red')
plt.xlabel('X')
plt.ylabel('y')
plt.title(f'Polynomial Regression (degree={degree})')
plt.show()

17.3 选择多项式的阶数

在多项式回归中，选择合适的多项式阶数非常重要。阶数过低可能导致欠拟合，而阶数过高则可能导致过拟合。通过交叉验证，可以帮助我们选择最合适的阶数。

from sklearn.model_selection import cross_val_score

# 定义不同阶数的多项式
degrees = [1, 2, 3, 4, 5]

# 评估不同阶数下的模型性能
for degree in degrees:
    polyreg = make_pipeline(PolynomialFeatures(degree), LinearRegression())
    scores = cross_val_score(polyreg, X, y, scoring='neg_mean_squared_error', cv=5)
    print(f"Degree {degree}: Mean Squared Error: {-scores.mean():.2f}")

17.4 高维数据中的多项式回归

在处理高维数据时，多项式回归容易产生过拟合问题。为了缓解这一问题，可以结合正则化技术，如岭回归或套索回归。

from sklearn.linear_model import Ridge

# 构建正则化的多项式回归模型
degree = 3
polyreg_ridge = make_pipeline(PolynomialFeatures(degree), Ridge(alpha=1.0))
polyreg_ridge.fit(X, y)

# 预测
y_pred_ridge = polyreg_ridge.predict(X_fit)

# 绘图
plt.scatter(X, y, color='blue')
plt.plot(X_fit, y_pred_ridge, color='red')
plt.xlabel('X')
plt.ylabel('y')
plt.title(f'Ridge Polynomial Regression (degree={degree})')
plt.show()

17.5 多项式回归的应用

多项式回归适用于许多实际问题，特别是当数据中存在明显的非线性关系时。例如，在经济学中，多项式回归可以用于预测非线性趋势的经济指标；在医学研究中，它可以用于建模药物剂量与疗效之间的复杂关系。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2062200.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！