机器学习100天,今天讲的是:多项式回归理论! 在前两期视频我们讲解了简单线性回归理论,并解决了一个房价预测的问题,建立了一个房价与地区人口的线性关系。然而,如果数据的分布不是简单的线性关系,又该怎么做呢? 一、多项式回归 我们来看一个例子,在这个二维平面上,横坐标是人口,纵坐标是房价。红色的点就表示每个地区的实际人口与房价的对应关系。 我们可以发现如果把人口当成自变量 X,把房价当成因变量 y,可以明显看到,此时,y 与 X 并不呈现简单的线性关系。我们无法用一条直线来拟合真实的数据,比如这样。 但是,我们可以发现,y 与 X 呈现一种二次函数的关系,就像这样: 那么,我们就可以用: y