机器学习100天,今天讲的是简单线性回归理论。
首先来看第一个问题:什么是线性回归?我们先引入一个例子。
假如我现在有一份数据,这份数据是一些地区人口和对应房价的信息。我们把这份数据展示在二维平面上。横坐标是人口,纵坐标是房价,红色的点就表示每个地区的实际人口与房价信息。
在图中,我们可以发现如果把人口当成自变量 X,把房价当成因变量 y 的话,y 与 X 是呈现一种近似线性关系的。那么,我们就能找到一条最接近真实情况的直线来表示这个模型。这样的话,如果有样本外的数据,得知该地区的人口,我们就可以利用这个模型来预测该地区的房价!
这就是简单的线性回归问题。
那么,我们一般用 y ^ = w 0 + w 1 ∗ x \hat y=