目录
1.机械学习的过程
2.线性模型
推荐课程:2.线性模型_哔哩哔哩_bilibili
1.机械学习的过程
机械学习的过程: 1.准备数据集DataSet——>2.选择模型Model——>3.训练Training——>4.推理Infering
监督学习:用已知标签的训练样本训练模型,用来预测未来输入样本的标签,如用于逻辑回归分类器。
注:经过训练,输入新的数据能推测出输出。
注:数据集策略,将数据集一分为二,一部分为训练集,一部分为开发集。训练集进行训练,开发集进行性能评估。
2.线性模型
线性模型: , = 随机参数
注:这个机械学习开始伴随一个随机参数,是预测值y_predict ,是权重,y是真值point,loss为损失值Training Loss,cost为平均损失值Mean Square Eorror。使用最小二乘法来求损失函数的最小值。
目标是寻找一个能使平均损失值接近0的权重 。
求平均损失值最低的权重方法:穷举法,绘制损失曲线。
import numpy as np
import matplotlib.pyplot as plt
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
# 预测值函数
def forward(x):
return x * w
# 误差值函数
def loss(x, y):
y_pred = forward(x)
return (y_pred - y) * (y_pred - y)
# 权重列表
w_list = []
# 误差值列表
loss_list = []
# 权重w=0.0,0.1,0.2,0.3.....4.1
for w in np.arange(0.0, 4.1, 0.1):
print('w=', w)
l_sum = 0
# x,y来自x_data, y_data列表
for x_val, y_val in zip(x_data, y_data):
# 求预测值
y_pred_val = forward(x_val)
# 求误差值
loss_val = loss(x_val, y_val)
# 求总误差值
l_sum += loss_val
print('\t',x_val, y_pred_val, loss_val)
# 求平均误差值 cost,也叫MSE
print('MSE=',l_sum / 3)
# w,loss列表
w_list.append(w)
loss_list.append(loss_val)
plt.plot(w_list,loss_list)
plt.ylabel('loss')
plt.xlabel('w')
plt.show()
纵轴为loss,横轴为