文章目录
- 前言
- 一、How to find a function
- 二、Define Loss from Training Data
- 三、Optimization
- 总结
前言
机器学习(Machine Learning, ML)是一门让计算机通过数据来自动学习和改进的技术。它的核心理念是通过分析大量的历史数据来找到其中的规律,并利用这些规律来做出预测或决策。机器学习已经广泛应用于图像识别、语音识别、自然语言处理、推荐系统等领域。
一、How to find a function
以youtube为例
根据过往播放量数据预测次日播放量数据
先进行猜测:
y=b+wx₁
y是今日总共观看的人数
x₁是昨天总共观看的人数
y是要预测的东西
b和w是未知的参数,是需要通过资料找出来的
这一整个带有未知参数的函数就叫做模型
The function with unknown parameters is called Model
二、Define Loss from Training Data
定义Loss
L(b,w)
Loss输出的值代表把L设定某一个数值时,这个数值好还是不好。
假设
L(0.5k,1)
y=b+wx₁
y=0.5k+1x₁
将数据代入进行计算再将预估结果与真实值进行比对
计算出差值e₁=|y-^y|
最终算出平均绝对误差(Mean Absolute Error)
最终得出的L越大说明设定从参数越不好,越小越好
例:
等高线图
越偏红L越大
越偏蓝L越小
三、Optimization
解决最佳化问题
找到最佳的w和b使L最小
Gradient Descent(梯度下降法)
假设未知参数只有一个
L随w不同的值形成一个曲线
随机选取一个初始的点
计算w与L的微分
当斜率为正将w增大,当斜率为负w减小
增大或减小多少取决于斜率大小与η(learning rate)
learning rate自行设定,设置大学习快设置小学习慢
需要自己设置的东西叫做hyperparameters
两个参数时
假设初始值w⁰,b⁰
计算w⁰和b⁰的微分
不断更新最后找到最优的w和b
例:
总结
三个步骤