文章目录
- 前言
- Part1 聊聊技术
- 1 人工智能、机器学习和深度学习的关系
- 2 优化思想的一个案例
- part2 聊聊业务
- 3 工业人工智能与消费互联网人工智能的区别
- 3.1 消费互联网中人工智能的应用
- 3.2 为什么如此成熟的消费互联网人工智能扩展到工业场景那么难
- 4 工业互联网人工智能的发展方向与趋势
- part3 小总结一下
前言
本文旨在用最白话的语言,写清楚人工智能以及实现人工智能常用的算法的本质。
Part1 聊聊技术
1 人工智能、机器学习和深度学习的关系
人工智能是一个宽泛的学科,本质上其实是让机器(计算机)代替人进行学习和思考,能够帮助人类处理很多人类不想做的工作。
人工智能可以通过机器学习的方法去实现,所以机器学习是一个实现人工智能的工具,机器学习本质上就是从积累的数据集中找到规律,当后面在遇到类似的问题后,就可以套用这个规律,以实现自动的判断。
机器学习分为以下几部分:
1-数据采集
2-数据处理
3-特征工程
4-选择模型
5-训练模型
6-保存模型
我再刚开始接触机器学习的时候,把机器学习理解成解数学方程式,拼命的去学高等数学,线性代数,概率论等,不是说学习这些数学知识没有用,而是机器学习的概念并不是解数学方程式,机器学习是一个优化的思想,类似一个学生,学习文言文的过程,学生要不断地学习,直到能够实现背诵,机器也是一样的,不断地通过历史数据学习,不断地降低预测值与实际值之间的差距,通过优化思想去看待机器学习是一个关键的转变,一定不要把机器学习理解成解数学方程,那就大错特错了。
机器学习有很多经典的算法,比如线性回归、逻辑回归、随机森林、支持向量机等等。。。。机器学习算法理论上可以解决很多问题,但是为什么在计算机算力不断发展之后会出现深度学习呢,没错,因为特征工程,机器学习还是要依靠人工去选择特征,转变特征,最终将明显的特征值带入到机器学习算法中进行训练,但是有很多场景,我们不能找到很明显的特征,这就导致机器不能很好的学习,深度学习就是能够解决特征问题,神经网络的本质就是多个线性回归叠加在一起了,通过激活函数实现非线性变换,实现复杂场景的拟合。
2 优化思想的一个案例
剖出实际场景
假设有一个X为一维向量,对于一个y为一维向量,特征X,结果y,做为训练数据。
X 和 y 之间的关系可以表示成:
y = theta1 * X + theta0
theta1: 斜率
theta0: 偏置
我们的目标是:找到一个合理的theta1和theta0,能够实现,y预测值与y真实值相差最小。
数学方法解题
y预测值 用符号 y^表示
y真实值 用符号y表示
loss = (theta1 * X + theta0 - y)^2
通过计算 loss函数关于theta1的偏导数,和theta0的偏导数,如果偏导数为0,等于达到了最优,那么这个时候的theta1和theta0的解就是我们要找到最优解。
有些场景可以直接计算得到这个最优解,但,这不是机器学习的思想
机器学习的思想(优化)
X = [1,2,3,4,5,6,7,8]
y = [2,4,5,9,9,13,13,17]
count = 0 # 记录训练次数
# 训练100次
# 初始化参数
## 学习率
learning_rate = 0.001
## 初始值
theta0 = 0
theta1 = 0
## 偏导数
m = len(X) # 样本个数
loss_list = []
# 计算偏导数
for i in range(100):
temp0 = 0
temp1 = 0
for i in range(m):
temp0 += 1/m*(theta0+theta1*X[i]-y[i])
temp1 += 1/m*(theta0+theta1*X[i]-y[i])*X[i]
# 优化
for i in range(m):
theta0 = theta0 - learning_rate * temp0
theta1 = theta1 - learning_rate * temp1
# 计算损失值
loss=0
for i in range(m):
loss += np.power(theta0+theta1*X[i]-y[i],2)
loss_list.append(loss)
count += 1
#print(f"loss:{loss}, theta0:{theta0}, theta1:{theta1}")
y_pred_list = []
for i in range(m):
y_pred = theta1 * X[i] + theta0
y_pred_list.append(y_pred)
plt.plot(X, y_pred_list, c='r')
plt.scatter(X, y, c='g')
plt.show()
plt.scatter(range(0,count), loss_list)
plt.show()
看红色的线慢慢找到绿色的点的过程
损失函数的逐步优化过程
其实机器学习的本质就是让预测值与真实值无限接近就可以了
part2 聊聊业务
3 工业人工智能与消费互联网人工智能的区别
3.1 消费互联网中人工智能的应用
抖音–推荐系统
抖音账号是每个人的隐藏ID card,每个人的兴趣、爱好、都被他默默地学习到了,所以你会一直默默地滑下去,一直期待下一个会是一个什么样的视频,似乎抖音从来没有让你失望过。
淘宝 京东 人物画像
淘宝会给你推荐你喜欢买的东西,结合你的朋友圈,购买历史,收藏夹,给你很多推荐
天气预报
天文台对天气进行预报
滴滴打车
路径规划、
高德地图
车道追踪,十字路口红灯倒计时
…
3.2 为什么如此成熟的消费互联网人工智能扩展到工业场景那么难
先来讲一个案例:
同为温度预测,生活中的天气预报,工业生产中的温度预测
-
生活中的预测
输入的预测数据都是结构化的,经过整理后的非常干净的历史数据集
假设天气预报预测到明天最高气温36度,实际可能是30度到40度之间的场景都有可能,但是对于这个预测的结果没有人会觉得他有问题,同样也不会有任何的风险(回归任务)
预测到明天下雨,如果没下,依据无可厚非(分类任务)
小结一下:数据基础好,历史数据完善,预测结果不会对实际有多大的影响,可以接受不离谱的任何预测结果 -
工业生产中的预测
输入的预测数据大多数是结构化时间序列的,有异常值,有空值
假设我们通过预测生产中需要的环境温湿度来控制空调,假设通过历史数据进行预测,预测到下一个时间段应需要24度,如果预测的不准,高了,低了,会直接影响到质量,这样会造成得不偿失,所以工业里面需要的是非常精确的预测,如果偏差一两个摄氏度对于非工业场景来说,可能是很好了,但是在工业场景里面还远远不够
小结一下:工业场景数据差,但是精度要求高,不接受任何影响质量的预测值
另外一个案例:
关于PID这个经典的控制算法
-
PID的优势
PID算法非常的经典,能够做到很好的反馈控制,说实话,即便是AI控制,也无法摆脱PID算法,因为PID算法太稳定了,工业不需要花里胡哨,只需要稳定可靠,不崩溃 -
PID的劣势(这里才是AI唯一存在的空间)
PID对于大滞后的环节会有滞后性,比如楼宇温度控制,冷源做功增加,到室内温度下降,一般需要一定的时间滞后性,当你传感器反馈到温度到达设定值之后,可能还要继续调节,这就是超调和震荡,AI能够做的就是,能够提前告诉你,什么时候停止,就可能达到这个设定值了,避免超调,所以现在大多数的工业人工智能都在做的一件事情就是把波浪线拉成一条直线。
总结一下,工业人工难落地的原因
1.数据质量差,这是大家常听到的
2.特征工程差,不清楚影响这个预测值到底有多少特征
3.时间难对齐,不清楚某个因素改变后多久,这个预测值会有变动,同时,某个因素改变后,其他的因素是否改变,如何改变,有哪些影响都是未知的,所以这是一个超大的,未知的,特征空间,我们通过学习工艺,大多数清楚了哪些因素是影响这个预测值的主要特征值,但是这些特征值以什么样的方式进行组合,以什么样的损失函数作为优化目标,以什么样的网络结果进行搭建,这其实是一个玄学,所以AI目前只能是工程化,不能产品化和批量化。
4 工业互联网人工智能的发展方向与趋势
工业人工智能这个赛道要活下去有几点:
- 选对行业,其实行业没有对错,但是一定要熟悉这个行业
- 先探索工艺,熟悉工艺是第一步
- 要准备好降维打击,最起码要懂的、机理、自动控制、数据科学、最后才是你的建模技术
- 要有长时间驻扎在设备面前的决心
- 要有能够承受失败的能力,无论是信心还是money,珍惜每一次客户给你的尝试机会
未来的很长一段时间,工业AI依旧是工程化的时代,期待能够在5年后,实现工业AI的产品化,我会一直为产品化贡献力量。
part3 小总结一下
选择做一件困难且正确的事情很难,坚持做一件困难且正确的事情就更难了。
如何把一个相对“”“玄学”的问题解决掉,如何结合多个学科,实现跨学科交叉,以业务优化为导向去实现人工智能真正的低成本赋能,需要能静下心来,好好思考,才有可能能够解决,期待能够在茫茫人海,能够遇到一起能够心无杂念做难而正确事情的小伙伴。
我相信并坚持的一句话是“程序员改变世界“,不忘初心,砥砺前行!