一、前言

之前讲了计算机从发展到现在的过程，计算机很适合做迭代的工作
擅长存放、整理、获取、处理大量的数据
但是想根据谁做决定，就要牵扯到机器学习，这也是ML的本质
ML算法可以让计算机从数据中学习，然后自行做出预测&决定

机器学习虽然有用，但是不会被定义为智能
虽然ML AI 这两个词语经常混用，但是大多数科学家会说ML是为了实现AI这个更加宏大目标的技术之一

二、ML

2.1 分类

classification
做分类的算法叫做 “分类器classifier”
虽然可以用照片声音训练算法，很多算法会减少复杂度，把数据简化为“特征features”

2.1.1 决策树

举个例子：分类飞蛾，有两个特征值：“翼展” “重量” “”
在这里插入图片描述

把决策空间切成几个分块的简单方法，可以用 “决策树decision tree”来表示
在这里插入图片描述
一些算法会用多个 decision tree 来预测，科学家称其为 “森林forest”

2.2.2 支持向量机

Suport Vector Machines
本质上是用任意线段来切分决策空间，不一定是直线，可以是多项式或者是其他数学函数，通过算法不断地对数据迭代，找出最好的线
在这里插入图片描述
再加入一个特征，触角长度，2D的平面就会变成3D的了

四个特征，四维度…上千维度

决策树 & 支持向量机这样的技术发源于统计学

2.2.3 人工神经网络

灵感来自于大脑里的神经元，神经元是细胞，用电信号化学信号来传输消息，神经元细胞从其他细胞得到一个或者多个输入值，然后做出反应输出信号值，很多很多神经细胞组成巨大的互联网络，能处理复杂的信息

计算机中的人造神经元也很类似，可以接受多个输入，然后整合并发出一个信号
在这里插入图片描述
它不用电信号，化学信号而是 input 数字 output 数字，形成神经元网络

回到上面的例子：看神经元如何分类

左侧需要被分类的单个飞蛾的数据（mass重量 wingspan翼展），右侧分类的结果
中间有一个隐藏层，负责把输入变成输出，分类

分类神经元：把输入* 权重，然后求sum
在这里插入图片描述
对于sum(权重*原始值) ，用一个偏差值(bias)处理: + or - 一个x
一开始，这些权重偏差值x都会是随机的，然后算法会调整这些值来训练
最后，神将元有激活函数，也叫做传递函数(应用于输出，对结果执行最后一次数学修改(把负数变成0、控制值在一个区间等))
在这里插入图片描述
这个过程会应用于多个神经元，如下图3个

在这里插入图片描述
最终一层，数字最高的就是结果

中间结果会有很多很多层，这便是深度学习

在这里插入图片描述
尽管神经网络50年前就发明了，但是限制于硬件的发展，最近5年才得到应用

以上，一个算法虽然能人脸识别，自动驾驶，但是也都是只能做一件事
这种被称为“弱AI Week AI” or “窄AI Narrow AI”，只能做特定的事情。
通用的AI，像人类一样可以处理各种算法的，叫做“强AI Strong AI”，目前还没有做出来，但是人来留下来的大量的数据，用作训练，可能就是点燃强AI的燃料，就像 ChatGPT。

AI自己不断地学习，阿尔法go 自己和自己下了上百万盘，自己发现成功的策略，这被称为“强化学习Reinforcement learning”