机器学习的原理是什么？

news2025/4/12 15:22:11

训过小狗没?
没训过的话总见过吧?

你要能理解怎么训狗，就能非常轻易的理解机器学习的原理.

比如你想教小狗学习动作“坐下”一开始小狗根本不知道你在说什么。但是如果你每次都说坐下”然后帮助它坐下，并给它一块小零食作为奖励，经过多次重复，狗就会学会当听到“坐下”这个词时就要坐下。

以此类推，小狗可以听懂各种指令，比如坐下，蹲下，握手等等

机器学习本质上跟教小狗一模一样，只不过机器学习不是一条狗或者一只猫，而是用的“模型“

我们用电脑和特殊的程序(叫做“模型”)来代替小狗。我们给电脑一堆数据，比如一堆照片，其中有些是猫，有些是狗。然后我们告诉电脑哪些是猫，哪些是狗(这叫“标签”)。电脑就像小狗一样，通过这些“示范”和“奖励”(或“惩罚”)来学习怎么区分猫和狗Q

比如“模型”每区分正确一张照片，就给它奖励一分，否则扣一分，然后我们设定了目标是分数越高越好，那么“模型”就会根据这个机制进行不断的学习，最后就成为了一个非常优秀的区分猫狗的“好模型”

但与教小狗不同，电脑可以快速地查看成千上万张照片，并从中学习。电脑也可以学习很多其他复杂的任务，比如识别人的声音、推荐你可能喜欢的音乐，甚至帮助医生诊断疾病。

从上面我们可以总结出来几个名词:

模型(Model)：模型就像是电脑的“大脑”的决策用来处理和学习数据。你可以想象它为一个迷工厂，输入数据进去，输出结果。
数据集(Dataset)：数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。
标签(Label)：标签是对数据集中每一项数据的解释或标记。比如，在一个由猫和狗照片组成的数据集中，每张照片会被标签为“猫”或“狗”。
训练(Train)和测试(Test)：训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。
奖励(Reward)和惩罚(Punishment)：在某些机器学习模式中，模型会根据其预测的准确性获得奖励或惩罚。监督学习
(Supervised Learning) 和无监督学习 (Unsupervised
Learning)：在监督学习中模型从带有标签的数据中学习。在无监督学习中，数据没有标签，模型需要自己找出数据的结。

从上面来看其实我们归纳一下，机器学习就是让电脑通过数据和例子来学习做某件事，而不是由人直接编程告诉它每一步应该怎么做。

这一句话会有点儿难懂，那么还是拿训练计算机去分辨猫狗照片来举例。

我们想要做的是让计算机去自动的学会分辨猫和狗，而不是告诉计算机这是一张哈士奇的图，另张是金毛。

这跟自动的分辨有什么区别呢?

区别就在于“学习”，因为猫和狗不像是阿拉伯数字，只有从0到9的10个数字，你直接硬塞给计算机这10个数字是没问题的。

但是猫和狗不一样，世界上有很多种的猫和狗，纯种的，杂交的，国内的，国外的，还有不同角度拍的，俯拍的，正面拍的，背后拍的，照片不是很清楚的。

你没有办法告诉计算机所有的关于猫和狗的照片，另外给所有的照片打上标签也是不现实的，因为工作量太大，如果我们现在要把大象，老虎，狮子，马等等动物都进行分类呢?

每种动物都要打标签的话那工作量简直是天文数字

事实上，你想想自己分辨这些动物的过程，需要看很多的照片吗?

比如老虎和狮子Q，你基本上看个2，3张照片就可以轻松的进行分辨

根本不需要成千上万张，甚至一张不太清楚的照片也不会影响你去做分辨

而我们想要计算机实现的功能就是学习能力，我们提供给计算机每种动物几百张照片，然后告诉它每张照片对应的动物

我们希望它可以通过学习这些图片来获得识别动物的能力。

比如根据他们的毛色，提醒大小，形体特征等等。

对于机器学习以及人工智能的学习，与ChatGPT结合，这是对于新手来说避免被落下太多，甚至被取代的好方法。它比多数书籍更强大，像个知无不言的老师，它可以放大你的能力，比如说你不擅长代码，那么它可以帮助你实现你的想法，无论什么语言它都可以做的非常棒。其实无论是从业者，还是对这一行感兴趣的朋友，都特别推荐去看看[知乎知学堂%的2天公开课，快速掌握大模型的潜力和应用。
在这里插入图片描述