机器学习的原理是什么?

news2025/1/4 17:34:01

训过小狗没?
没训过的话总见过吧?

你要能理解怎么训狗,就能非常轻易的理解机器学习的原理.

比如你想教小狗学习动作“坐下”一开始小狗根本不知道你在说什么。但是如果你每次都说坐下”然后帮助它坐下,并给它一块小零食作为奖励,经过多次重复,狗就会学会当听到“坐下”这个词时就要坐下。

以此类推,小狗可以听懂各种指令,比如坐下,蹲下,握手等等

机器学习本质上跟教小狗一模一样,只不过机器学习不是一条狗或者一只猫,而是用的“模型“

我们用电脑和特殊的程序(叫做“模型”)来代替小狗。我们给电脑一堆数据,比如一堆照片,其中有些是猫,有些是狗。然后我们告诉电脑哪些是猫,哪些是狗(这叫“标签”)。电脑就像小狗一样,通过这些“示范”和“奖励”(或“惩罚”)来学习怎么区分猫和狗Q

比如“模型”每区分正确一张照片,就给它奖励一分,否则扣一分,然后我们设定了目标是分数越高越好,那么“模型”就会根据这个机制进行不断的学习,最后就成为了一个非常优秀的区分猫狗的“好模型”

但与教小狗不同,电脑可以快速地查看成千上万张照片,并从中学习。电脑也可以学习很多其他复杂的任务,比如识别人的声音、推荐你可能喜欢的音乐,甚至帮助医生诊断疾病。

从上面我们可以总结出来几个名词:

  1. 模型(Model):模型就像是电脑的“大脑”的决策用来处理和学习数据。你可以想象它为一个迷工厂,输入数据进去,输出结果。
  2. 数据集(Dataset):数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。
  3. 标签(Label):标签是对数据集中每一项数据的解释或标记。比如,在一个由猫和狗照片组成的数据集中,每张照片会被标签为“猫”或“狗”。
  4. 训练(Train)和测试(Test):训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。
  5. 奖励(Reward)和惩罚(Punishment):在某些机器学习模式中,模型会根据其预测的准确性获得奖励或惩罚。 监督学习
  6. (Supervised Learning) 和无监督学习 (Unsupervised
    Learning):在监督学习中模型从带有标签的数据中学习。在无监督学习中,数据没有标签,模型需要自己找出数据的结。

从上面来看其实我们归纳一下,机器学习就是让电脑通过数据和例子来学习做某件事,而不是由人直接编程告诉它每一步应该怎么做。

这一句话会有点儿难懂,那么还是拿训练计算机去分辨猫狗照片来举例。

我们想要做的是让计算机去自动的学会分辨猫和狗,而不是告诉计算机这是一张哈士奇的图,另张是金毛。

这跟自动的分辨有什么区别呢?

区别就在于“学习”,因为猫和狗不像是阿拉伯数字,只有从0到9的10个数字,你直接硬塞给计算机这10个数字是没问题的。

但是猫和狗不一样,世界上有很多种的猫和狗,纯种的,杂交的,国内的,国外的,还有不同角度拍的,俯拍的,正面拍的,背后拍的,照片不是很清楚的。

你没有办法告诉计算机所有的关于猫和狗的照片,另外给所有的照片打上标签也是不现实的,因为工作量太大,如果我们现在要把大象,老虎,狮子,马等等动物都进行分类呢?

每种动物都要打标签的话那工作量简直是天文数字

事实上,你想想自己分辨这些动物的过程,需要看很多的照片吗?

比如老虎和狮子Q,你基本上看个2,3张照片就可以轻松的进行分辨

根本不需要成千上万张,甚至一张不太清楚的照片也不会影响你去做分辨

而我们想要计算机实现的功能就是学习能力,我们提供给计算机每种动物几百张照片,然后告诉它每张照片对应的动物

我们希望它可以通过学习这些图片来获得识别动物的能力。

比如根据他们的毛色,提醒大小,形体特征等等。

对于机器学习以及人工智能的学习,与ChatGPT结合,这是对于新手来说避免被落下太多,甚至被取代的好方法。它比多数书籍更强大,像个知无不言的老师,它可以放大你的能力,比如说你不擅长代码,那么它可以帮助你实现你的想法,无论什么语言它都可以做的非常棒。其实无论是从业者,还是对这一行感兴趣的朋友,都特别推荐去看看[知乎知学堂%的2天公开课,快速掌握大模型的潜力和应用。
在这里插入图片描述

这就是[机器学习]Machine Learning这个名词的来源,主要原理可以概括为“从经验中学习”

  1. 明确目标:首先,你需要明确你想让模型(或小狗)完成的任务。例如,区分猫和狗。
  2. 收集数据:接着,你需要准备一个数据集。就像你会有很多“坐下”的场景来教狗一样
  3. 标签与示范: 在监督学习中,你需要标签来告诉模型数据集中每项数据的意义。这像是每次帮助小狗坐下并说“这是坐下”
  4. 训练与调整:使用数据和标签来训练模型,模型会尝试找出数据之间的规律或关系。如果模型做得好,它会获得“奖励”;做得不好,则会受到“惩罚”
  5. 测试与评估:一旦模型经过足够的训练,你就可以用没有标签的新数据来测试它,看看其表现如何.
  6. 应用与拓展:一旦模型经过测试并证明有效,它就可以用于各种其他任务,从识别声音到医疗诊断

总的来说,机器学习是一种通过数据和算法来训练模型,使其能够完成特定任务或做出预测的技术。与训练小狗不同,模型可以处理非常大量的数据,并用于解决各种复杂的问题。

区分下几个经常会被混淆的名词: 机器学习/人工智能/深度学习

从下图可以看到

人工智能AI是一个广泛的概念,包括所有模仿、延伸或者扩充人类智能的技术

机器学习是AI中的一个分支,主要关注通过数据来训练模型。

深度学习则是机器学习中的一个子集,专注于使用类似人脑的神经网络进行高级、复杂的任务

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1093346.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2020-2021 ACM-ICPC, Asia Nanjing Regional Contest (XXI Open Cup, Grand Prix

Problem - K - Codeforces 首先第一个位置放1,第二个位置放2,...第n个位置放n 任意两个相邻的数都是互质的,我们只要交换相邻的两个数就可以产生两个数满足gcd(pi,i)1 其中第一个位置为1比较特殊&#x…

Ae 效果:CC Blobbylize

扭曲/CC Blobbylize Distort/CC Blobbylize CC Blobbylize(CC 团化)与 CC Glass 效果非常相似,可将源图像扭曲变形成一些不可名状的团块,从而创建液态金属等效果。 CC Blobbylize 效果使用源图像以及 Blob layer 图层的纹理&#…

JavaFX: 使用本地openjfx包

JavaFX: 使用本地openjfx包 1、注释配置2、下载openjfx包3、导入openjfx的jar包 1、注释配置 build.gradle配置注释: 2、下载openjfx包 下载javaFx地址:https://gluonhq.com/products/javafx/ 3、导入openjfx的jar包

xshell使用方法(超详细)

一、安装 下载最新版安装即可,不需要做任何配置。 安装完成后输入账号名和邮箱,确认后邮箱会收到一条确认邮件,将里面的链接点开即可免费使用(仅安装后会出现,认证后以后再打开不需要重复操作,如果重新安…

【面试经典150 | 哈希表】最长连续序列

文章目录 写在前面Tag题目来源题目解读解题思路方法一:哈希表 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并附带一些对于本题涉及到的数据结构等内…

Hadoop3教程(七):MapReduce概述

文章目录 (68) MR的概述&优缺点(69)MR的核心思想MapReduce进程 (70)官方WC源码&序列化类型(71)MR的编程规范MapperReducerDriver (72)WordCount案例需…

C# 图解教程 第5版 —— 第3章 C# 编程概述

文章目录 3.1 一个简单的 C# 程序(*)3.2 标识符3.3 关键字3.4 Main:程序的起始点(*)3.5 空白3.6 语句(*)3.7 从程序中输出文本3.7.1 Write(*)3.7.2 WriteLine&#xff08…

【数据结构】排序--选择排序(堆排序)

目录 一 堆排序 二 直接选择排序 一 堆排序 堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是 通过堆来进行选择数据。 需要注意的是排升序要建大堆,排降序建小堆。 直接选择排…

Vue2+SpringBoot实现数据导出到csv文件并下载

前言 该功能用于导出数据到csv文件,并且前端进行下载操作。涉及到java后端以及前端。后端获取数据并处理,前端获取返回流并进行下载操作。csv与excel文件不大相同。如果对导出的数据操作没有很高要求的话,csv文件就够了。具体差异自行百度。我…

nodejs+vue教学辅助管理系统

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…

nodejs+vue考研信息查询系统-计算机毕业设计

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…

python特别篇—github基本操作手册

一、开始使用 1.1 “Hello world” 1.1.1 github介绍 GitHub是一个基于Git版本控制系统的代码托管平台。它提供了一个在线的代码仓库,使开发者可以将自己的代码存储在云端,并与其他开发者进行协作。GitHub不仅仅是一个代码托管平台,还提供了…

IDEA中查看整个项目代码行数

近期正在手撸Spring源码,想要看下自己写了多少行代码。记录下如何查看项目的代码行数,方便日后查阅

【论文笔记】LLM-Augmenter

github:https://github.com/pengbaolin/LLM-Augmenter(暂无处readme外其他文件) paper:https://arxiv.org/pdf/2302.12813.pdf ![在这里插入图片描述](https://img-blog.csdnimg.cn/24cba6213c0f4c00a5646eb9007b3aa2.png#pic_cen…

【OS】操作系统课程笔记 第五章 并发性——互斥、同步和通信

并发性:并发执行的各个进程之间,既有独立性,又有制约性; 独立性:各进程可独立地向前推进; 制约性:一个进程会受到其他进程的影响,这种影响关系可能有3种形式: 互斥&am…

【从零开始学习Redis | 第三篇】在Java中操作Redis

前言: 本文算是一期番外,介绍一下如何在Java中使用Reids ,而其实基于Java我们有很多的开源框架可以用来操作redis,而我们今天选择介绍的是其中比较常用的一款:Spring Data Redis 目录 前言: Spring Data…

Koordinator 协同 containerd NRI 增强容器 QoS,提升应用性能

作者:韩柔刚 - 阿里云,张康 - Intel 随着云基础业务类型和硬件资源的日益丰富,数据中心的资源利用率得到了显著提高,但也带来了资源争用的风险。在提高节点资源利用率的同时,确保应用程序的 QoS(Quality o…

铜死亡+机器学习+WGCNA+分型生信思路

今天给同学们分享一篇单基因泛癌免疫实验生信文章“IGF2BP3 overexpression predicts poor prognosis and correlates with immune infiltration in bladder cancer”,这篇文章于2023年2月3日发表在BMC Cancer期刊上,影响因子为3.8。 膀胱癌是全球最常见…

利用向导创建MFC

目录 1、项目的创建: 2、项目的管理 : 3、分析以及生成的项目代码 : (1)、查看CFrame中的消息映射宏 (2)、自动生成事件 (3)、在CFrame中添加对应的鼠标处理函数 …

基于静电放电优化的BP神经网络(分类应用) - 附代码

基于静电放电优化的BP神经网络(分类应用) - 附代码 文章目录 基于静电放电优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.静电放电优化BP神经网络3.1 BP神经网络参数设置3.2 静电放电算法应用 4.测试结果…