ML 系列:机器学习和深度学习的深层次总结(01)

news2025/1/22 9:06:59

文章目录

  • 一、说明
  • 二、人工智能和机器学习
  • 三、机器学习的类型
  • 四、结论

一、说明

欢迎学习机器学习系列。这门综合课程目前包括40个部分,指导您了解机器学习、统计和数据分析的基本概念和技术。以下是到目前为止涵盖的关键主题的简要概述:

1 机器学习简介
基本原则、意义以及机器学习、人工智能和深度学习之间的关系。
见这一天

2 回归方法,包括简单和多元线性回归、非线性回归以及梯度下降等优化技术。
第 2 天:简单线性回归,第 3 天:使用梯度下降 (GD) 进行优化,第 4 天:多元线性回归 (MLR),第 5 天:非线性回归

3 准备数据进行分析的关键预处理步骤,包括清理、规范化、转换和特征工程。
第 6 天:预处理(第 1 部分),第 7 天:预处理(第 2 部分),第 8 天:预处理(第 3 部分)

4 欠拟合、过拟合、实现良好拟合、偏差-方差权衡和模型性能评估的概念。
第 9 天:低于、高于和良好拟合,第 10 天:偏差-方差权衡

5 探索不同的学习范式,包括监督学习、无监督学习和强化学习。
第 11 天:ML 中的不同类型的学习

6 二元分类和 KNN 的逻辑回归研究,包括通过 KD 树等高级数据结构提高效率。
第 12-14 天:逻辑回归(第 1 部分 — 第 3 部分),第 15 天:KNN,第 16 天:KD 树

7 核心概率概念、基本分布(离散分布和连续分布)及其在机器学习中的应用。
第 17 天:基本概率概念,第 18 天:高级概率论,第 20-29 天:各种分布,
第 32 — 34 天:机器学习中的统计简介和描述性统计
第 35 天:机器学习中的数据可视化,第 36 天:采样

8了解估计方法(例如最大似然估计)和各种假设检验策略。
第 37 天:统计估计,第 38 天:矩法,第 39 天:最大似然估计 (MLE),第 40 天:MLE 的简单问题,第 41 天:假设检验简介,第 42 天: 用于模型比较的统计检验

主题包括假设检验在机器学习中的高级应用以及参数检验和非参数检验之间的区别。
第 43 天:参数检验与非参数检验,第 44 天:假设检验在机器学习中的高级应用

二、人工智能和机器学习

一个RTIFICIAL Intelligence 使用计算机和机器来模仿人类大脑解决问题和决策的能力。机器学习是一门科学,它通过使用编程使计算机能够从数据中学习,而无需直接手动编程。机器学习是人工智能的一个子集,深度学习是机器学习的一个子集,它使用大量数据和通常使用神经网络来训练模型。

​​在这里插入图片描述

图 1.人工智能、机器学习和深度学习之间的关系

三、机器学习的类型

  1. 监督学习
    监督式学习是一种机器学习方法,它使用标记的数据集来训练算法,以对数据进行分类并预测结果。监督学习有两个主要应用:分类问题和回归。

“分类”是指获取输入值并将其映射到离散值。在此方法中,输出由多个 “类” 或 “类别” 组成。另一方面,“回归”也是指输入数据到连续输出的映射,我们寻求找到一个与数据的距离最小的函数,并且每个输入点都可以映射到一个输出值。

图 2 显示了分类和回归。

在这里插入图片描述

图 2.回归 (右侧) 和分类 (左侧)

监督学习中一些最常见的算法是支持向量机 (SVM)、逻辑回归、简单贝叶斯算法、K 最近邻 (KNN) 和随机森林。

  1. 无监督学习
    无监督学习是一种机器学习,其中算法处理没有标签的数据。目标是单独学习算法在输入数据中找到结构。简而言之,无监督学习是一种自学习方法,其中算法可以在未标记的数据集中找到隐藏的模式,并在没有任何干扰的情况下提供所需的输出。无监督学习中一些最常见的算法是聚类和降维。

聚类是一种无监督学习,其中隐藏的数据模式是根据它们的相似或不同来确定的。这些模式可以与形状、大小或颜色相关,并用于对数据项进行分组或创建集群。降维,顾名思义,用于减少数据维度。

图 3 显示了聚类。
在这里插入图片描述
图 3. 聚类

在图 3 中,有 12 个点(数据)分配给 3 个集群。在最简单的理解中,几何上彼此接近的点被放置在一个星团中,星星指的是每个星团的中心。

  1. 强化学习 (RL)

强化学习是机器学习的一个领域,其目的是研究智能代理应该如何在环境中行动,以最大化奖励的概念。强化学习是机器学习的三个主要模型之一,另外两个是监督学习和无监督学习。这种方法基于奖励理想的行为和/或惩罚不良行为。一般来说,强化学习代理可以理解和解释其环境,采取行动,并通过反复试验来学习。要定义这种学习方法,我们需要陈述一些初步定义。

A. 环境

在强化学习中,目标是设计和训练代理,以便他能够在环境中执行最合适的行为;因此,必须为每个问题定义相关环境。

B. 状态

定义环境后,代理随时处于特定状态。例如,在国际象棋游戏中,如果我们把棋盘看作是游戏环境,那么每颗棋子在任何时刻都位于其中一座房子里,每颗房子代表着每颗棋子的状态。

C. 奖励

在为代理定义的环境中,每个操作都会考虑一个奖励,并且根据此奖励,代理会了解哪些行为更合适。

D. 操作

在环境中,代理体的每次移动都被视为一个操作,根据该操作,代理体从环境中获得奖励。

E. 发作

每次代理在环境中执行操作时,根据收到的奖励,从一个状态转移到另一个状态;此操作称为 episode。

图 4 显示了强化学习过程。
在这里插入图片描述

四、结论

在第 1 天,我们将讨论机器学习的一般原则。除了使用任何算法。在第 2 天:机器学习系列:第 2 天 — 简单线性回归中,我们讨论了一种基本的回归算法,称为线性回归。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2119610.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C与汇编之间的相互调用(29)

1 先来看一下 基本的调用规则。 注意: 程序通过 r1 -r4 来保存 传递的参数,如果 超过了 4个参数怎么办, 那就 放到栈里面。 注意: 堆栈是满递减, FD。 子程序的返回结果 会放到R0 里面。 2 然后是 c 语言调用 汇编语言…

如何最好地制定自动化测试策略

尽管不能否认手动测试的价值,自动化测试的需求却在不断增长。自动化测试可以为公司和团队带来许多好处:时间效率高、覆盖面广。 如何最好地制定自动化测试策略呢? 在本文中,我将展示测试自动化策略的所有7个阶段中的一些最佳实践…

gpt4最新保姆级教程

如何使用 WildCard 服务注册 Claude3 随着 Claude3 的震撼发布,最强 AI 模型的桂冠已不再由 GPT-4 独揽。Claude3 推出了三个备受瞩目的模型:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,每个模型都展现了卓越的性能与特色。其中&a…

LLM - 理解 多模态大语言模型 (MLLM) 的发展与相关技术 (一)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142063880 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 多模态…

揭秘世界上那些同时横跨两大洲的国家

我们在《世界人口过亿的一级行政区分布》盘点全球是那些人口过亿的一级行政区。 现在我们介绍五个横跨两州的国家,并整理七大洲和这些国家的KML矢量数据分析分享给大家,如果你需要这些数据,请在文末查看领取方式。 世界上横跨两大洲的国家 …

【Python报错已解决】SyntaxError: positional argument follows keyword argument

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:调整参数顺序2.2 步骤二…

excel分列

Excel中有这么几列,希望将每一列内容再分出3列: 可以通过以下步骤在 Excel 表格中将 B 到 F 列的内容拆分为每列的 3 列,分别为 pred_label、pred_score 和 pred_class: 确定数据结构:假设 B 列到 F 列中的内容都是按类…

洛谷 P10798 「CZOI-R1」消除威胁

题目来源于&#xff1a;洛谷 题目本质&#xff1a;贪心&#xff0c;st表&#xff0c;单调栈 解题思路&#xff1a;由于昨天联练习了平衡树&#xff0c;我就用平衡树STL打了个暴力&#xff0c;超时得了30分 这是暴力代码&#xff1a; #include<bits/stdc.h> using name…

小琳AI课堂:多模态模型的训练与应用

引言 大家好&#xff0c;这里是小琳AI课堂。今天我们将探讨一个热门且前沿的话题——多模态模型的训练与应用。让我们一起走进这个复杂而精致的艺术创作过程&#xff01; 训练关键步骤 1. 数据收集与预处理 准备工作&#xff1a;从多种来源和模态收集数据&#xff0c;如文…

苍穹外卖()

day1 软件开发整体介绍 软件开发流程&#xff1a;需求分析&#xff08;需求规格说明书、产品原型&#xff09;->设计&#xff08;UI设计、数据库设计、接口设计&#xff09;->编码&#xff08;项目代码&#xff0c;单元测试&#xff09;->测试&#xff08;测试用例、…

C++:入门篇(补充C语言中的不足)

前言 这篇文章是C的第一篇文章&#xff0c;主要是补充C语言中存在的不足而扩展的一些新的语法&#xff0c;有了这篇文章作为杂序&#xff0c;后面再介绍其他内容就要清晰地多 C&#xff1a;入门篇 一、namespace 命名空间&#xff08;一&#xff09;域的概念&#xff08;二&…

【深度学习讲解笔记】第1章-机器学习基础(2)

模型与函数构造 之前讲到&#xff0c;模型是由机器学习决定参数值的函数&#xff0c;通过训练&#xff0c;机器可以找出最好的一组参数使得函数的输出最优。常见的模型有线性模型&#xff0c;指数模型&#xff0c;对数模型等。在线性模型中&#xff0c;w和b是可学习的参数&…

【Hadoop|HDFS篇】DataNode概述

1. DataNode的工作机制 1&#xff09;一个数据块在DataNode上以文件形式存储在磁盘上&#xff0c;包括两个文件&#xff0c;一个是数据本身&#xff0c;一个是元数据包括数据块的长度&#xff0c;块数据的校验和&#xff0c;以及时间戳。 2&#xff09;DataNode启动后向NameNod…

象过河在线进销存软件——简单、高效、智能,让生意更简单!

仓库管理&#xff0c;曾是我心中的一大“乱麻”——库存不清、数据混乱、出入库效率低... 但自从邂逅了【象过河在线进销存软件】&#xff0c;一切都变得那么简单、高效、智能&#xff01; 象过河在线进销存软件优势&#xff1a; 1、界面简洁&#xff0c;流程简单 作为亲身体…

【时时三省】(C语言基础)指针进阶 例题4

山不在高&#xff0c;有仙则名。水不在深&#xff0c;有龙则灵。 ----CSDN 时时三省 strlen是求字符串长度 这个需要算上&#xff3c;0 第一个arr 是打印6 因为它加上&#xff3c;0是有六个元素 第二个arr0 数组名相当于首元素的地址 a的地址加0还是a的地址 所以这个地方还是…

Linux日志-kdump日志

作者介绍&#xff1a;简历上没有一个精通的运维工程师。希望大家多多关注作者&#xff0c;下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux 系统中的日志是记录系统活动和事件的重要工具&#xff0c;它们可以帮助管理员监视系统状态、调查问题以及了解系统运行…

IDEA Maven 源修改为国内阿里云镜像的正确方式

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐&#xff1a;「storm…

RT-Thread Nano版本在STM32F103RB上的快速移植

目录 概述 1 RT-Thread Nano 1.1 Nano版本介绍 1.2 RT-Thread Nano的特点 2 STM32Cube 创建工程 2.1 STM32Cub配置板卡参数 2.2 项目程序架构 3 移植RT-Thread 3.1 Keil IDE加载RT-Thread 3.2 解决上面两个ERROR 3.2.1 ERROR-1: 3.2.2 ERROR-2 3.3 移植FINSH 3.4…

数据结构与算法-morris遍历

morris遍历的优点在于节省空间&#xff0c;因为不需要递归。 public class MorrisTraversal {public static void main(String[] args) {Node head new Node(4);head.left new Node(2);head.right new Node(6);head.left.left new Node(1);head.left.right new Node(3);h…

实验二 局域网与互联网的连接

一、实验目的 1.掌握网络工程中网络拓扑设计与设备选型 2.掌握局域网与互联网的连接技术。 3.掌握访问控制规则的设置方法。 二、实验描述 某中学校园网网络初步规划如下&#xff1a;学生机房使用192.168.10.0/24网段&#xff1b;办公主机使用192.168.20.64/29网段&#x…