机器学习:简介与类型

news2024/12/24 8:39:12

从翻译应用、商品推荐、医疗诊断到自动驾驶汽车,机器学习 (ML) 作为一种技术,都有用武之地。机器学习提供了一种解决问题、回答复杂问题以及创建新内容的新方式。机器学习可以预测天气、估算行程时间、推荐歌曲、自动补全句子、汇总文章以及生成全新的图片。

从根本上来讲,机器学习是对一种软件(称为模型)进行训练的过程,用于进行实用的预测或生成内容。例如,假设我们要创建一个应用来预测降雨。我们可以使用传统方法或机器学习方法。我们使用传统的方法,创建基于地球的物理特性的表面和地球表面,并计算大量的流体动力方程式。这非常困难。

使用机器学习模型,我们将为机器学习模型提供大量天气数据,直到机器学习模型最终学习了产生不同降雨量的天气模式之间的数学关系。然后,我们会为模型提供当前天气数据,并预测雨量。

机器学习系统根据学习进行预测或生成内容的方式,分为以下一个或多个类别:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式 AI

目录

1.监督式学习

1.1 回归

1.2 分类

2.非监督式学习

3.强化学习

4.生成式 AI

5.参考文献


1.监督式学习

监督式学习(Supervised learning)模型基于包含正确答案大量数据,可以发现数据中的元素与正确答案之间的关联(数学联系),从而进行预测。举个例子,一位学生通过学习带有参考答案的学习资料(如黄冈密卷😂)。当学生完成足够多的训练后,就能应对新考试。 这类机器学习系统是“监督式的”,因为人类会为机器学习系统提供已知正确的结果。监督式学习最常见的两种使用场景是回归和分类。

1.1 回归

回归模型可预测数值。例如,用于预测降雨量(以英寸或毫米为单位)的天气模型就是回归模型。如需查看回归模型的更多示例,请参阅下表:

场景可能的输入数据数值预测
未来房价平方英尺、邮政编码、卧室和浴室数量、停车场规模、抵押贷款利率、房产税率、建筑费用以及该区域内的待售住宅数量。住宅的价格。
未来的行程时间历史路况信息(从智能手机、交通传感器、约车及其他导航应用收集)、到目的地的距离以及天气状况。到达目的地的时间(以分钟和秒为单位)。

1.2 分类

分类模型可预测某个内容属于某个类别的可能性。与回归模型(其输出为数字)不同,分类模型输出的值会指明某个内容是否属于特定类别。例如,分类模型用于预测电子邮件是否为垃圾邮件或图片是否包含鲜花。

分类模型分为两组:二元分类和多类分类。二元分类模型会从仅包含两个值的类输出值,例如,输出 “下雨” 或 “不下雨” 的模型。多类分类模型从包含两个以上值的类输出值,例如,可输出 “下雨”“下雪”“冰雹” 或 “雨夹雪” 的模型。

2.非监督式学习

非监督式学习(Unsupervised learning)模型可基于不包含任何正确答案的数据进行预测。非监督式学习模型的目标是从数据中找出有意义的模式。换言之,模型对如何为每条数据进行分类没有提示,而是必须推断出自己的规则。最常用的非监督式学习模型采用一种称为聚类(Clustering)的技术。该模型会找出界定自然分组的数据点,如图1所示。

图 1. 将类似数据点聚类的机器学习模型。

图 2. 具有自然分界的聚类组。

聚类与分类不同,因为类别不是由人预先定义的。例如,非监督式模型可能会根据温度对天气数据集进行聚类,从而显式定义季节的细分类别。然后,你需要根据自己对数据集的了解来命名这些集群。

图 3. 一个机器学习模型,对类似的天气模式进行聚类。

图 4. 标记为雪、雨夹雪、下雨和无雨的天气模式集群。

3.强化学习

强化学习(Reinforcement learning)模型根据在环境中执行的操作获得奖励或处罚来进行预测。强化学习系统会生成一项政策,用于定义获得最多奖励的最佳策略。强化学习用于训练机器人执行任务,例如在房间内走动,以及训练 Go 游戏等软件程序。

4.生成式 AI

生成式 AI(Generative AI) 是一类基于用户输入创建内容的模型。例如,生成式 AI 可以构建新颖的图片、乐曲和笑话;它可以汇总文章、说明如何执行任务或编辑照片。

生成式 AI 可以接受各种输入并创建各种输出,例如文本、图像、音频和视频。此过程还可以创建各种输出的组合,例如,模型可以将图片作为输入,并创建图片和文本作为输出,或者将图片和文本作为输入,并创建视频作为输出。

我们可以按输入和输出(通常写为“输入类型”到“输出类型”)来讨论生成模型。例如,下面列出了生成模型的部分输入和输出:

  • 文字转文字
  • 文字转图片
  • 文字转视频
  • 文本到代码
  • 文本转语音
  • 图片和文字转图片

下表列出了生成模型的示例、输入模型及其可能的输出示例:

模型输入输出示例
文字转文字谁发明了 Le Mans 比赛?Le Mans 由 1906 年成立的汽车俱乐部 (ACO) 成立,为期 24 小时。首场比赛于 1923 年 5 月 26 日至 5 月 27 日在萨尔特赛道 (Sarthe Circuit) 举行,该赛道位于法国勒曼镇附近,全长 13.426 公里(8.345 英里)。 此比赛最初旨在宣传 ACO 和萨特地区。
文字转图片一个外星章鱼漂浮在门户网站上看报纸。

文字转视频一张逼真的泰迪熊在旧金山的海洋中游泳。 泰迪熊落在水下。泰迪熊和五颜六色的鱼不断在水下游泳。熊猫在水中游动。

文本到代码编写 Python 循环以遍历数字列表并输出质数。

for number in numbers:
# Check if the number is prime.
is_prime = True
for i in range(2, number):
  if number % i == 0:
      is_prime = False
      break
# If the number is prime, print it.
if is_prime:
  print(number)
图片转文字

火烈鸟的景象。位于加勒比地区。

生成式 AI 的工作原理是什么?概括来讲,生成模型会学习数据中的模式,以生成全新但类似的数据。生成模型如下所示:

  • 学习通过观察他人的行为和说话方式来模仿他人的喜剧演员
  • 学习特定风格的绘画,以便绘制特定风格的绘画
  • 翻唱乐队,听一听特定乐队的音乐,学习特定乐队的声音

为了生成独特且有创意的输出,生成模型最初是使用无监督方法进行训练的,其中,模型会学习模仿要训练的数据。有时,系统会通过监督或强化学习来学习与模型可能要求执行的任务相关的特定数据(例如,总结文章或修改照片)来进一步训练模型。

生成式 AI 是一项发展迅速的技术,经常有新的用例被发现。例如,生成模型通过自动移除分散注意力的背景或提高低分辨率图片的质量,帮助企业优化其电子商务产品图片。

5.参考文献

本文部分内容翻译自 监督式学习((https://developers.google.cn/machine-learning/intro-to-ml/what-is-ml),感兴趣的读者可以查看原文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/683072.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构】串的基本定义及操作

🎇[数据结构]串的基本定义及操作🎇 🌈积薪高于山,焉用先后别 🌈 🌟 正式开始学习数据结构啦~此专栏作为学习过程中的记录🌟 文章目录 🎇[数据结构]串的基本定义及操作🎇&…

【运维心得】SAP EPM Add-In加载错误的另类解决方案

关键字:SAP BPC EPM OFFICE WPS 今天又解决了一个诡异的问题,记录一下,以备将来能够用上。 目录 问题现象 网上的方法 启发和解决 结论 问题现象 财务SAP系统需要BPC模块做报表,安装了OfficeEPM Add-In以后,结果…

抖音私域怎么做?

“私域流量”是如今备受市场瞩目的话题之一。众所周知,腾讯、阿里巴巴、抖音等互联网巨头已经开始布局私域资源,因此许多企业都希望在这些平台上获取生意增长。作为具有6亿日活跃用户的短视频平台,抖音也为企业提供了私域运营的阵地。那么&am…

2023年湖北黄冈人社局初、中级职称怎么评?申报条件是什么?启程别

2023年湖北黄冈人社局初、中级职称怎么评?申报条件是什么?启程别 想要评过人社局的初、中级职称,首先要满足申报条件,其次是要准备好申报资料,最后等待申报时间提交资料,等待结果。湖北目前改外全面线上申报…

SAP从入门到放弃系列之BOM技术类型-派生BOM-Part5

文章导航目录 一、概述二、基本概念-BOM技术类型三、BOM技术类型详解3.1、BOM技术类型-简单BOM&多重BOM 3.2、BOM技术类型-派生BOM 四、测试示例:4.1、数据准备4.2、创建派生BOM4.3、调整BOM组,更新派生BOM 一、概述 本来想在介绍BOM组的时候写这个…

hbase协处理器编码实例

Observer协处理器通常在一个特定的事件(诸如Get或Put)之前或之后发生,相当于RDBMS中的触发器。Endpoint协处理器则类似于RDBMS中的存储过程,因为它可以让你在RegionServer上对数据执行自定义计算,而不是在客户端上执行…

MATLAB 之 对话框设计实例和菜单设计

这里写目录标题 一、对话框设计实例1. 数值转化2. 图形演示 二、菜单设计1. 建立用户菜单2. 菜单对象常用属性3. 快捷菜单 一、对话框设计实例 在上一篇博客当中,我们介绍了控件的基本操作,这是建立对话框的基础。下面我们举两个例子,用以说…

软件测试工程师最常用的Linux系统命令大全(汇总)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 cd命令 这是一个…

最新导则下生态环评报告编制技术

根据生态环评内容庞杂、综合性强的特点,依据生态环评最新导则,将内容分为4大篇章(报告篇、制图篇、指数篇、综合篇)、 10大专题(生态环评报告编制、土地利用图的制作、植被类型及植被覆盖度图的制作、物种适宜生境分布图的制作、生物多样性测定、生物量…

开窗函数之聚合、取特定值、排名

一, 聚合开窗函数sum(score) over(partition by name ) 二,开窗函数之first_value,last_value,lead,lag 三,排名开窗函数ROW_NUMBER、DENSE_RANK、RANK 一,开窗函数的语法 开窗函数的语法为&am…

Pinia理解【Vue3】

什么是Pinia Pinia是Vue的专属的最新状态管理库,是Vuex状态管理工具的替代品 优势: 提供了更加简单的API (去掉了mutation)提供符合组合式风格的API(和Vue3新语法统一)去掉了 modules 的概念,每一个 store 都是一个独立的模块搭配 TypeScr…

RabbitMQ Exchange类型和工作模式介绍

RabbitMQ Exchange类型和工作模式介绍 一RabbitMQ Exchange类型1.1.Fanout1.2.Direct1.3.Topic1.4.Headers 二 RabbitMQ 工作模式介绍2.1.work工作模式(资源的竞争)2.2.publish/subscribe发布订阅(共享资源)2.3.routing路由模式应用--direct交换器 2.4.topic 主题模式(路由模式…

一键轻松造数据:通过Postman实现表单提交

一、原始需求的诞生 在测试的过程中,需要大量的表单。于是我选择了通过postman发送表单提交的接口来造数据。 如上图所示,表单提交接口所需的参数以及请求体中需模拟的IP地址。参数为 {{}} 的表示需要不同的实参,至于原因就不在这里赘述了。如…

618手机大战:各大品牌花式秀战报,但难掩冷淡行情

在手机出货量持续下行的态势下,各大手机厂商普遍对618这个年中大促寄予厚望,希望通过各种促销手段,扭转销售颓势。 比如,今年5月下旬,小米、荣耀、OPPO、vivo等厂商就已经开启了降价、分期免息等优惠活动,…

Vue3自定义指令实现按钮权限

一、需求前提 登录成功后,后端直接返回了用户的所有权限(路由权限按钮权限),在已经实现菜单权限的基础上,实现每个页面的按钮权限,树形数据结构如下: { "roles": ["admin&q…

嵌入式实时操作系统的设计与开发New(六)

aCoral的优先级与数字大小成反比,即:数字越大,优先级越低。 #define MAX_PRIO_NUM ((CFG_MAX_THREAD1) & 0xff) #define MINI_PRIO CFG_MAX_THREAD //最低优先级40typedef enum{ACORAL_INIT_PRIO; //init线程独有的0优先级ACORAL_MAX_PR…

如何刷新 DNS 缓存 (macOS, Linux, Windows)

如何刷新 DNS 缓存 (macOS, Linux, Windows) Unix Linux Windows 如何刷新 DNS 缓存 (macOS, FreeBSD, RHEL, CentOS, Debian, Ubuntu, Windows) 请访问原文链接:https://sysin.org/blog/how-to-flush-dns-cache/,查看最新版。原创作品,转载…

论文解读|基于平面双关节机器人的相机姿态分析与评估

原创 | 文 BFT机器人 01 研究内容 论文的主要研究内容是基于平面双关节机器人的相机姿态分析和评估。研究旨在分析相机的位置调整和一般数据分析,讨论人体姿势的平衡、关节运动的控制以及相机速率的估计和控制。 通过有限相机技术的应用,有效解决平面摄影…

【虚拟机数据恢复】XenServer虚拟机磁盘数据被破坏的数据恢复案例

虚拟机数据恢复环境: 一台某品牌720服务器,4块STAT硬盘通过RAID卡组建raid10磁盘阵列。部署的XenServer虚拟化平台Windows Server操作系统,共两个虚拟磁盘:数据盘系统盘。服务器作为Web服务器使用,上层部署ASP SQL Se…

Chrome插件开发_V3_浏览器扩展插件基础教程

文章目录 一、简介二、核心介绍三、自定义页面背景色三、设置页面背景图(web_accessible_resources)四、设置徽章(Badge)五、桌面通知六、消息通信七、自定义右键菜单(添加、更新、删除)八、Omnibox九、浏览…