【机器学习】简单认识监督学习

news2025/1/16 7:47:24

简单认识监督学习

  • ⭐️Supervised learning
  • ⭐️Examples
  • ⭐️Specific example
  • ⭐️两种类型的监督学习算法
    • 🌙回归算法
    • 🌙分类算法
  • ⭐️总结

Hi~大家好呀!经历了暑假期间短暂的接触机器学习的一些算法,之后又对深度学习、yolo系列有些了解,还尝试着去学习完成one-stage目标检测,但是由于基础知识的不扎实,很多时候都在补窟窿。
所以我打算从0开始学习机器学习算法,根据吴恩达老师的完整课程,将学习笔记上传于此。

“我认为今天机器学习创造的价值的99%是通过一种机器学习称为监督学习完成的。”

⭐️Supervised learning

监督机器学习是指学习x到y或者 输入到输出映射的算法。

监督学习的关键特征是,我们自己提供学习算法示例以供学习。
这其实就是,给定输入x的正确标签y,机器通过查看正确输入x所需的标签y,最终学会学习算法。即,当我们只是给出输入x,机器就能够给出合理准确的预测或者猜想

⭐️Examples

  • input 电子邮件
  • output 垃圾邮件/非垃圾邮件
    通过监督学习,将为我们提供垃圾邮件过滤器的功能。
  • input 音频
  • output 文本转录本
    这时,监督学习,就为我们提供语音识别的功能。
  • input English
  • output 其他语言
    这时,就实现了机器翻译

或者,我们可以将图片作为输入,比如说,刚下线的手机,将其图片作为输入,让学习算法根据输入的手机产品的 图片来判断是否存在划痕、凹痕或者其他缺陷。
这个称为目视检查,它可以帮助制造商减少或者防止其产品中的缺陷。

在上面的这些例子中,我们首先需要输入大量的示例,即输入x和与其相对应的正确答案即标签y来训练我们的模型

在模型从这些输入、输出(x和相对应的y)中学习之后,它们可以采用全新的输入x(它以前从未见过的东西),并尝试产生适当的对应输出y

⭐️Specific example

下面让我们更深入地研究一个具体的示例。
房价预测问题。
假如我们想根据房屋地大小来预测房价,并且我们已经收集到了一些过去的数据,并绘制了数据。

这里的横轴是以平方英尺为单位的房屋大小,纵轴是房子的价格。
有了这些数据,假如你的一位朋友想直到他们750平方英尺的房子的价格是多少。那通过学习算法如何帮助到你的朋友呢?
学习算法可能会通过指向拟合数据,通过直线上的数据以及直线以外的读数,可以大概预测到房子大概可以卖到150,000美元。

但拟合直线并不是我们可以使用的唯一学习算法。还有更好的可以应用于此。
比如,我们用下面的曲线进行拟合:

这样看起来,你的朋友的房子可以接近于200,000美元的价格。
给你的朋友选择最好的价格出售并不合适,我们应该关注的一件事是,如何选择最合适的直线或者曲线来适应这个数据,给出最合适的数据。

以这个例子简单说明,我们首先为算法提供了一个数据集,这个数据集中的每个x即房屋的面积,都对应着一个正确答案,即标签y。
学习算法的任务就是通过对此数据集的学习,有一些“经验”,产生更多这样的正确答案,当我们利用这个算法时,为这个算法提供一个房屋的面积,它可以根据“以往经验”预测出可能的出售价格。

⭐️两种类型的监督学习算法

🌙回归算法

在上面我们看到的预测房价问题中,其就是和回归算法。它学习从无限多的数字中预测数字。它可能是150,000到300,000中的任意数字。
其实本质闪也就是说,我们需要预测的标签y是连续的。

🌙分类算法

下面我们以乳腺癌检测为例,来研究分类算法。 假设我们要构建一个机器学习系统,以便医生可以使用诊断工具来检测乳腺癌。
我们根据患者的医疗记录,根据患者的肿瘤/肿块来判断乳腺癌是恶性的还是非恶性的。

然后我们收集一些数据,这些数据根据肿瘤的大小,将数据分为良性或者恶性。
比如说,下面,为了方便研究,我们将良性标注为0,恶性标注为1。

然后,我们将数据绘制在图表中,横轴代表肿瘤块的大小,纵轴仅仅取两个值,0和1,这是因为我们仅仅需要预测少量可能的输出或者类别。在这个例子中,仅仅有两个可能的输出,良性或者恶性,即0或1
在这里插入图片描述

这就是分类与回归的区别,分类算法就是仅仅需要预测可数个类别,而回归算法的预测,所可能的数字无限多。
因此,只有两种可能的输出这一事实构成了这种分类

我们可以使用两个符号进行更形象化表示,比如良性我们使用圆圈表示,恶性我们使用十字表示。

在上面我们的数据集只有一个输入,即患者肿瘤块的大小。为了更精确的预测,我们将我们的数据集的输入新增至两个,即肿瘤块的大小和患者的年龄。

所以这时医生就可以根据患者的肿瘤块的大小以及患者年龄,进行预测。

也就是,学习算法可能会做的就是找到一些将恶性肿瘤与良性肿瘤分开的边界。

也就是说,学习算法必须决定如何根据现有的数据集来拟合边界线。

⭐️总结

监督学习算法其实就是x到y的一种映射,也可以说是输入到输出的一种映射。
监督学习算法主要分为两类,回归算法和分类算法。
回归算法其实就是预测坐标轴的可能区间的无限个数。而分类算法预测结果就是坐标轴上的点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1281159.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++二维数组名到底代表个啥

题目先导 int a[3][4]; 则对数组元素a[i][j]正确的引用是*(*(ai)j)先翻译一下这个*(*(ai)j),即a后移i解引用,再后移j再解引用,这么看来a就应该是个二维数组,第一层存储行向量,一次解引用获得行向量的地址,…

【Leetcode题单】(01 数组篇)刷题关键点总结03【数组的改变、移动】

【Leetcode题单】(01 数组篇)刷题关键点总结03【数组的改变、移动】(3题) 数组的改变、移动453. 最小操作次数使数组元素相等 Medium665. 非递减数列 Medium283. 移动零 Easy 大家好,这里是新开的LeetCode刷题系列&…

数据库-MySQL之数据库必知必会22-26章

第 22 章 使用视图 视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。 使用视图 视图用CREATE VIEW语句来创建。 使用SHOW CREATE VIEW viewname;来查看创建视图的语句。 用DROP删除视图,其语法为DROP VIEW view…

7.24 SpringBoot项目实战【审核评论】

文章目录 前言一、编写控制器二、编写服务层三、Postman测试前言 我们在 上文 7.23 已经实现了 评论 功能,本文我们继续SpringBoot项目实战 审核评论 功能。逻辑如下: 一是判断管理员权限,关于角色权限校验 在 7.5 和 7.6 分别基于 拦截器Interceptor 和 切面AOP 都实现过…

反序列化漏洞详解(三)

目录 一、wakeup绕过 二、引用 三、session反序列化漏洞 3.1 php方式存取session格式 3.2 php_serialize方式存取session格式 3.3 php_binary方式存取session格式 3.4 代码演示 3.5 session例题获取flag 四、phar反序列化漏洞 4.1 phar常识 4.2 代码演示 4.3 phar例…

TensorRT安装及使用教程(ubuntu系统部署yolov7)

1 什么是TensorRT 一般的深度学习项目,训练时为了加快速度,会使用多 GPU 分布式训练。但在部署推理时,为了降低成本,往往使用单个 GPU 机器甚至嵌入式平台(比如 NVIDIA Jetson)进行部署,部署端也…

【Springboot+vue】如何运行springboot+vue项目

从github 或者 gitee 下载源码后,解压,再从idea打开项目 后端代码处理 这是我在gitee下载下来的源码 打开之后,先处理后端代码 该配置的配置,该部署的部署 比如将sql文件导入数据库 然后去配置文件更改配置 然后启动项目 确保…

【开源】基于JAVA语言的桃花峪滑雪场租赁系统

项目编号: S 036 ,文末获取源码。 \color{red}{项目编号:S036,文末获取源码。} 项目编号:S036,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 游客服务2.2 雪场管理 三、数据库设…

Python、Stata、SPSS怎么学?推荐一波学习资料

1.Python学习推荐书目 关于Python机器学习,推荐学习杨维忠、张甜所著的,清华大学出版社出版的《Python机器学习原理与算法实现》,以及张甜、杨维忠所编著的,清华大学出版社出版的《Python数据科学应用从入门到精通》,…

【异常】捕获线程池执行任务时产生的异常

前言: 在编写程序时,我们为了充分利用多核CPU、加快接口响应速度,通常会使用线程池来处理请求,但线程池执行任务过程中难免会出现异常,导致请求失败。那如果我们想在任务发生异常后捕获异常,并做一些”善后…

【C++ regex】C++正则表达式

文章目录 前言一、正则表达式是什么&#xff1f;二、<regex>库的基础使用2.1 第一个示例2.1 <regex>库的函数详解std::regex_matchstd::regex_searchregex_search 和 regex_match 的区别std::regex_replacestd::regex_iterator 和 std::sregex_iterator&#xff1a…

未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序报错的解决办法

当在本地计算机上使用Microsoft Office相关库时&#xff0c;可能会出现“未在本地计算机上注册microsoft.ACE.oledb.12.0”提供程序的报错。这是由于缺少相关的驱动程序或者未安装相应的软件所导致的。下面是解决该问题的完整攻略。 可能是因为没有安装数据访问组件&#xff0…

LeetCode(51)简化路径【栈】【中等】

目录 1.题目2.答案3.提交结果截图 链接&#xff1a; 简化路径 1.题目 给你一个字符串 path &#xff0c;表示指向某一文件或目录的 Unix 风格 绝对路径 &#xff08;以 / 开头&#xff09;&#xff0c;请你将其转化为更加简洁的规范路径。 在 Unix 风格的文件系统中&#xff…

Go 程序编译过程(基于 Go1.21)

版本说明 Go 1.21 官方文档 Go 语言官方文档详细阐述了 Go 语言编译器的具体执行过程&#xff0c;Go1.21 版本可以看这个&#xff1a;https://github.com/golang/go/tree/release-branch.go1.21/src/cmd/compile 大致过程如下&#xff1a; 解析 (cmd/compile/internal/synt…

【文献阅读笔记】基于自监督的异常检测和定位:SSM

2022 IEEE TRANSACTIONS ON MULTIMEDIA 领域&#xff1a;异常检测 目标&#xff1a;图像输入数据 文章目录 1、模型2、方法2.1、random masking2.2、restoration network2.3、损失函数2.4、推理时的渐进细化 3、实验4、引用5、想法 1、模型 训练&#xff1a; 每个图像实时生成随…

时间复杂度为O (nlogn)的排序算法

归并排序 归并排序遵循分治的思想&#xff1a;将原问题分解为几个规模较小但类似于原问题的子问题&#xff0c;递归地求解这些子问题&#xff0c;然后合并这些子问题的解来建立原问题的解&#xff0c;归并排序的步骤如下&#xff1a; 划分&#xff1a;分解待排序的 n 个元素的…

智能诊疗体验:整合AI技术的互联网医院小程序开发

在科技化的趋势下&#xff0c;互联网医院小程序的开发变得愈发重要&#xff0c;尤其是通过整合人工智能&#xff08;AI&#xff09;技术&#xff0c;进一步提升了就医的效率。 一、引言 互联网医院小程序其开发目标是提高医疗服务的效率&#xff0c;同时也也提升了用户的就医…

Linux学习笔记之七(shell脚本的基本语法)

Shell 1、Shell脚本2、常用运算符2、特殊语法4、关于变量的一些命令4.1、echo4.2、export4.3、read4.4、declare/typeset4.5、local4.6、unset 5、基本逻辑语法5.1、if判断5.2、for循环5.3、while循环5.4、case语句 6、函数定义7、多脚本链接 1、Shell脚本 学习shell脚本开发之…

Difference between getc(), getchar(), and gets()

getc(): 从输入中只能读单个字符 getchar()&#xff1a;从标准输入流中输入都单个字符。 两者基本等同&#xff0c;唯一不一样的是getc()是任何输入流&#xff0c;而getchar()是标准输入流。 gets:可以读入含有空格的字符串 // Example for getc() in C #include <stdio.h…

DDD系列 - 第4讲 从架构师的角度看待DDD - 一个关于拆解、微服务、面向对象的故事(二)

目录 第3次拆解 - 面向对象分析与设计3.1 交互入口实现层3.2 面向对象分析3.2.1 根据业务映射类3.2.2 对象持久化仓库3.2.3 自定义属性类3.2.4 类间的关联关系3.2.5 分包提升内聚、包内指定入口类降低耦合3.2.6 定义交互出口3.3 流程编排 & 业务编排3.4 交互出口实现层 &am…