机器学习的魔法(二)超越预测的界限-揭秘机器学习的黑科技-探索监督学习中的回归和分类问题

news2024/11/18 9:35:00

前面我们提到了监督学习的概念,现在我们来回顾一下,什么是监督学习。

监督学习指的是:我们给学习算法一个数据集,这个数据集由正确答案组合而成,然后机器运用学习算法,算出更多的正确答案。


1、监督学习之回归问题

我们接着,上节提到的房价预测案例,进一步说明。


在这里插入图片描述


如上图,横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。

基于以上数据,假如 你有个朋友,她有750平方英尺的房子,能卖多少钱。

我们应用学习算法:

  • 可以在这组数据中拟合一条直线,我们可以根据这条直线推测出 ,这套房子可以卖150K美元。

  • 可以这组数据中使用二次方程拟和曲线,可以从曲线这个点,推测出这套房子可以卖200k美元。

以上案例的房价实际上是一系列的离散值,我们通常把它看成实数,看成标量,所以又把它看成一个连续的数值。

我们尝试推测一系列连续值的结果(房价),这叫回归问题


2、监督学习之分类问题

我们再举另外一个监督学习的例子。

假设:你想通过查看病历来推测乳腺癌良性与否。

假如有人检测出乳腺肿瘤,恶性肿瘤有害并且十分危险,而良性的肿瘤危害就没那么大。

我们来看一组数据:

这个数据集中,横轴表示肿瘤的大小;纵轴上,标出1和0表示是或者不是恶性肿瘤。

如果是恶性则记为1,良性记为 0。


在这里插入图片描述


机器学习的问题就在于:估算出肿瘤是恶性的或是良性的概率,这就是一个分类问题。

分类指的是,我们试着推测出离散的输出值:0或1,良性或恶性,而事实上在分类问题中,输出可能不止两个值。


总结:
监督学习的基本思想是,我们数据集中的每个样本都有相应的“正确答案”,再根据这些样本作出预测。


3、案例分析

假设你经营着一家公司,你想开发学习算法来处理这两个问题:

1、你有一大批同样的货物,想象一下,你有上千件一模一样的货物等待出售,这时你想预测接下来的三个月能卖多少件?

2、你有许多客户,这时你想写一个软件来检验每一个用户的账户。对于每一个账户,你要判断它们是否曾经被盗过?

那这两个问题,它们属于分类问题、还是回归问题?


问题一: 是一个回归问题,如果我有数千件货物,我会把它看成一个实数,一个连续的值。因此卖出的物品数,也是一个连续的值。


问题二:是一个分类问题,因为我会把预测的值,用0 来表示账户未被盗,用1 表示账户曾经被盗过。所以我们根据账号是否被盗过,把它们定为0或 1,然后用算法推测一个账号是 0还是 1,因为只有少数的离散值,所以我把它归为分类问题。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1492376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GIS之深度学习07:CUDNN教程(CUDA12.1配套)

CUDNN(CUDA Deep Neural Network library)是NVIDIA专门针对深度学习应用开发的GPU加速库。它提供了一系列高效的深度学习算法的实现,包括卷积神经网络(CNN)、循环神经网络(RNN)等常用网络结构的…

QT----QTcreater连接Mysql数据库

目录 1、下载驱动,放入文件夹2、编写代码,实现本地访问3、实现网络数据库3.1 更改权限3.2 修改代码 之前写了一个图书管理系统用的是sqlite3,现在想用mysql,部署到网上,实现远程访问。 1、下载驱动,放入文…

VR虚拟生态探索介绍|元宇宙文旅|VR设备价格

虚拟现实(VR)虚拟生态探索是一种通过VR技术让用户体验并探索虚拟环境的活动。在这样的环境中,用户可以通过头戴式显示器和其他感知设备沉浸在一个虚拟的世界中,仿佛身临其境。 在VR虚拟生态探索中,用户可以探索各种不同…

IDEA中如何配置多个版本的JDK

1.首先创建一个Project. 2.点击菜单栏中的File,而后选择Project Structure. 3.进入该界面后点击SDK选择想要选择的jdk版本。 4.如果提供的jdk版本没有自己想要的,就点击ADD SDK,点击DownLoad JDK; 5.在弹出的窗口选择jdk的版本和想要下载到的位置。 6.下载成功…

Mysql删除重复项:力扣196. 删除重复的电子邮箱

题目链接:196. 删除重复的电子邮箱 - 力扣(LeetCode) 题目描述 sql语句 # Write your MySQL query statement below delete a from person as a inner join person as b where a.email b.email and a.id > b.id 思路:内连接…

Spring事件发布监听器ApplicationListener原理- 观察者模式

据说监听器模式也是mq实现的原理, 不过mq我还没来得及深入学习, 先用spring来理解一下吧 Spring事件发布监听器ApplicationListener原理- 观察者模式 什么是观察者模式一个Demo深入认识一下观察者模式Spring中的事件发布监听ps 什么是观察者模式 大家都听过一个故事叫做烽火戏…

GPT-4 及更高版本:大型语言模型的力量

GPT-4革命:人工智能如何重塑SEO行业 在人工智能领域,GPT-4 等语言模型的演变标志着一个重要的里程碑。 本文深入探讨了 GPT-4 的功能和潜力,同时也思考了人工智能领域的未来。 GPT-4 的出现:人工智能的新时代OpenAI 开发的 GPT-4…

MySQL 缓存策略

MySQL 缓存方案用来干什么 ? 缓存用户定义的热点数据,用户直接从缓存中获取热点数据,降低数据的读写压力。场景分析 内存访问速度是磁盘访问速度的 10 万倍。读的需求远远大于写的需求MySQL 自身缓冲层跟业务无关。MySQL 作为项目主要数据库&#xff0…

idea:springboot项目搭建

目录 一、创建项目 1、File → New → Project 2、Spring Initializr → Next 3、填写信息 → Next 4、web → Spring Web → Next 5、填写信息 → Finish 6、处理配置不合理内容 7、注意事项 7.1 有依赖包,却显示找不到依赖,刷新一下maven 二…

word转PDF的方法 简介快速

在现代办公环境中,文档格式转换已成为一项常见且重要的任务。其中,将Word文档转换为PDF格式的需求尤为突出,将Word文档转换为PDF格式具有多方面的优势和应用场景。无论是为了提高文档的可读性和稳定性、保障文档的安全性和保护机制、还是为了…

赛力斯造车引入强援,原华为智选车产品部部长加盟,任集团副总裁

作者 |德新 编辑 |王博 HiEV从多个信息源获悉,赛力斯造车近日引入一位业界大牛。原华为智选车产品部部长李博已于近日加盟,出任赛力斯集团副总裁。 李博是服役华为多年的老将,长期供职于华为终端生态。在华为体系中,产品部部长相…

Java基础数据结构之队列

一.什么是队列 队列是一种先进先出的数据结构,也就是从左边进从右边出,或者说,只允许在一端插入元素,在另一端删除元素 进行插入操作的一端称为队尾(tail/rear),删除操作的一段称为队头&#…

MyBatis源码分析之基础支持层异常模块

(/≧▽≦)/~┴┴ 嗨~我叫小奥 ✨✨✨ 👀👀👀 个人博客:小奥的博客 👍👍👍:个人CSDN ⭐️⭐️⭐️:传送门 🍹 本人24应届生一枚,技术和水平有限&am…

mac版本的vscode如何运行html文件

1.安装Live Server扩展 需在VS中安装一个拓展插件Live Server,插件寻找方法如下: 2.编写HTML文件 3.启动Live Server 在VSCode中打开你的HTML文件,并点击右键选择"Open with Live Server",或者点击右下角的"Go…

安卓类加载机制

目录 一、ClassLoader介绍二、双亲委托机制三、类的加载过程 一、ClassLoader介绍 任何一个 Java 程序都是由一个或多个 class 文件组成,在程序运行时,需要将 class 文件加载到 JVM 中才可以使用,负责加载这些 class 文件的就是 Java 的类加…

Apache POI处理Miscrosoft Office 各种文件格式的开源项目

介绍: 应用场景 maven 坐标 <dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>3.16</version></dependency><dependency><groupId>org.apache.poi</groupId><artifa…

支付宝小程序模板开发,实现代小程序备案申请

大家好&#xff0c;我是小悟 支付宝小程序备案整体流程总共分为五个环节&#xff1a;备案信息填写、平台初审、工信部短信核验、通管局审核和备案成功。 服务商可以代小程序发起备案申请。在申请小程序备案之前&#xff0c;需要确保小程序基本信息已填写完成、小程序至少存在一…

Java_优先级队列(堆)(Priority Queue)

文章目录 一、优先级队列1.概念 二、优先级队列的模拟1.堆的概念2.堆的存储方式3.堆的创建1、堆向下调整2、堆的创建代码实现3、建堆的时间复杂度 2.堆的插入与删除1、堆的插入2、堆的删除3、完整的堆代码4、练习 一、PriorityQueue常用接口介绍1.PriorityQueue的特性2.Priorit…

Java项目:38 springboot005学生心理咨询评估系统

作者主页&#xff1a;源码空间codegym 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 学生心理咨询评估系统有管理员和用户 【主要功能】 用户管理、试题管理、试卷管理、考试管理 【技术组成】 SpringBoot MyBatis Vue Boots…

Android Studio开发(一) 构建项目

1、项目创建测试 1.1 前言 Android Studio 是由 Google 推出的官方集成开发环境&#xff08;IDE&#xff09;&#xff0c;专门用于开发 Android 应用程序。 基于 IntelliJ IDEA: Android Studio 是基于 JetBrains 的 IntelliJ IDEA 开发的&#xff0c;提供了丰富的功能和插件…