AI学习第二天--监督学习 半监督学习 无监督学习

news2025/3/19 11:43:08

目录

1. 监督学习(Supervised Learning)

比喻:

技术细节:

形象例子:

2. 无监督学习(Unsupervised Learning)

比喻:

技术细节:

形象例子:

3. 半监督学习(Semi-Supervised Learning)

比喻:

技术细节:

形象例子:

4. 三者的对比与选择

表格总结:

5. 实际案例对比

案例:电商平台用户分群

6. 关键逻辑总结


1. 监督学习(Supervised Learning)

比喻

老师带着学生做题,每道题都有标准答案,学生通过练习学会解题方法。
核心有标签的数据(答案已知)。


技术细节
  • 数据形式:输入(X)+ 标签(Y)。
    • 例如:
      • 图像分类:图片(X) + 类别标签(Y,如“猫”或“狗”)。
      • 房价预测:房屋面积、位置(X) + 房价(Y)。
  • 目标:模型学习输入到标签的映射关系(如 f(X)=Yf(X)=Y)。
  • 常见算法线性回归、决策树、神经网络等。

形象例子

场景:学生学数学。

  1. 老师
    • 给出题目和答案(如“3+5=?” → 答案“8”)。
    • 学生通过大量练习(如1000道题+答案)掌握加法规律。
  2. 模型
    • 输入“3+5”,输出“8”。
    • 监督学习的关键:每一步都有明确的“正确答案”指导模型学习。

2. 无监督学习(Unsupervised Learning)

比喻

学生自己探索一堆物品,没有老师指导,只能通过观察找出物品的共同特征或分组
核心无标签的数据(没有答案,需自行发现模式)。


技术细节
  • 数据形式:仅有输入(X),无标签(Y)。
    • 例如:
      • 客户数据(年龄、收入、消费习惯) → 分群(如高收入用户群、低频购物群)。
      • 文本语料库 → 聚类为不同主题。
  • 目标:模型发现数据中的内在结构(如分组、降维)。
  • 常见算法K-Means聚类、PCA降维、自编码器等。

形象例子

场景:学生整理图书馆的书。

  1. 学生
    • 看到一堆书,但没有分类标签(如“科幻”“历史”)。
    • 通过观察书的内容、作者、关键词,将书分为“小说”“科技”“历史”等类别。
  2. 模型
    • 输入客户数据,输出“客户A属于高价值用户群”。
    • 无监督学习的关键:没有答案,模型自己“创造”规则。

3. 半监督学习(Semi-Supervised Learning)

比喻

学生大部分时间自己探索,但偶尔老师给出几个题目的答案,学生结合少量答案和大量无标签数据学习。
核心少量有标签数据 + 大量无标签数据


技术细节
  • 数据形式
    • 少量有标签数据(X, Y) + 大量无标签数据(仅X)。
    • 例如:
      • 医疗数据:100个标注的X光片(有疾病标签) + 10,000个未标注的X光片。
  • 目标:利用少量标签和大量无标签数据提升模型性能。
  • 常见方法
    • 标签传播:用少量标签数据推测无标签数据的标签。
    • 自训练:模型先用有标签数据训练,再预测无标签数据,将高置信度预测结果作为新标签。

形象例子

场景:学生学画画,但只有少量带标签的画作。

  1. 老师
    • 给出10张画作并标注“风景”“人物”等标签。
    • 其他1000张画作无标签。
  2. 学生
    • 先用10张带标签的画学习特征(如“人物画有五官”)。
    • 再观察无标签画作,推测它们的类别(如“这张画有山和树 → 可能是风景”)。
  3. 模型
    • 输入新画作,输出“风景”或“人物”。
    • 半监督学习的关键:用少量标签引导,大量无标签数据扩展知识。

4. 三者的对比与选择

表格总结
类型数据形式目标适用场景优缺点
监督学习X(输入) + Y(标签)学习输入到标签的映射分类、回归(如图像识别、房价预测)需大量标注数据,但模型性能通常更好。
无监督学习X(输入)无标签发现数据内在结构聚类、降维(如客户分群、文本主题分析)不需要标注数据,但结果可能需要人工解释。
半监督学习少量(X,Y) + 大量X结合有/无标签提升性能标注成本高但数据量大的场景(如医疗、图像)兼顾监督和无监督的优点,但实现复杂,需平衡两者。

5. 实际案例对比

案例:电商平台用户分群
  • 监督学习
    • 数据:用户行为数据(点击、购买) + 标签(“高价值用户”或“低价值用户”)。
    • 模型:训练分类器,预测新用户是否是高价值用户。
  • 无监督学习
    • 数据:用户行为数据(无标签)。
    • 模型:聚类为“高活跃用户群”“价格敏感用户群”等。
  • 半监督学习
    • 数据:100个标注用户(高/低价值) + 10,000个无标签用户。
    • 模型:用少量标签引导聚类,提升用户分群的准确性。

6. 关键逻辑总结

  • 监督学习有答案,学得准,但成本高
  • 无监督学习无答案,靠探索,成本低但需解释
  • 半监督学习少量答案+大量数据,性价比高,但需平衡

用一句话概括:
“监督学习是‘有答案的考试’,无监督学习是‘无答案的探险’,半监督学习是‘带着少量答案去探险’。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2317768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式(创建型)-抽象工厂模式

摘要 在软件开发的复杂世界中,设计模式作为解决常见问题的最佳实践方案,一直扮演着至关重要的角色。抽象工厂模式,作为一种强大的创建型设计模式,在处理创建一系列或相关依赖对象的场景时,展现出了独特的优势和灵活性。它通过提供一个创建对象的接口,让开发者能够在不指定…

观察者模式详解:用 Qt 信号与槽机制深入理解

引言 你是否曾遇到这样的需求:一个对象的状态发生变化后,希望通知其他对象进行相应的更新?比如: 新闻订阅系统:当新闻发布后,所有订阅者都会收到通知。股票行情推送:股价变化时,所…

OSWorld:开启多模态智能体的真实计算机环境革命

OSWorld:开启多模态智能体的真实计算机环境革命 在人工智能技术突飞猛进的今天,多模态智能体正逐步突破实验室的限制,试图融入人类的日常工作场景。然而,如何评估这些智能体在真实计算机环境中处理开放式任务的能力,成为学术界和产业界共同关注的难题。2024年,由xlang-ai…

LabVIEW烟气速度场实时监测

本项目针对燃煤电站烟气流速实时监测需求,探讨了静电传感器结构与速度场超分辨率重建方法,结合LabVIEW多板卡同步采集与实时处理技术,开发出一个高效的烟气速度场实时监测系统。该系统能够在高温、高尘的复杂工况下稳定运行,提供高…

强化学习基础篇二:马尔可夫决策过程

写在前面 本文是对李沐等“动手学强化学习”教程的个人阅读总结,原文链接:动手学强化学习。 第3章 马尔可夫决策过程 3.1 重要性 马尔可夫决策过程是强化学习中的基础概念,强化学习中的环境就是一个马尔可夫决策过程,与多臂老虎…

EtherCAT转profinet网关集成汽车变速箱制造生产线自动化升级

客户的汽车零部件制造商需要升级其变速箱齿轮加工生产线,面临的关键挑战是整合新引进的欧洲齿轮精密检测设备(基于EtherCAT协议)与现有使用profinet协议自动化系统通信。 企业核心控制平台基于西门子PLC,而现场各工位采用分布式I/…

tongweb7控制台无法访问

tongweb7控制台无法访问 排查 1.首先确认版本,如果版本是轻量级版本,轻量版不支持会话(session)的备份和复制、管理控制台、APM 运维工具等企业级增量功能。 2.查看端口 命令:ss -tnlp 或者netstat -tnlp 确认控制台端口是否开启 3.在conf…

【STM32】从新建一个工程开始:STM32 新建工程的详细步骤

STM32 开发通常使用 Keil MDK、STM32CubeMX、IAR 等工具来创建和管理工程。此处是 使用 Keil MDK5 STM32CubeMX 创建 STM32 工程的详细步骤。 新建的标准库工程文件已上传至资源中,下载后即可直接使用。 标准库新建 STM32 工程的基本目录结构:STD_STM…

搞定python之九----常用内置模块

本文是《搞定python》系列文章的第九篇,介绍常用的内置模块的使用。到此为止python的基础用法就彻底说完了,大家可以在此基础上学习爬虫、web处理等框架了。 本文的代码相对比较多,大家注意看代码即可。python的文档我贴出来,毕竟…

判断是不是完全二叉树(C++)

目录 1 问题描述 1.1 示例1 1.2 示例2 1.3 示例3 2 解题思路 3 代码实现 4 代码解析 4.1 定义队列,初始化根节点 4.2 层序遍历,处理每个节点 4.3 处理空节点 4.4 处理非空节点 5 总结 1 问题描述 给定一个二叉树,确定他是否是一…

神经外科手术规划的实现方案及未来发展方向

Summary: 手术规划软件 效果图,样例: 神经外科手术规划样例: 神经外科手术规划,三维重建,三维建模,三维可视化 Part1: 手术规划的定义与作用 一、手术规划的定义 手术规划是指在手术前,通过详…

easypoi导入Excel兼容日期和字符串格式的日期和时间

问题场景 在使用easypoi导入Excel时,涉及到的常用日期会有yyyy-MM-dd HH:mm:ss、yyyy-MM-dd和HH:mm:ss,但是Excel上面的格式可不止这些,用户总会输入一些其他格式,如 如果在定义verify时用下面这种格式定义,那么总会…

【计算机视觉】工业表计读数(2)--表计检测

1. 简介 工业表计(如压力表、电表、气表等)在工控系统、能源管理等领域具有重要应用。然而,传统人工抄表不仅工作量大、效率低,而且容易产生数据误差。近年来,基于深度学习的目标检测方法在工业检测中展现出极大优势&…

Zbrush插件安装

安装目录在: ...\Zbrush2022\ZStartup\ZPlugs64

LeRobot源码剖析——对机器人各个动作策略的统一封装:包含ALOHA ACT、Diffusion Policy、VLA模型π0

前言 过去2年多的深入超过此前7年,全靠夜以继日的勤奋,一天当两天用,抠论文 抠代码 和大模型及具身同事讨论,是目前日常 而具身库里,idp3、π0、lerobot值得反复研究,故,近期我一直在抠π0及l…

OpenCV基础【图像和视频的加载与显示】

目录 一.创建一个窗口,显示图片 二.显示摄像头/多媒体文件 三.把摄像头录取到的视频存储在本地 四.鼠标回调事件 五.TrackBar滑动条 一.创建一个窗口,显示图片 import cv2img_path "src/fengjing.jpg" # 自己的图片路径 img cv2.imre…

杨校老师课堂之编程入门与软件安装【图文笔记】

亲爱的同学们,热烈欢迎踏入青少年编程的奇妙世界! 我是你们的授课老师杨校 ,期待与大家一同开启编程之旅。 1. 轻松叩开编程之门 1.1 程序的定义及生活中的应用 程序是人与计算机沟通的工具。在日常生活中,像手机里的各类 APP、电…

Excel(函数篇):IF函数、FREQUNCY函数、截取函数、文本处理函数、日期函数、常用函数详解

目录 IF函数等于判断区间判断与AND函数、OR函数一同使用IFNA函数和IFERROR函数 FREQUNCY函数、分断统计LEFT、RIGHT、MID截取函数FIND函数、LEN函数SUBSTITUTE函数ASC函数、WIDECHAR函数实战:如何获取到表中所有工作簿名称文本处理函数TEXT函数TEXTJOIN函数 日期函数…

利用大语言模型生成的合成数据训练YOLOv12:提升商业果园苹果检测的精度与效

之前小编分享过关于《YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度》,改进YOLO11算法后,进行苹果树的实例分割。本期文章我们将分享关于最新的YOLO12算法改进的苹果目标检测。 论文题目:Improved YOLOv12 with LLM-Gen…

整合百款经典街机游戏的模拟器介绍

对于80、90后而言,街机游戏承载着童年的欢乐记忆。今天要给大家介绍一款超棒的软件——「MXui街机厅经典游戏101款」,它能带你重回那段热血沸腾的街机时光。 「MXui街机厅经典游戏101款」是一款绿色免安装的街机模拟器,体积约1.39G。无需繁琐…