机器学习(ML)策略

news2025/1/11 21:57:30

目录

1、正交化的概念

2、单一数字评估指标(Single number evaluation metric)

3、训练/开发/测试集划分

4、迁移学习

5、多任务学习

6、端到端深度学习


1、正交化的概念

正交化是机器学习中一种常用的数据预处理技术,用于减少特征之间的相关性。在机器学习中,特征之间的相关性可能会导致模型过拟合或者降低模型的性能。正交化的主要目标是通过线性变换将特征向量转化为正交或近似正交的向量。通过正交化,我们可以得到一组新的特征向量,这些特征向量之间是正交的或者近似正交的。这样做可以减少特征之间的相关性,提高模型的性能和稳定性。正交化方法可以通过以下步骤实现:

(1)、中心化:将特征向量的均值移动到原点,这样可以消除特征之间的偏差

(2)、标准化:将特征向量的方差缩放到单位方差,这样可以消除特征之间的尺度差异

(3)、特征向量的协方差矩阵:计算特征向量的协方差矩阵,该矩阵描述了特征之间的相关性

(4)、特征向量的正交化:使用特征向量的协方差矩阵进行特征值分解,得到特征向量的正交基。这些正交基可以作为新的特征向量,用于替换原始的特征向量

2、单一数字评估指标(Single number evaluation metric

  •   𝐴有 95%的查准率,这意味着你的分类器说这图有猫的时候,有 95%的机会是猫
  • 查全率 就是,对于所有真猫的图片,你的分类器正确识别出了多少百分比。实际为猫的
    图片中,有多少被系统识别出来?如果分类器 𝐴 查全率是 90% ,这意味着对于所有的图像,
    比如说你的开发集都是真的猫图,分类器 𝐴 准确地分辨出了其中的 90%
  •  但使用查准率和查全率作为评估指标的时候,有个问题,如果分类器𝐴在查全率上表现更好,分类器𝐵在查准率上表现更好,就无法判断哪个分类器更好,所以此时要找出一个新的评估指标  

  • 在数学中,这个函数叫做查准率𝑃和查全率𝑅的调和平均数。但非正式来说,你可以将 它看成是某种查准率和查全率的平均值,只不过你算的不是直接的算术平均,而是用这个公式定义的调和平均。这个指标在权衡查准率和查全率时有一些优势

  • 但在这个例子中,你可以马上看出,分类器𝐴的𝐹1分数更高。假设𝐹1分数是结合查准率和查全率的合理方式,你可以快速选出分类器𝐴,淘汰分类器𝐵

3、训练/开发/测试集划分

  • 开发集和测试集为什么必须来自同一分布
(1)、在机器学习中,开发集(也称为训练集)和测试集是用于评估模型性能的数据集。这两个
数据集的来源必须来自同一分布,也就是说它们应该具有相似的数据分布
(2)、在机器学习中,开发集(也称为训练集)和测试集是用于评估模型性能的数据集。这两个
数据集的来源必须来自同一分布,也就是说它们应该具有相似的数据分布
  • 如果训练集和测试集来自不同的分布,可能会导致以下问题:

(1)、偏差(Bias):如果训练集和测试集的数据分布不同,模型可能会在测试集上产生较高的

偏差。这意味着模型无法捕捉到测试集中的真实模式和规律

(2)、方差(Variance):如果训练集和测试集的数据分布不同,模型可能会在测试集上产生较

高的方差。这意味着模型过于敏感,无法泛化到测试集中的新样本

(3)、隐含偏见(Implicit Bias):如果训练集和测试集的数据分布不同,模型可能学习到训练集

特有的偏见和规律,而无法适应测试集中的数据

4、迁移学习

  • 迁移学习(Transfer Learning)是一种机器学习技术,它利用已经在一个任务上学习到的知识来改善在另一个相关任务上的学习表现。 在深度学习中,迁移学习可以通过复用预训练的神经网络模型的特征层来加速新任务的训练过程。通常情况下,预训练的模型是在大规模的数据集上进行训练的,因此它们可以捕捉到通用的特征表达。通过将这些通用特征应用于新任务,可以避免从头开始训练一个新的深度神经网络,从而节省时间和计算资源。迁移学习在许多应用中都非常有用,尤其是当新任务的数据集较小或者类别之间具有相似性时
  • 迁移学习的作用

(1)、加速训练过程:通过利用预训练模型的参数或特征,可以缩短新任务的训练时间,因为预训练模型已经学习到了通用的特征表达

(2)、解决数据不足问题:当新任务的数据集较小或者标注困难时,可以利用预训练模型的知识来提升模型的泛化能力和性能

(3)、避免过拟合:当新任务的数据集较小,如果从零开始训练一个深度神经网络,很容易导致过拟合。而迁移学习可以通过利用预训练模型的参数和特征来减少过拟合的风险

(4)、处理领域转移:当新任务与预训练模型的任务存在一定的相似性时,迁移学习可以将已学习到的知识应用到新任务中,从而提升模型性能

(5)、 提高模型的泛化能力:通过迁移学习,模型可以从大规模数据集中学习到通用的特征表达,使得模型具有更好的泛化能力,可以适应不同的任务和领域

5、多任务学习

(1)、多任务学习(multi-task learning)是一种机器学习方法,通过同时学习多个相关任务来提高整体学习性能。在多任务学习中,模型通过共享底层的特征表示来学习多个任务之间的相关性,从而使得每个任务的学习过程可以互相促进和辅助

(2)、传统的机器学习方法通常只针对单个任务进行建模和训练,但实际问题中往往存在多个相关的任务。多任务学习的目标是通过同时学习多个任务,从中获取更多的信息和知识,提高模型的泛化能力和性能

(3)、多任务学习的优势在于可以通过共享特征学习来提高模型的学习效率和数据利用率。当不同任务之间存在相关性时,多任务学习可以通过共享底层特征的方式进行知识迁移,从而减少对大量标注数据的需求

(4)、多任务学习有多种形式,包括硬共享(hard sharing)、软共享(soft sharing)和共享子空间(shared subspace)等。硬共享指的是多个任务共享相同的底层特征表示,而软共享则是在共享的底层特征表示上学习不同的任务特定的表示。共享子空间则是通过降维的方式将多个任务映射到同一个低维子空间中进行学习

(5)、多任务学习在自然语言处理、计算机视觉、语音识别等领域广泛应用,并取得了很好的效果。它为解决复杂任务提供了一种有效的学习策略,能够充分利用不同任务之间的相关性,提高模型的泛化能力和性能

6、端到端深度学习

(1)、端到端学习(end-to-end learning)是一种机器学习方法,可以直接从原始输入数据到最终输出结果进行学习,省去了手工设计的特征工程步骤。在端到端学习中,模型可以直接从原始数据中学习到高级抽象特征,并通过后续的处理步骤直接输出最终的结果,而无需人为介入

(2)、传统的机器学习方法通常需要手动提取和选择特征,这个过程需要专业知识和大量的人工努力。而端到端学习通过神经网络等深度学习模型的使用,可以自动地从原始数据中学习到适合任务的特征表示。这种端到端的学习方式可以更好地利用数据中的信息,减少了特征工程的复杂性和主观性

(3)、端到端学习的优势在于它能够直接从原始数据中学习到抽象级别较高的特征,从而能够更好地适应不同的任务和数据分布。它可以减少人工设计特征的工作量,并且可以更好地处理复杂任务,如语音识别、图像识别、自然语言处理等

(4)、然而,端到端学习也存在一些挑战。由于模型需要从原始数据中学习到所有的特征表示和模式,模型的复杂度较高,需要更多的训练数据和计算资源。此外,端到端学习可能难以解释学习过程中的特征和决策规则,缺乏可解释性

(5)、尽管存在挑战,端到端学习已经在许多领域取得了重要的突破,成为现代机器学习的一种重要方法。它为解决复杂任务提供了一种直接从数据中学习的方式,使得机器学习更具智能和自动化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722559.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IMX6ull SPI 协议

一 SPI 简介 1.1 SPI SPI 全称是 Serial Perripheral Interface,也就是串行外围设备接口。 SPI 是 Motorola 公司推出的一种同步串行接口 技术,是一种高速、全双工的同步通信总线, SPI 时钟频率相比 I2C 要高很多,最高可以工作 …

【IT服务管理】MITRE :IT服务管理

定义: 信息技术 (IT) 服务管理 (ITSM) 是解决管理、支持和交付 IT 服务的最佳实践的框架、流程和模型的通用保护伞。IT 服务可能包括(由 NIST 为云计算定义):软件即服务 (SaaS)、平台即服务 (PaaS) 和基础设施即服务 (IaaS)。 关键…

DevExpress WPF Scheduler组件,快速构建性能优异的调度管理器!(下)

在上文中(点击这里回顾>>),我们介绍了DevExpress WPF Scheduler组件中的日历视图、时间轴视图等,在本文中我们将继续带大家了解Scheduler组件的UI/UX自定义等其他功能。 DevExpress WPF拥有120个控件和库,将帮助…

Spring Boot 61:JPA 中的级联类型

Spring Boot 61:JPA 中的级联类型 图源:简书 (jianshu.com) 关系型数据库的增删改查操作会因为有关联关系而存在“级联操作”的需要,体现在 JPA 中,就是实体中会定义的级联类型(Cascade Type)。 JPA 中的…

【二维属性+贪心+双指针】ABC 195 D

D - Shipping Center (atcoder.jp) 题意: 思路: 经典中的经典,二维属性,对于其中的一个关键字排序,然后双指针将合法的可行解放入容器中,再去容器中找最优解,用双指针是因为它具有单调性 这里…

18-Linux 常用命令

目录 1.ls PS:FinalShell设置背景和字体 2.pwd 3.cd PS:认识 Linux 目录结构——Linux 是一个树形目录结构 PS:绝对路径 vs 相对路径 PS:使用 tab 键补全 PS:使用 ctrl c 重新输入 4.touch PS:L…

基于梯度下降算法的无约束函数极值问题求解

基于梯度下降算法的无约束函数极值问题求解 1 知识预警1.1导数1.2偏导数1.3方向导数1.4梯度 2 梯度下降算法3 无约束函数极值问题求解3.1 算例13.1.1 Python编程求解3.1.2 求解结果与可视化 3.2 算例2 Rosenbrock函数3.2.1 Python编程求解3.2.2 求解结果与可视化 1 知识预警 1…

JSON多层级数据自动映射值优化

JSON多层级数据自动映射值优化 FieldMethodHandles结果分析 Spring boot装载模板代码工程中,JSON多层级数据自动映射值只是简单封装JsonPath,对DTO的声明字段做foreach轮询,检查字段注解JPath,然后从JsonPath的解析缓存中读取JPat…

数字孪生三维可视化在海洋能源开发中的应用有哪些?

数字孪生是一种将现实世界中的实体、系统或过程在虚拟世界中重构,并相互映射和交互的领先技术。在能源领域,数字孪生技术可谓大有作为,比如通过实时监测和分析各种数据,提高能源的利用效率、降低能源成本、优化能源分配&#xff0…

【零基础入门学习Python---Python中机器学习和人工智能之快速入门实践】

🚀 零基础入门学习Python🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜…

android_mars老师_获取用户定位

结果展示 MainActivity package com.example.locationmanager;import androidx.annotation.NonNull; import androidx.appcompat.app.AppCompatActivity;import android.annotation.SuppressLint; import android.content.Context; import android.location.Location; import …

JavaWeb 笔记——3

JavaWeb 笔记——3 JavaWeb技术栈一、HTTP1.1、HTTP介绍1.2、HTTP请求数据格式1.3、HTTP响应数据格式 二、Web服务器 - Tomcat2.1、简介&基本使用2.2、Tomcat配置和部署项目2.3、Web项目结构2.4、创建MavenWeb项目2.5、IDEA集成本地Tomcat2.6、Tomcat-Tomcat Maven插件 三、…

23西安电子科技大学通信工程学院811考研录取情况

01、通信工程学院各个方向 02、23通信工程学院一志愿考研录取情况总览、平均分 PS:通院23年院线相对于22年院线上涨5-15分,个别专业下降10分反应西电通院热度23年和22年基本一致。 PS:1、通院23年比较多的考生在本部学硕、专硕扎堆&#xff…

【花雕】全国青少年机器人技术一级考试备考实操搭建手册6

随着科技的不断进步,机器人技术已经成为了一个重要的领域。在这个领域中,机械结构是机器人设计中至关重要的一部分,它决定了机器人的形态、运动方式和工作效率。对于青少年机器人爱好者来说,了解机械结构的基础知识,掌…

yolov7论文学习——创新点解析、网络结构图

创新点 1、提出了E-ELAN,但是只在yolov7-e6e中使用到。 2、yolov7基于拼接模型的缩放方法,在yolov7x中使用到。 3、将重参数化卷积应用到残差模块中或者用到基于拼接的模块中去。RepConvN 4、提出了两种新的标签分配方法 一、ELAN和E-ELAN 1、 ELAN …

AI 如何应对 DevOps 监控和可观察性挑战

持续监控和可观察性用例 CI异常检测: AI可以分析历史数据以检测持续集成阶段的异常。任何不寻常的变化都可以在进入下一阶段之前进行标记以供审查。IBM Watson AnomalyDetection 等工具可以通过使用 AI 检测模式和异常情况来帮助识别这些异常情况。 代码质量保证&…

如何快速定位linux故障

1、背景 有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务器进一步深入分析问题的根源。那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题。所以&#xff0c…

防火墙详解

1、什么是防火墙? 防火墙( Firewall )是防止火灾发生时,火势烧到其它区域,使用由防火材料砌的墙。 后来这个词语引入到了网络中,把从外向内的网络入侵行为看做是火灾,防止这种入侵的策略叫做防…

批量多开谷歌浏览器丨非扩展chrome浏览器实现分身多开微博 切换多个微博帐号工具

教你多开用Google 浏览器 实现Chrome怎样同时登录多个微博号 按照此教程多开后的Google浏览器可以实现相互的独立性,每个浏览器上收藏的书签、增加的拓展程序都可以实现独立性并可实现独立记忆性 一、安装正版Google浏览器 1:安装位置最好选择非C盘 二…

基于低代码平台打造的焙乐道销售支持系统

编者按:低代码平台说了那么多,在实际应用中又是怎样体现的它的种种优势呢?今天小编结合实际案例来说说。 本文是以最大的烘焙原料产商——焙乐道的销售支持系统为例子,进行说明。 客户说明:焙乐道是一家国际性集团公司…