【大厂AI课学习笔记】【2.2机器学习开发任务实例】(8)模型训练

news2025/1/23 8:06:42

好吧,搞了半天,都是围绕数据在干活,这也就验证了,我们说的,数据准备等工作,要占到机器学习项目一半以上的工作量和时间。而且数据决定了模型的天花板,算法只是去达到上限。

我们今天来学习模型训练!

首先,我们来进行线性回归训练,如上图。

当训练到loss小于0.0001时停止,如右图,此时训练结合与验证集标注之间的MSE=22.073。

那么我们来解释下,什么是loss,什么是mse。

loss,损失函数、误差函数,即用1个标量来标示的训练集标签与真实标签之间的差距。

那MSE呢?

MSE就是均方差,参数估计值与参数值之差平方的期望值。

延伸学习:


在机器学习项目中,模型训练是至关重要的一环,它涉及使用已知数据(训练集)来训练算法,以便模型能够学习数据的内在规律和模式,进而对未知数据(测试集)进行准确预测。下面将系统阐述模型训练的过程、关键技术、步骤以及损失函数(如loss和均方误差MSE)的应用和重要作用。

一、模型训练的基本步骤

  1. 数据准备:这是模型训练的第一步,包括数据收集、清洗、预处理和特征工程。数据质量对模型性能有直接影响,因此确保数据准确、完整、一致和具有代表性至关重要。特征工程涉及从原始数据中提取和构造有意义的特征,以便模型能够更好地理解数据。

  2. 选择模型:根据问题的性质和数据的特征选择合适的机器学习算法。例如,对于分类问题可以选择决策树、随机森林、支持向量机等算法;对于回归问题可以选择线性回归、神经网络等算法。

  3. 训练模型:使用训练数据和选择的算法来训练模型。在这个过程中,算法会通过迭代优化来学习数据的特征和模式。通常,模型训练需要设置一些超参数,如学习率、迭代次数等,这些参数会影响模型的训练速度和性能。

  4. 评估模型:使用验证集或测试集来评估模型的性能。评估指标根据问题的不同而有所不同,如分类问题中常用的准确率、召回率、F1分数等;回归问题中常用的均方误差(MSE)、平均绝对误差(MAE)等。

  5. 模型调优:根据评估结果对模型进行调优,包括调整超参数、改变模型结构或采用其他优化策略。调优的目标是提高模型在未知数据上的泛化能力。

  6. 部署与应用:将训练好的模型部署到生产环境中,以便对实际数据进行预测和分析。在部署过程中需要考虑模型的实时性、稳定性、可解释性等因素。

二、关键技术

  1. 梯度下降算法:梯度下降是机器学习中最常用的优化算法之一,用于最小化损失函数。它通过计算损失函数关于模型参数的梯度,并按照负梯度方向更新参数,从而逐步降低损失函数的值。梯度下降有多种变体,如批量梯度下降、随机梯度下降和小批量梯度下降等。

  2. 正则化技术:正则化是一种用于防止模型过拟合的技术。通过在损失函数中添加正则化项(如L1正则化、L2正则化等),可以约束模型参数的规模,从而降低模型的复杂度,提高其在未知数据上的泛化能力。

  3. 集成学习:集成学习是一种通过组合多个弱学习器来构建一个强学习器的技术。常见的集成学习方法包括袋装(Bagging)、提升(Boosting)和堆叠(Stacking)等。这些方法可以有效地提高模型的性能,并降低过拟合的风险。

  4. 深度学习:深度学习是机器学习的一个分支,它利用神经网络模型来处理大规模、高维度的数据。深度学习模型通常由多层神经元组成,每一层都从前一层学习并提取更高级别的特征表示。深度学习在图像识别、语音识别、自然语言处理等领域取得了显著成果。

三、损失函数的应用与重要作用

损失函数(Loss Function)在机器学习模型训练中起着至关重要的作用。它用于量化模型预测与真实值之间的差异,从而指导模型的优化方向。均方误差(Mean Squared Error, MSE)是回归问题中常用的损失函数之一。

MSE的定义:对于给定的样本集(D = {(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)}),其中(x_i)是输入特征,(y_i)是对应的真实值。模型对(x_i)的预测值为(\hat{y}_i)。均方误差MSE定义为:

[MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2]

MSE衡量了模型预测值与真实值之间的平均平方误差,值越小表示模型的预测越准确。

MSE的应用:在模型训练过程中,优化算法会不断调整模型参数以最小化MSE。通过计算损失函数关于模型参数的梯度,并使用梯度下降等优化算法进行参数更新,可以逐步降低MSE的值,从而提高模型的预测精度。

MSE的重要作用

  1. 指导模型优化:MSE为模型提供了一个明确的优化目标。通过最小化MSE,模型可以学习到数据的内在规律和模式,从而对未知数据进行准确预测。

  2. 评估模型性能:除了用于模型训练外,MSE还可以用于评估模型的性能。通过计算测试集上的MSE值,我们可以了解模型在未知数据上的预测精度和泛化能力。

  3. 比较不同模型:使用相同的损失函数(如MSE)可以方便地比较不同模型的性能。具有较低MSE值的模型通常具有更好的预测性能。

  4. 发现过拟合与欠拟合:观察训练集和验证集上的MSE变化可以帮助我们发现模型的过拟合与欠拟合问题。如果训练集上的MSE持续降低而验证集上的MSE开始上升,则可能出现了过拟合;如果两者都保持较高水平且下降缓慢,则可能出现了欠拟合。针对这些问题,我们可以采取相应的措施进行调整和优化。

选择模型时,有分类问题,有回归问题,都有不同的算法。

 

在机器学习中,除了分类问题和回归问题,还有其他几种基本的问题类型,这些问题类型在解决实际问题时也非常常见。下面列举了与分类和回归同级别的几种机器学习问题类型,并分别给出了适合解决的实际问题示例:

  • 聚类问题(Clustering)
    • 定义:聚类是将无标签的数据分成多个组或簇,使得同一组内的数据项尽可能相似,而不同组之间的数据项尽可能不同。
    • 适合解决的实际问题
      • 市场细分:根据消费者的购买历史、兴趣爱好等信息将消费者划分为不同的群体,以进行更精准的市场营销。
      • 文档聚类:将大量的文档按照主题或内容相似性进行分组,便于信息检索和推荐。
      • 图像分割:在图像处理中,将图像中的像素或区域根据颜色、纹理等特征进行聚类,以实现图像分割和目标识别。
  • 降维问题(Dimensionality Reduction)
    • 定义:降维是指将高维数据转换为低维表示,同时保留数据中的重要信息或结构。
    • 适合解决的实际问题
      • 数据可视化:当数据的维度很高时,直接可视化很困难。降维技术(如主成分分析PCA)可以将数据降至2D或3D,从而方便可视化分析。
      • 特征提取:在机器学习任务中,原始数据可能包含许多冗余或不相关的特征。降维可以帮助提取出最重要的特征,减少计算复杂度和过拟合风险。
      • 噪声去除:通过降维可以去除数据中的噪声和异常值,提高后续机器学习模型的性能。
  • 关联规则学习(Association Rule Learning)
    • 定义:关联规则学习旨在从数据集中发现项集(itemsets)之间的有趣关系,这些关系通常以规则的形式表示,如“如果购买了A,则很可能也购买B”。
    • 适合解决的实际问题
      • 购物篮分析:在零售领域中,分析顾客购买商品时的组合模式,以进行产品推荐和库存优化。
      • 网络日志分析:通过分析网站用户的访问模式,发现页面之间的关联规则,优化网站结构和提高用户体验。
  • 序列预测(Sequence Prediction)
    • 定义:序列预测涉及到预测时间序列数据中的未来值或序列的后续元素。
    • 适合解决的实际问题
      • 股票价格预测:根据历史股票价格数据和其他相关信息,预测未来一段时间内的股票价格走势。
      • 语音识别:在语音处理中,预测给定音频序列的下一个可能的声音或词汇。
      • 自然语言处理:预测句子中下一个可能出现的单词或字符,这在文本生成、机器翻译等领域有广泛应用。
  • 强化学习(Reinforcement Learning)
    • 定义:强化学习是一种通过与环境互动来学习最佳决策策略的机器学习范式。智能体(agent)通过执行动作(actions)并接收来自环境的奖励(rewards)来学习如何最大化累积奖励。
    • 适合解决的实际问题
      • 游戏AI:训练智能体在视频游戏、棋类游戏等环境中达到或超越人类玩家的水平。
      • 自动驾驶:通过强化学习训练自动驾驶车辆在不同路况和交通情况下的驾驶策略。
      • 机器人控制:教授机器人执行各种任务,如抓取、导航等,通过试错学习最优控制策略。
  • 生成模型(Generative Modeling)
    • 定义:生成模型能够学习数据的潜在分布,并从中生成新的、与训练数据类似的数据样本。
    • 适合解决的实际问题
      • 图像生成:生成逼真的图像,可用于艺术创作、数据增强或图像修复等任务。
      • 文本生成:生成连贯的文本段落,如新闻报道、故事创作或诗歌生成等。
      • 声音合成:生成人类语音或音乐,可用于语音助手、虚拟角色或音乐创作等领域。
  • 回归问题(Regression)

    • 定义:回归问题是另一种常见的机器学习问题类型,其目标是预测一个连续值输出,而不是离散的类别标签。回归模型通过学习输入数据与连续输出之间的映射关系来进行预测。
    • 适合解决的实际问题
      • 价格预测:根据商品的历史价格、市场需求和供应链信息等因素预测未来的价格趋势。
      • 预测分析:在金融、经济、环境科学等领域中,根据历史数据和其他相关因素预测未来的趋势或结果。例如,股票价格预测、气候变化预测等。
      • 推荐系统:虽然推荐系统通常与分类和聚类问题相关联,但回归模型也可以用于预测用户对项目的评分或偏好程度,从而实现个性化推荐。
    • 常用算法:线性回归、多项式回归、岭回归(Ridge Regression)、套索回归(Lasso Regression)、支持向量回归(SVR)、神经网络等。这些算法旨在最小化预测值与真实值之间的误差,通常使用均方误差(MSE)或其他损失函数来衡量模型的性能。
  • 分类问题(Classification)

    • 定义:分类问题是机器学习中最常见的问题类型之一,其目标是根据输入数据的特征将其划分到预定义的类别中。这些类别通常是离散的、无序的,并且数量有限。
    • 适合解决的实际问题
      • 图像识别:根据图像的视觉特征将其分类为不同的对象、场景或概念。例如,人脸识别、物体检测、手写数字识别等。
      • 文本分类:根据文本内容将其分类为不同的主题、情感或类别。例如,垃圾邮件检测、新闻分类、情感分析等。
      • 生物信息学:在基因组学或蛋白质组学中,根据生物分子的特征将其分类为不同的功能类别或疾病类型。
    • 常用算法:决策树、朴素贝叶斯、支持向量机(SVM)、随机森林、神经网络(包括深度学习模型)等。

需要注意的是,分类问题和回归问题在实际应用中经常相互交织。例如,在某些情况下,可以将多分类问题转换为多个二元分类问题来处理;同样地,在某些场景中,连续值的预测也可以转换为离散类别的预测。因此,在选择合适的问题类型和算法时,需要仔细分析具体的应用场景和数据特征。

每种问题类型都有其特定的应用场景和算法,选择合适的问题类型和算法是解决机器学习问题的关键步骤之一。

所以说,本案例中的价格预测,就是回归问题,就要用线性回归算法来解决。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1468580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

优秀实践| 运营商核心系统国产数据库迁移实践

作者介绍 陕西移动信息技术部 张云川 陕西移动信息技术部 王永强 新炬网络中北三部 张建 随着国家对自主可控战略的深入推进,笔者所在省份聚焦数据库国产化替换,全面加速数据库国产化替换进程。以核心系统带动周边系统,成功在能力运营中…

EasyRecovery易恢复16软件最新中文版本下载

一、主要功能与特点 EasyRecovery易恢复16是一款专业的数据恢复软件,其主要功能和特点包括: 全面的数据恢复:支持恢复因误删除、格式化、系统崩溃、病毒攻击等多种原因丢失的数据。深度扫描技术:对于严重损坏或格式化的存储设备…

【坑】Spring Boot整合MyBatis,一级缓存失效

一、Spring Boot整合MyBatis,一级缓存失效 1.1、概述 MyBatis一级缓存的作用域是同一个SqlSession,在同一个SqlSession中执行两次相同的查询,第一次执行完毕后,Mybatis会将查询到的数据缓存起来(缓存到内存中&#xf…

Flutter Engine 编译

本地环境 Flutter 开发基本环境配置,SDK【】 MAC. M2芯片 git工具 python环境[MAC自带] xcode Chromium depot_tools depot_tools 是调试 Flutter 引擎的必备工具包,包含了 gclient、gn 和 ninja 等工具,这些在下面会用到!…

洛谷P5738 歌唱比赛 题解

#题外话&#xff08;第37篇题解&#xff09;&#xff08;本题为普及-难度&#xff09; #先看题目 题目链接https://www.luogu.com.cn/problem/P5738 #思路&#xff08;好像和P5726-打分有点像&#xff0c;参考一下&#xff09; #代码 #include <bits/stdc.h> using na…

谈谈智能机器人智能电表运维管理体系在铁路牵引变电所建设构想

关键词&#xff1a;智能移动机器人状态检测分析决策智能化管理 0前言 牵引变电所是铁路机车供电的来源&#xff0c;是保障铁路运行的基本环节&#xff0c;经过多年的改造和发展&#xff0c;牵引变电所在我国大部分的铁路线路中已经得到了合理的覆盖&#xff0c;无人值班牵引变…

【ArcGIS微课1000例】0104:二位面状数据转三维多面体(建筑物按高度拉伸)

文章目录 一、加载数据二、添加高度字段三、三维拉伸显示四、生成三维体数据五、注意事项一、加载数据 打开ArcScene,加载配套实验数据(0104.rar中的二维建筑物矢量数据,订阅专栏,获取专栏所有文章阅读权限及配套数据),如下图所示: 二、添加高度字段 本实验将二维数据…

VUE基础知识九 ElemrntUI项目

ElementUI官网 一 项目 最终完成的效果&#xff1a; 切换上边的不同按钮&#xff0c;下方显示不同的表格数据 在src/components下新建不同业务组件的文件夹 1.1 搭建项目 使用脚手架搭建项目后&#xff0c;引入ElementUI&#xff08;搭建、引入ElementUI步骤在第七节里已…

第二篇:CamX初认识(框架、代码结构介绍)

第二篇:CamX初认识 这篇文章分下面几点来展开: 1、CamX整体架构图; 2、CamX基本组件及其概念; 3、CamX代码目录结构; 4、CamX相关名词; 一、CamX整体架构图 目前Android主流的机型,采用高通芯片的,使用的基本都是camx架构。 之前旧的架构叫做mm-camera,camx架构…

【风格迁移】CAST:对比学习,从图像特征而非其二阶统计量(Gram矩阵)中学习风格

CAST&#xff1a;对比学习&#xff0c;从图像特征而非其二阶统计量&#xff08;Gram矩阵&#xff09;中学习风格 提出背景5 why 分析5 so分析 CAST 框架多层风格投影器领域增强模块生成网络 效果对比 StyleGAN 提出背景 论文&#xff1a;https://arxiv.org/pdf/2205.09542.pdf…

黑色金属冶炼5G智能工厂数字孪生可视化管控系统,推进金属冶炼行业数字化转型

黑色金属冶炼5G智能工厂数字孪生可视化管控系统&#xff0c;推进金属冶炼行业数字化转型。随着科技的不断发展&#xff0c;数字化转型已经成为各行各业发展的必然趋势。金属冶炼行业作为传统工业的重要组成部分&#xff0c;也面临着数字化转型的挑战和机遇。为了推进金属冶炼行…

线段树学习笔记 下

可持久化线段树 上面两篇是几年前写的&#xff0c;笔者今日才加以整理&#xff0c;如有错误请见谅。 线段树加上版本就是可持久化线段树。 Problem Intro 给定一个数组&#xff0c;只需要单点修改和单点查询&#xff0c;但要维护版本。 具体说&#xff0c;每一次操作可能从…

Python算法100例-2.3 求车速

完整源代码项目地址&#xff0c;关注博主私信源代码后可获取 1.问题描述2.问题分析3.算法设计4.确定程序框架5.完整的程序6.问题拓展 1&#xff0e;问题描述 一辆以固定速度行驶的汽车&#xff0c;司机在上午10点看到里程表上的读数是一个对称数&#xff08;即这个数从左向右…

解决vscode每次git pull/push都需要输入账号密码

git如何设置用户名 邮箱 密码 //设置用户 git config --global user.name "xxx"//设置邮箱 git config --global user.email "xxxxxx.com"//设置密码 git config --global user.password "xxxxx"解决每次git pull/push操作都需要输入密码 git …

【安卓基础3】Activity(一)

&#x1f3c6;作者简介&#xff1a;|康有为| &#xff0c;大四在读&#xff0c;目前在小米安卓实习&#xff0c;毕业入职 &#x1f3c6;本文收录于 安卓学习大全&#xff0c;欢迎关注 &#x1f3c6;安卓学习资料推荐&#xff1a; 视频&#xff1a;b站搜动脑学院 视频链接 &…

VMware虚拟机从一台电脑复制到另一台电脑

1 概述 在一台电脑上利用虚拟机安装了OS系统&#xff0c;特别是如果虚拟机中的系统进行了各种繁琐的配置&#xff0c;因为换电脑或者需要在其他电脑上配置&#xff0c;这个时候就可以将虚拟机中的系统复制拷贝一份到新电脑上&#xff0c;省时省力。 2 操作步骤 2.1 vmx文件 …

Mac OS 搭建C++开发环境【已解决】

Mac OS 搭建C开发环境 文章目录 Mac OS 搭建C开发环境一、安装命令行工具&#xff1a;二、安装vscode三、安装gcc3.1 安装Homebrew3.2 安装gcc3.3 修改配置 四、更改VSCode默认编译器五、安装gdb六、安装Cmake && git七、编译运行 本地环境&#xff1a; Mac OS Sonoma …

LabVIEW高效核磁测井仪器多线程优化

LabVIEW高效核磁测井仪器多线程优化 为提高核磁测井仪器的测试效率与性能&#xff0c;开发了基于LabVIEW的多线程优化模型。该研究针对传统的核磁测井仪器软件&#xff0c;在多任务调度测试和并行技术需求上存在的效率不高和资源利用率低的问题&#xff0c;提出了一个多线程优…

算法沉淀——穷举、暴搜、深搜、回溯、剪枝综合练习一(leetcode真题剖析)

算法沉淀——穷举、暴搜、深搜、回溯、剪枝综合练习一 01.全排列02.子集03.找出所有子集的异或总和再求和04.全排列 II05.电话号码的字母组合 01.全排列 题目链接&#xff1a;https://leetcode.cn/problems/permutations/ 给定一个不含重复数字的数组 nums &#xff0c;返回其…

二十六、直方图均衡化

项目功能实现&#xff1a;对灰度图片进行直方图均衡化操作 按照之前的博文结构来&#xff0c;这里就不在赘述了 一、头文件 histogram_equal.h #pragma once#include<opencv2/opencv.hpp>using namespace cv;class HISTOGRAM_EQUAL { public:void histogram_equal(Mat…