一起对话式学习-机器学习02——机器学习方法三要素

news2025/1/8 2:11:26

【一】核方法

        首先补充一下核方法,这应是机器学习分类中的内容。

        什么是核方法呢?听起来很高级,但理解很简单:

        官方定义:核方法是使用核函数表示和学习非线性模型的一种机器学习方法,可以用于监督学习和非监督学习。      

        理解:在分类问题中很多情况下并不能用线性(二维中是一条线,三维则是一个平面,当然还有更高维)去划分,而是非线性的。核方法则可以利用核函数将输入映射到一个特征空间中,使其映射后的样本点变得可分。

        如我们常见的几种模型:核函数支持向量机、核PCA、核K-means等。

【二】 机器学习方法三要素

机器学习方法=模型+策略+算法

可以理解为:机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。 

 1.模型 

        这里只介绍监督学习的两种:决策函数与条件概率分布,即非概率模型与概率模型。

        给出二者形式就明了了:

Y=f(X)

        这是一个决策函数,就是我们平时的一个x关于y的函数,给定x,如果已知全部参数,则模型确定输出y。当然,在模型中,这样的函数很可能不止一个,而是一个集合,自变量x可能也有很多,关系可能错综复杂。

P=P(Y|X) 

        这是一个条件概率分布,就是我们平时的概率密度函数,在已知X的情况下,确定Y的相应概率分布,只不过要注意,这个分布通常由参数\theta决定,具体可以参照01贝叶斯学习 。同样,在模型中,这样的函数很可能不止一个,而是一个集合。

2.策略

        所谓策略就是以什么准则进行学习以及选取最优模型。

        我们给出损失函数与风险函数:

有以下几种损失函数

(图片来自 此,侵删)

        就是在训练完后进行测试时,用来度量预测结果和真实值之间的差异。还有其他更复杂的损失函数,具体模型最优选取不同。

        接下是风险函数,很简单,就是损失函数的期望,模型平均意义下的损失。

R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )

        其中,模型关于训练集的平均损失称为经验风险或经验损失。根据大数定律,当数据集样本数量N趋于无穷,经验风险就是期望风险,所以我们可以用训练集下的经验风险来代替所有数据下的期望风险。

        为什么不能直接计算期望风险呢?因为你不可能知道每次实例X下的输出Y,不然什么都知道还预测什么?

        但是我们知道,用样本代替总体(大数定律) 的思想很好,但总归是有误差,所以仅仅依靠经验风险来评估是不科学的,为此,我们提出结构风险

R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )+\lambda J(f))       

        可以看到,其实就是将经验期望后加了一项,这项称之为正则化项或惩罚项,为的就是防止过拟合(由于模型捕捉了训练集上的过多细节导致的模型过于复杂化)。其中\lambda系数决定了惩罚力度。

        所以,我们最终要做的就是将经验风险最小化与结构风险最小化。

3.算法

        经过模型和策略的选定,实际上机器学习问题到这里就变成了最优化问题——求解经验风险最小化与结构风险最小化。

        这部分可以阅读最优化问题的相关书籍或观看视频深入了解。


 Over!!! 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140527.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

教你开发一套外卖霸王餐小程序系统

大家好,我是鲸天科技千千,大家都知道我是做小程序开发的,平时会给大家分享一些互联网相关的创业项目,感兴趣的可以跟我关注一下。 首先就是要搭建一个自己的霸王餐系统小程序,我们自己的工作就是把这个小程序推广宣传…

828华为云征文|华为云Flexus X实例Nginx性能加速评测及对比

目录 前言 一、Flexus云服务器X介绍 1.1 Flexus云服务器X实例简介 1.2 Flexus云服务器X实例特点 1.3 Flexus云服务器X实例使用场景 二、Flexus云服务器X购买 2.1 Flexus X实例购买 2.2 重置密码 2.3 登录服务器 2.4 启动Nginx 三、华为云Flexus X实例加速Nginx测评 3.1 安装测试…

书生大模型实战营学习[2]Python task

学习目标:Python学习 Python实现wordcount Vscode连接InternStudio debug笔记 学习内容: 任务1:请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出…

Linux-进程优先级

🌈个人主页:Yui_ 🌈Linux专栏:Linux 🌈C语言笔记专栏:C语言笔记 🌈数据结构专栏:数据结构 🌈C专栏:C 文章目录 1. 为什么要有优先级的概念2.进程优先级的基本…

进程间关系和守护进程

序言 当我们使用指令 ps 查看进程的相关信息时,在以前我们只是关注该进程的 PID(该进程的标识符) , PPID(其父进程的标识符) 以及 STAT(该进程的状态)。  那 PGID 和 SID 又是什么?有什么作用呢? 1. 进程组 1.1 什么是进程组&am…

最强神器Typora 2024(亲测有效)| Markdown 工具推荐

听俺讲一下 大家好,我是程序员-杨胡广,今天想给大家分享一个在编写文档时的神器——Typora。相信不少小伙伴都在寻找一款既简洁又强大的 Markdown 编辑工具,而 Typora 无疑是最值得推荐的选择。 当我在大学时偶然发现了它,直到今…

【Python 数据分析学习】Matplotlib 的基础和应用

题目 1 Matplotlib 主要特性2 Matplotlib 基础知识2.1 导入模块2.2 图形构成2.2.1 图形(Figure)2.2.2 轴 (Axes)2.2.3 轴线(axis) 2.5 中文设置2.5.1 借助rcParams修改字体实现设置2.5.2 增加一个fontprope…

计算机视觉 对比学习 串烧二

文章目录 文章列表三、CPC3.1 文章摘要3.2 实验结果3.3 文章图示图 1: 对比预测编码(CPC)的概览图 2: 语音(演讲)表示的t-SNE可视化图 3: 预测未来潜在表示的准确率图 4: 图像的对比预测编码(CPC)的可视化图…

【Qt】Qt C++ Widget中嵌入qml

1. 效果 2. 方法 使用QQuickWidget方式 QQuickWidget *view new QQuickWidget;view->setSource(QUrl::fromLocalFile("myqmlfile.qml"));view->show();除了QQuickWidget方式还可以使用QQuickView方式,请自行查阅资料 3. 代码 3.1 工程目录 3.2 …

初始爬虫7

针对数据提取的项目实战&#xff1a; 补充初始爬虫6的一个知识点&#xff1a; etree.tostring能够自动补全html缺失的标签&#xff0c;显示原始的HTML结构 # -*- coding: utf-8 -*- from lxml import etreetext <div> <ul> <li class"item-1">…

图论篇--代码随想录算法训练营第五十八天打卡|拓扑排序,dijkstra(朴素版),dijkstra(堆优化版)精讲

拓扑排序 题目链接&#xff1a;117. 软件构建 题目描述&#xff1a; 某个大型软件项目的构建系统拥有 N 个文件&#xff0c;文件编号从 0 到 N - 1&#xff0c;在这些文件中&#xff0c;某些文件依赖于其他文件的内容&#xff0c;这意味着如果文件 A 依赖于文件 B&#xff0…

软件设计之JavaWeb(4)

软件设计之JavaWeb(4) 此篇应在MySQL之后进行学习: 路线图推荐&#xff1a; 【Java学习路线-极速版】【Java架构师技术图谱】 尚硅谷全新JavaWeb教程&#xff0c;企业主流javaweb技术栈 资料可以去尚硅谷官网免费领取 此章节最好学完JDBC观看 学习内容&#xff1a; 会话管理…

CleanClip for Mac 剪切板 粘贴工具 历史记录 安装(保姆级教程,新手小白轻松上手)

CleanClip&#xff1a;革新macOS剪贴板管理体验 目录 功能概览 多格式历史记录保存智能搜索功能快速复制操作拖拽功能 安装指南 前期准备安装步骤 配置与使用 功能概览 多格式历史记录保存 CleanClip支持保存文本、图片、文件等多种格式的复制历史记录&#xff0c;为用户提…

vue 在线预览word和excel

yarn add vue-office/excel vue-office/docx <template><div><vue-office-docx:src"docx"style"height: 100%; margin: 0; padding: 0"rendered"rendered"/></div> </template><script> //引入VueOfficeDoc…

C:字符串函数(续)-学习笔记

穗 一些闲话&#xff1a; 最近玩了这款饿殍-明末千里行&#xff0c;不知大家是否有听过这款游戏&#xff0c;颇有感触&#xff01;&#xff01;&#xff01; 游戏中最让我难以忘怀的便是饿殍穗线的故事&#xff0c;生在如今时代的我之前无法理解杜甫在目睹人间悲剧时的心情&…

低级编程语言和高级编程语言

一.区分低级编程语言和高级编程语言的方法 1.低级编程语言 低级编程语言,并不是简单的编程语言,而是写起来很费事的编程语言,如所有编程语言的"祖宗":汇编语言,写起来极其麻烦,说不定一个 int a1; 它就得写好几行,甚至十几行 这样麻烦的编程语言为什么还没消失那,因…

蓝桥杯省赛真题——大臣的旅费

输入样例&#xff1a; 5 1 2 2 1 3 1 2 4 5 2 5 4 输出样例&#xff1a; 135分析&#xff1a; 本题实际上要求我们去求在图中最远两点之间的距离&#xff0c;也就是树的直径 我们先从某一个点出发&#xff0c;到达离其最远的点&#xff0c;然后再重复操作一次即可 #inclu…

1184. 公交站间的距离(24.9.16)

题目 环形公交路线上有n个站&#xff0c;按次序从 0 到n - 1进行编号。已知每一对相邻公交站之间的距离&#xff0c;distance[i]表示编号为i的车站和编号为(i 1) % n的车站之间的距离。环线上的公交车都可以按顺时针和逆时针的方向行驶。要求返回乘客从出发点start到目的地de…

C++11(3)

目录 可变参数模版 获取参数包值的方式 1.递归方式展开参数包 2.使用数组逗号表达式展开 emplace_back函数 lambda表达式 C98中的例子 lambda表达式 语法 lambda表达式和函数比较 包装器 function包装器 bind绑定器 可变参数模版 C11 的新特性可变参数模板能够让您…

Java--String类

前言&#xff1a; 在之前的学习中&#xff0c;学习了和了解了一些类的基本使用&#xff0c;例如object类等等&#xff0c;但是我们用String这个引用或者说这个类其实我们已经用了好久&#xff0c;只不过没有具体分析过&#xff01; 对于String类&#xff0c;它可以引用一个字符…