【机器学习---02】机器学习相关名词解释

news2024/11/24 19:45:01

文章目录

  • 1. 损失函数、期望风险、经验风险
  • 2. 经验风险最小化和结构风险最小化
    • 2.1 结构风险(正则化)
    • 2.2 两者的定义
  • 3. 训练误差 与 测试误差
  • 4. 过拟合 与 欠拟合
    • 4.1 过拟合及解决方法
    • 4.2 交叉验证
    • 4.3 欠拟合
  • 5. 泛化误差 与 泛化误差上界
    • 5.1 泛化误差
    • 5.2 泛化误差上界
  • 6. 生成模型 与 判别模型
  • 7. 最大似然估计
    • 7.1 极大似然估计
    • 7.2 最大似然估计 与 经验风险 关系

1. 损失函数、期望风险、经验风险

  1. 常见的损失函数:
    在这里插入图片描述

    注意:损失函数不一定是上面的4个,也可以自定义损失函数。比如:感知机的损失函数就是自定义:误分类点到超平面的距离。

  2. 期望风险
    在这里插入图片描述

  3. 经验风险
    在这里插入图片描述

2. 经验风险最小化和结构风险最小化

2.1 结构风险(正则化)

结构风险:指为经验风险加上正则项,用于对模型的参数个数(即模型复杂度)进行限制
在这里插入图片描述

2.2 两者的定义

用于表明什么是最优模型,即求最小化的目标函数是谁?

  1. 经验风险最小化:指经验风险最小的模型就是最优模型。
    在这里插入图片描述

  2. 结构风险最小化:为了防止过拟合而提出来的,指结构风险最小的模型就是最优模型。
    在这里插入图片描述

因此,在机器学习三要素中,第三步使用算法求解最优模型时,有两个角度。

3. 训练误差 与 测试误差

  1. 训练误差:模型在训练集上的经验风险
    在这里插入图片描述

  2. 测试误差:模型在测试集上的经验风险
    在这里插入图片描述

4. 过拟合 与 欠拟合

4.1 过拟合及解决方法

在这里插入图片描述

  1. 过拟合:求得的最优模型过于复杂导致预测效果不好。 比如上面的M = 4时求得的最优化模型,虽然训练误差为,但是训练误差缺很大。而评价一个模型的好坏是根据泛化能力(≈ 泛化误差上界 ≈ 测试误差) 来衡量的,训练误差越小越好。
  2. 解决方法:
    ① 增加样本量 【为什么增加样本量可以防止过拟合?具体见泛化误差上界这一节】
    ② 交叉验证:取参数复杂度的平均,故可以防止过拟合。
    ③ 使用结构风险最小化而不是经验风险最小化【为什么结构风险最小化可以防止过拟合?见“正则化”这一节】

4.2 交叉验证

在这里插入图片描述

4.3 欠拟合

5. 泛化误差 与 泛化误差上界

5.1 泛化误差

  1. 泛化误差:指模型在测试集上的期望风险
    在这里插入图片描述

    区分:测试误差是模型在测试集上的经验风险

  2. 作用:对于不同复杂度下得到的最优化模型,我们可以使用泛化误差来衡量模型的好坏。泛化误差越小,模型越好。

5.2 泛化误差上界

和期望风险与经验风险的一样,由于 P(x, y) 是不知道的,也求不出来,所以转而使用 泛化误差上界 来代替 泛化误差去评估模型的好坏。
在这里插入图片描述

  • 可以观察到 泛化误差上界 与 N成反比,所以样本容量越大,模型越好。这就解释了为什么增加样本容量可以防止过拟合。
  • 可以观察到 泛化误差上界 与 d成反比。参数越多,d越大,导致泛化误差上界越大,模型就越差。

注意:有时候近似的测试误差 来代替 泛化误差上界

6. 生成模型 与 判别模型

注意:生成模型 与 判别模型 都是监督学习中的概念。而监督模型中的模型模型有两类:概率模型P(y | x)决策模型 y = f(x)

  1. 定义:
    在这里插入图片描述

  2. 区别 / 特点:

    1. ① 生成模型关心的是输入x与输出y的关系。即关心训练数据本身的特性,而不关心各类的边界在哪;
      ② 判别模型关心的是输入x,该输出什么y,关心各类的边界在哪,而不关心训练数据本身的特性。
    2. 根据公式容易知道:由生成模型可以得到判别模型,但由判别模型得不到生成模型。
    3. 当存在隐变量(当我们找不到引起某一现象的原因的时候,我们就把这个在起作用但是无法确定的因素,叫“隐变量”) 时,仍可以利用生成方法学习,此时判别方法不能用。
    4. 生成模型收敛速度快
    5. 判别模型的准确率高
    6. 判别模型是直接求决策模型或概率模型,所以抽象程度更高,往往可以用来简化问题。
  3. 代表算法:
    在这里插入图片描述

  4. 例子1:
    在这里插入图片描述

  5. 例子2:
    在这里插入图片描述

7. 最大似然估计

7.1 极大似然估计

  1. 区分:概率 与 似然
    1. 概率 是已知模型和参数,去预测数据。
    2. 似然 是已知数据,推模型和参数。
  2. 概率函数与似然函数:对于P(x | θ) 函数,x表示某一个具体的数据;θ 表示模型的参数。
    1. 如果参数θ已知,样本x未知,是推数据,所以P(x | θ) 函数叫概率函数。
    2. 如果参数x已知,样本θ未知,是推参数,所以P(x | θ) 函数叫似然函数。

似然函数的自变量是θ,因变量是P(x | θ)。如果取θ = θ1,那么 P(x | θ1) 表示在 θ1 下,样本x出现的概率。

最大似然估计:指使似然函数最大。即 找到参数 θ 的一个估计值,使得当前样本x出现的可能性最大。

  • 最大似然估计有一个前提:所有的采样都是独立同分布的,因此可以进行如下恒等变形
    在这里插入图片描述
  • 例子:
    在这里插入图片描述

7.2 最大似然估计 与 经验风险 关系

当损失函数是对数损失函数时,经验风险最小化等价于极大似然估计。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/99407.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Filter Listener Ajax学习笔记

1 Filter Filter用于请求的过滤,如请求时,做登录的全局性校验 1.1 示例 在创建Filter前,可以通过启动Tomcat访问index.jsp http://localhost:8080/Mvc-Demo/index.jsp添加Filter后,重新启动Tomcat,并再次访问index…

8、java常见名词总结

一、JMM 1.1、JMM简介 JMM 是Java内存模型( Java Memory Model),简称JMM。它本身只是一个抽象的概念,并不真实存在,它描述的是一种规则或规范,是和多线程相关的一组规范。通过这组规范,定义了…

babel-plugin-transform-remove-console 项目打包去除console

安装babel-plugin-transform-remove-console 项目打包去除console npm install babel-plugin-transform-remove-console --save-dev 在vue项目中babel.config.js中: module.exports {plugins: ["transform-remove-console",], }; 如果只想在生产环境…

Java+SSM影院订票系统|电影院购票系统(含源码+论文+答辩PPT等)

项目功能简介: 该项目采用的技术实现如下 后台框架:Spring、SpringMVC、MyBatis UI界面:BootStrap、jQuery 、JSP 数据库:MySQL 系统分为前台订票和后台管理: 1.前台订票 用户注册、用户登录、查看电影列表、分类查看 电影搜索、查…

C语言基础篇 —— 5.0 详解C语言变量的四大属性

文章目录概述C语言变量四大属性存储类概念解析Linux 内存映像并解析作用域概念解析局部变量的代码块作用域函数名和全局变量的文件作用域同名变量的掩蔽规则生命周期概念解析栈变量的生命周期堆变量的生命周期数据段、bss段变量的生命周期代码段、只读段的生命周期链接属性概念…

Linux——虚拟机安装Linux系统

实验1-2 虚拟机安装Linux系统 VMware 9.0 虚拟机Linux镜像ISO文件相关工具可以在这里边找到 http://pan.baidu.com/s/1ntA18FJ 或者请自行下载使用 创建新的虚拟机,如下图: 下一步:选择安装配置类型为“典型”如下图: 下一步&…

k8s之Ingress

Ingress和Ingress控制器介绍 Ingress官方文档:https://kubernetes.io/zh-cn/docs/concepts/services-networking/ingress/ Ingress控制器官方文档:https://kubernetes.io/zh-cn/docs/concepts/services-networking/ingress-controllers/ 在k8s中将一个…

Multipartfile判断文件类型的简单处理办法。

通过浏览器上传的文件在后台需要验证文件类型。如果单纯匹配后缀名的方式是有风险的,容易被换了后缀的病毒文件给破坏掉。 比如: 如果我上传已修改的文件。(把xlsx改成了jpg) 这样,无法识别出来真实的内容。 所以为了…

java基础巩固-宇宙第一AiYWM:为了维持生计,架构知识+分布式微服务+高并发高可用高性能知识序幕就此拉开(六:Hystrix之熔断、降级、限流)~整起

Hystrix 中文文档:https://www.apiref.com/spring-cloud-zh/dalston/#_circuit_breaker_hystrix_clients服务雪崩:服务 A 调用了服务 B,服务 B 再调用了服务 C,但是因为某些原因,服务 C 顶不住了,这个时候大…

Strimzi Kafka Bridge(桥接)实战之三:自制sdk(golang版本)

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览 本文是《Strimzi Kafka Bridge(桥接)实战》的第三篇,前文咱们掌握了Strimzi Kafka Bridge的基本功能:基于http提供各种kafk…

特海国际通过港交所上市聆讯:翻台率下滑明显,张勇夫妇为实控人

撰稿|汤汤 来源|贝多财经 近日,海底捞(HK:06862)海外业务分拆公司特海国际控股有限公司(下称“特海国际”)通过港交所上市聆讯。据贝多财经了解,特海国际将以介绍形式于港交所主板上市。所谓介绍形式&…

数据挖掘Java——Apriori算法的实现

一、Apriori算法的前置知识 Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和向下封闭检测两个阶段来挖掘频繁项集。 关联规则挖掘是数据挖掘中最活跃的研究方法之一,最初的动机是针对购物篮分析问题提出的,其目…

[附源码]Node.js计算机毕业设计工会会员管理系统Express

项目运行 环境配置: Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术: Express框架 Node.js Vue 等等组成,B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境:最好是Nodejs最新版,我…

【Linux学习】多线程

目录前言一、初识线程1. 线程的概念2. 线程的优缺点3. 线程异常4. 线程的用途二、Linux中的线程和进程1. 进程和线程的区别2. 进程中的线程共享三、Linux线程控制1. POSIX线程库2. 创建线程3. 线程终止4. 线程等待5. 线程分离四、Linux线程互斥1. 线程互斥的概念2. 互斥量mutex…

蓝桥杯基础算法(一)—— 快速排序

文章目录1. 基本思想2. 图解过程3. 代码模板4. 例题讲解🍑 快速排序🍑 第 k 个数1. 基本思想 快速排序是 Hoare 于 1962年 提出的一种二叉树结构的交换排序方法。 其基本思想为: (1)确定分界点:在数组中…

从零开始的MySQL(1)

目录1.MySQL的安装2.MySQL的基本操作2.1 展示数据库2.2 创建数据库2.3 选中数据库2.4 删除数据库2.5 常用数据类型2.5.1 整形2.5.2 浮点数2.6 创建表2.7 查看表2.7 查看表结构2.8 删除表3.数据库增删改查3.1 单行插入3.2 多行插入3.3 插入日期3.4 select查询3.4.1 select3.4.2 …

Jprofiler监控服务器的cpu

现象&#xff1a;压测过程中&#xff0c;发现应用服务器的cpu使用率比较高>80%&#xff0c;我们就可以判断服务器的cpu使用率太高了。 一般cpu太高有两种情况&#xff0c; 1.接口的性能非常好&#xff0c;比如响应时间<10ms&#xff0c;tps很高&#xff0c;此时的cpu使用…

CSDN官方插件猿如意可以用ChatGPT啦!

什么是 ChatGPT Chat GPT 是一种由 AI 技术驱动的自然语言处理工具&#xff0c;可让您与聊天机器人进行类似人类的对话等它是基于OpenAI的GPT-3架构进行构建的&#xff0c;并经过训练&#xff0c;以便能够回答人类的问题并进行自然对话ChatGPT可以回答关于各种话题的问题&#…

基于SSM广州旅游攻略网站的设计与实现

开发工具(eclipse/idea/vscode等)&#xff1a; 数据库(sqlite/mysql/sqlserver等)&#xff1a; 功能模块(请用文字描述&#xff0c;至少200字)&#xff1a;

【Unity】摄像机跟随鼠标移动以物体为中心旋转 物体根据视线方向移动

描述 实现摄像机根据鼠标移动跟随物体旋转&#xff0c;以摄像机前物体为中心&#xff0c;摄像机围绕物体旋转&#xff0c;并使摄像机时刻指向物体 实现效果 Unity 组件设置 Camera 组件设置 Body 组件设置 实现代码 CameraRotateMove.cs 摄像机跟随和旋转 using System.Co…