09-向量的范数_范数与正则项的关系

news2025/1/12 19:09:08

⛳向量的范数

范数的公式是向量每个分量 绝对值 P 次方 再用幂函数计算 P 分之一,这里 P 肯定是整数 1,2,3…到正无穷都是可以的 向量的范数就是把向量变成一个标量,范数的表示就是两个竖线来表示,然后右下角写上 P(范数的指数,用来表示不同的范数类型)范数是一个衡量向量大小的数学概念,它描述了向量中元素的大小和分布情况

符号和参数说明:

  • P(范数的指数,用来表示不同的范数类型)
  • ||x|| 表示向量 x 的范数(norm)
  • ||表示去绝对值
  • x表示向量
  • xi表示向量中的每个分量
    ![[Pasted image 20230724152145.png|100]]

设维度n=2
红色的线是L1范数的几何意义, 也称为曼哈顿距离
绿色的线是L2范数的几何意义, 也成欧几里得距离

1范数是每个分量的绝对值加和,1范数写成L1
在这里插入图片描述|100

2 范数是每个分量的平方加和开根号, 其实代表的是向量的长度,高中时候学的向量的模,2 范数写成L2
在这里插入图片描述

范数在后面是非常有用的,在后面讲正则项的时候会用到

L1范数和L2范数是向量范数的两种常见形式,它们在机器学习和优化问题中有着重要的应用。它们的几何意义可以通过向量在几何空间中的表示来理解。

  1. L1范数的几何意义:

L1范数,也称为曼哈顿范数,表示向量中各个元素绝对值之和。对于二维平面上的向量(x, y),其L1范数为:||(x, y)||1 = |x| + |y|。在三维空间中,向量(x, y, z)的L1范数为:||(x, y, z)||1 = |x| + |y| + |z|。

L1范数的几何意义是从原点出发,沿着坐标轴的正方向移动到向量的末端,所经过的路径是由水平和垂直线段构成的。因此,L1范数可以理解为从原点到向量末端的曼哈顿距离。

在机器学习中,L1范数常用于稀疏性的推导和特征选择,因为L1范数对于某些情况下能够使得向量中的某些元素变为0,从而实现特征的稀疏表示。

  1. L2范数的几何意义:

L2范数,也称为欧几里德范数,表示向量中各个元素的平方和的平方根。对于二维平面上的向量(x, y),其L2范数为:||(x, y)||2 = √(x^2 + y^2)。在三维空间中,向量(x, y, z)的L2范数为:||(x, y, z)||2 = √(x^2 + y^2 + z^2)。

L2范数的几何意义是从原点出发,沿着直线路径移动到向量的末端。因此,L2范数可以理解为从原点到向量末端的欧几里德距离。

在机器学习中,L2范数常用于正则化项的添加,例如在岭回归中使用L2范数作为正则项,有助于防止过拟合并提高模型的泛化能力。

⛳L1、L2正则项

L1和L2正则项是在机器学习和统计中用于正则化的两种常见方式。

  1. L1正则项(L1范数或Lasso正则化):
    L1正则项是指将模型中参数的绝对值加入到损失函数中,用于惩罚模型参数的绝对值大小。它的数学表达式为: λ ∑ i = 1 n ∣ θ i ∣ \lambda \sum_{i=1}^{n} |\theta_i| λi=1nθi,其中λ是一个超参数,θi是模型的参数。L1正则项有助于产生稀疏的模型,即使其中一些参数的值为0,因为L1正则项的存在可以将某些参数收缩为0。

  2. L2正则项(L2范数或岭回归):
    L2正则项是指将模型中参数的平方加入到损失函数中,用于惩罚模型参数的大小。它的数学表达式为: λ ∑ i = 1 n θ i 2 \lambda \sum_{i=1}^{n} \theta_i^2 λi=1nθi2,其中λ是一个超参数,θi是模型的参数。L2正则项有助于防止模型过拟合,并且不会使参数变为0,因此不会产生稀疏性。

在正则化中,损失函数通常由两部分组成:原始的目标函数(通常是最小化的损失函数)和正则项。目标是通过调整模型参数来平衡这两部分,以找到最佳的模型。

选择L1还是L2正则化取决于具体的问题和数据集。L1正则化通常用于特征选择和稀疏性处理,而L2正则化通常用于防止过拟合。有时也会同时使用L1和L2正则项,这被称为弹性网络正则化。

正则化和正则项是紧密相关的概念,它们通常用于控制机器学习模型的复杂度,并防止过拟合问题。

正则化是一种用于改善机器学习模型泛化能力的技术。在训练模型时,我们不仅希望模型能够很好地拟合训练数据,还希望它在未见过的数据上表现良好。过拟合是一种常见的问题,它指的是模型在训练数据上表现得很好,但在未知数据上表现较差的现象。

为了解决过拟合问题,引入了正则化的概念。正则化通过在模型的损失函数中添加一个正则项,惩罚模型的复杂度,从而限制模型的拟合能力。正则项通常是模型参数的范数(L1范数或L2范数),也可以是其他的复杂度度量。正则化的目的是在训练模型时平衡拟合训练数据和控制模型复杂度之间的关系,从而使模型具有更好的泛化能力。

在线性回归等模型中,正则化项可以写为:
正则项 = λ ⋅ ∣ ∣ θ ∣ ∣ p \text{正则项} = \lambda \cdot ||\theta||_p 正则项=λ∣∣θp
其中, ∣ ∣ θ ∣ ∣ p ||\theta||_p ∣∣θp表示模型参数 θ \theta θ的范数(可以是L1范数或L2范数), λ \lambda λ表示正则化参数,用于控制正则项的强度。

通过调整正则化参数 λ \lambda λ的值,可以控制正则化项的影响程度。当 λ \lambda λ较大时,正则化项的影响较强,模型的复杂度降低,有助于防止过拟合。当 λ \lambda λ较小时,正则化项的影响较弱,模型的复杂度增加,有助于更好地拟合训练数据。

总的来说,正则化通过引入正则项来约束模型,使其更加简单和泛化能力更强,从而提高机器学习模型的性能。

🎯实战–求L1和L2范数

In [1]: import numpy as np

In [2]: W = np.array([3, 5, 6, 7, 8])

In [3]: np.abs(W)
Out[3]: array([3, 5, 6, 7, 8])

In [5]: np.sum(np.abs(W))
Out[5]: 29

In [6]: L1 = np.sum(np.abs(W))

In [7]: L1
Out[7]: 29

In [8]: np.square(W)
Out[8]: array([ 9, 25, 36, 49, 64])

In [10]: L2 = np.sum(np.square(W))

In [11]: L2
Out[11]: 183

In [13]: L2 = np.sqrt(np.sum(np.square(W)))

In [14]: L2
Out[14]: 13.527749258468683

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/834041.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023 电赛 E 题 激光笔识别有误--使用K210/Openmv/树莓派/Jetson nano实现激光笔在黑色区域的目标检测

1. 引言 1.1 激光笔在黑色区域目标检测的背景介绍 在许多应用领域,如机器人导航、智能家居和自动驾驶等,目标检测技术的需求日益增加。本博客将聚焦于使用K210芯片实现激光笔在黑色区域的目标检测。 激光笔在黑色区域目标检测是一个有趣且具有挑战性的…

redis发布订阅模型

文章目录 发布与订阅1.频道订阅和退订1.1订阅频道subscribe**伪代码** 1.2 退订频道伪代码 2.模式订阅和退订2.1订阅模式psubscribe2.2 退订模式 3.发送消息3.1 消息发送频道订阅者伪代码 3.2消息发送模式订阅者伪代码 总结的Publish4.查看订阅消息4.1 pubsub channels4.2 pubs…

从前序与中序遍历序列构造二叉树,从中序与后序遍历序列构造二叉树

目录 从前序与中序遍历序列构造二叉树从中序与后序遍历序列构造二叉树 从前序与中序遍历序列构造二叉树 题目链接 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返…

深度学习Redis(2):持久化

前言 在上一篇文章中,介绍Redis的内存模型,从这篇文章开始,将依次介绍Redis高可用相关的知识——持久化、复制(及读写分离)、哨兵、以及集群。 本文将先说明上述几种技术分别解决了Redis高可用的什么问题;然后详细介绍Redis的持…

8.3 作业 c高级

1.递归实现&#xff0c;输入一个数&#xff0c;输出这个数的每一位&#xff1a; #include<myhead.h>void print_digit(int num) {if(num<10){printf("%d",num);puts("");}else{print_digit(num/10); //递归打印除最后一位外的数printf("%…

10.物联网操作系统之低功耗管理

一。低功耗管理概念及其应用 1.STM32低功耗设计详解 STM32的电源管理系统主要分为&#xff1a; 备份域 调压器供电电路 ADC电源电路 2.低功耗模式 1.运行模式 2.睡眠模式 3.停机模式 4.待机模式 &#xff08;1&#xff09;睡眠模式 在睡眠模式中&#xff0c;仅关闭了内核时钟&…

【计算机网络】网络层协议 -- ICMP协议

文章目录 1. ICMP协议简介2. ICMP协议格式3. ping命令4. ping命令与端口号没有关系&#xff01;&#xff01;&#xff01;5. traceroute命令 1. ICMP协议简介 ICMP&#xff08;Internet Control Message Protocol&#xff0c;控制报文协议&#xff09;&#xff0c;用于在IP主机…

22.Netty源码之解码器

highlight: arduino-light 抽象解码类 https://mp.weixin.qq.com/s/526p5f9fgtZu7yYq5j7LiQ 解码器 Netty 常用解码器类型&#xff1a; ByteToMessageDecoder/ReplayingDecoder 将字节流解码为消息对象&#xff1b;MessageToMessageDecoder 将一种消息类型解码为另外一种消息类…

关于时间的基本概念

年的标准——纪元 Era Epoch 在中国古代&#xff0c; 皇帝会订立年号来纪年&#xff0c; 比如贞观就是唐太宗订立的年号&#xff0c; 于是天下使用贞观元年&#xff0c;贞观二年的方式来纪年。皇帝可以因为各种原因更换年号&#xff0c;比如武则天在位21年&#xff0c; 使用了…

【vue】 el-table解决分页不能筛选全部数据的问题

前言 最近开发前端项目表格的时候&#xff0c;使用的是el-table&#xff0c;用到了对应的筛选功能&#xff0c;如下图所示 但发现实际只能筛选当前页&#xff0c;通过百度查找相关文章&#xff0c;发现原因是把筛选条件定义在列上&#xff0c;解决方法&#xff1a;所以我们把f…

HadoopWEB页面上传文件报错Couldn‘t upload the file course_info.txt

HadoopWEB页面上传文件报错Couldn’t upload the file course_info.txt 右键F2检查发现&#xff1a;文件上传PUT操作的IP地址是节点IP别名识别不到导致 解决方法&#xff1a;在WEB页面访问浏览器所在机器上面配置hosts映射地址(注意:配置的是浏览器访问的地址不是hadoop节点所在…

【项目 进程12】2.25 sigprocmask函数使用 2.26sigaction信号捕捉函数 2.27SIGCHILD信号

文章目录 2.25 sigprocmask函数使用2.26 sigaction信号捕捉函数内核实现信号捕捉的过程信号捕捉特性 2.27SIGCHILD信号 2.25 sigprocmask函数使用 阻塞信号集有时称作信号掩码。 联想&#xff1a;fcntl函数可以修改fd属性。 ./sigprocmask & //将程序设置为后台运行&…

JWT应用功能

JWT 一、 JWT 实现无状态 Web 服务 1、什么是有状态 有状态服务&#xff0c;即服务端需要记录每次会话的客户端信息&#xff0c;从而识别客户端身份&#xff0c;根据用户身份进行请求的处理&#xff0c;典型的设计如tomcat中的session。 例如登录&#xff1a;用户登录后&am…

SpringCloud《Eureka、Ribbon、Feign、Hystrix、Zuul》作用简单介绍

概述 SpringCloud是一个全家桶&#xff0c;包含多个组件。 本文主要介绍几个重要组件&#xff0c;也就是Eureka、Ribbon、Feign、Hystrix、Zuul这几个组件。 一、业务场景介绍 业务流程&#xff0c;支付订单功能 订单服务改变为已支付订单服务调用库存服务&#xff0c;扣减…

Webpack开启本地服务器;HMR热模块替换;devServer配置;开发与生成环境的区分与配置

目录 1_开启本地服务器1.1_开启本地服务器原因1.2_webpack-dev-server 2_HMR热模块替换2.1_认识2.2_开启HMR2.3_框架的HMR 3_devServer配置3.1_host配置3.2_port、open、compress 4_开发与生成环境4.1_如何区分开发环境4.2_入口文件解析4.3_区分开发和生成环境配置 1_开启本地服…

743. 网络延迟时间

有 n 个网络节点&#xff0c;标记为 1 到 n。 给你一个列表 times&#xff0c;表示信号经过 有向 边的传递时间。 times[i] (ui, vi, wi)&#xff0c;其中 ui 是源节点&#xff0c;vi 是目标节点&#xff0c; wi 是一个信号从源节点传递到目标节点的时间。 现在&#xff0c;…

iMX6ULL驱动开发 | OLED显示屏SPI驱动实现(SH1106,ssd1306)

周日业余时间太无聊&#xff0c;又不喜欢玩游戏&#xff0c;大家的兴趣爱好都是啥&#xff1f;我觉得敲代码也是一种兴趣爱好。正巧手边有一块儿0.96寸的OLED显示屏&#xff0c;一直在吃灰&#xff0c;何不把玩一把&#xff1f;于是说干就干&#xff0c;最后在我的imax6ul的lin…

泛微最近的漏洞利用工具

WeaverExploit_All 0x01 介绍 泛微最近的漏洞利用工具&#xff08;PS&#xff1a;2023&#xff09; 集成了QVD-2023-5012、CVE-2023-2523、CVE-2023-2648、getloginid_ofsLogin 漏洞利用 新增&#xff1a;WorkflowServiceXml 内存马注入、uploaderOperate文件上传漏洞、Del…

go-zero超强工具goctl的常用命令api,rpc,model及其构建的服务解析

goctl api 详情移步&#xff1a; go-zero的路由机制解析 基于go-zero的api服务刨析并对比与gin的区别 goctl rpc goctl支持多种rpc&#xff0c;较为流行的是google开源的grpc&#xff0c;这里主要介绍goctl rpc protoc的代码生成与使用。 protoc是grpc的命令&#xff0c;作用…

SpringBoot的pom文件、容器、组件

一、pom文件 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4…