08-向量的范数_范数与正则项的关系

news2025/1/19 10:14:56

⛳向量的范数

范数的公式是向量每个分量 绝对值 P 次方 再用幂函数计算 P 分之一,这里 P 肯定是整数 1,2,3…到正无穷都是可以的 向量的范数就是把向量变成一个标量,范数的表示就是两个竖线来表示,然后右下角写上 P(范数的指数,用来表示不同的范数类型)范数是一个衡量向量大小的数学概念,它描述了向量中元素的大小和分布情况

符号和参数说明:

  • P(范数的指数,用来表示不同的范数类型)
  • ||x|| 表示向量 x 的范数(norm)
  • ||表示去绝对值
  • x表示向量
  • xi表示向量中的每个分量
    ![[Pasted image 20230724152145.png|100]]

设维度n=2
红色的线是L1范数的几何意义, 也称为曼哈顿距离
绿色的线是L2范数的几何意义, 也成欧几里得距离

1范数是每个分量的绝对值加和,1范数写成L1
在这里插入图片描述|100

2 范数是每个分量的平方加和开根号, 其实代表的是向量的长度,高中时候学的向量的模,2 范数写成L2
在这里插入图片描述

范数在后面是非常有用的,在后面讲正则项的时候会用到

L1范数和L2范数是向量范数的两种常见形式,它们在机器学习和优化问题中有着重要的应用。它们的几何意义可以通过向量在几何空间中的表示来理解。

  1. L1范数的几何意义:

L1范数,也称为曼哈顿范数,表示向量中各个元素绝对值之和。对于二维平面上的向量(x, y),其L1范数为:||(x, y)||1 = |x| + |y|。在三维空间中,向量(x, y, z)的L1范数为:||(x, y, z)||1 = |x| + |y| + |z|。

L1范数的几何意义是从原点出发,沿着坐标轴的正方向移动到向量的末端,所经过的路径是由水平和垂直线段构成的。因此,L1范数可以理解为从原点到向量末端的曼哈顿距离。

在机器学习中,L1范数常用于稀疏性的推导和特征选择,因为L1范数对于某些情况下能够使得向量中的某些元素变为0,从而实现特征的稀疏表示。

  1. L2范数的几何意义:

L2范数,也称为欧几里德范数,表示向量中各个元素的平方和的平方根。对于二维平面上的向量(x, y),其L2范数为:||(x, y)||2 = √(x^2 + y^2)。在三维空间中,向量(x, y, z)的L2范数为:||(x, y, z)||2 = √(x^2 + y^2 + z^2)。

L2范数的几何意义是从原点出发,沿着直线路径移动到向量的末端。因此,L2范数可以理解为从原点到向量末端的欧几里德距离。

在机器学习中,L2范数常用于正则化项的添加,例如在岭回归中使用L2范数作为正则项,有助于防止过拟合并提高模型的泛化能力。

⛳L1、L2正则项

L1和L2正则项是在机器学习和统计中用于正则化的两种常见方式。

  1. L1正则项(L1范数或Lasso正则化):
    L1正则项是指将模型中参数的绝对值加入到损失函数中,用于惩罚模型参数的绝对值大小。它的数学表达式为: λ ∑ i = 1 n ∣ θ i ∣ \lambda \sum_{i=1}^{n} |\theta_i| λi=1nθi,其中λ是一个超参数,θi是模型的参数。L1正则项有助于产生稀疏的模型,即使其中一些参数的值为0,因为L1正则项的存在可以将某些参数收缩为0。

  2. L2正则项(L2范数或岭回归):
    L2正则项是指将模型中参数的平方加入到损失函数中,用于惩罚模型参数的大小。它的数学表达式为: λ ∑ i = 1 n θ i 2 \lambda \sum_{i=1}^{n} \theta_i^2 λi=1nθi2,其中λ是一个超参数,θi是模型的参数。L2正则项有助于防止模型过拟合,并且不会使参数变为0,因此不会产生稀疏性。

在正则化中,损失函数通常由两部分组成:原始的目标函数(通常是最小化的损失函数)和正则项。目标是通过调整模型参数来平衡这两部分,以找到最佳的模型。

选择L1还是L2正则化取决于具体的问题和数据集。L1正则化通常用于特征选择和稀疏性处理,而L2正则化通常用于防止过拟合。有时也会同时使用L1和L2正则项,这被称为弹性网络正则化。

正则化和正则项是紧密相关的概念,它们通常用于控制机器学习模型的复杂度,并防止过拟合问题。

正则化是一种用于改善机器学习模型泛化能力的技术。在训练模型时,我们不仅希望模型能够很好地拟合训练数据,还希望它在未见过的数据上表现良好。过拟合是一种常见的问题,它指的是模型在训练数据上表现得很好,但在未知数据上表现较差的现象。

为了解决过拟合问题,引入了正则化的概念。正则化通过在模型的损失函数中添加一个正则项,惩罚模型的复杂度,从而限制模型的拟合能力。正则项通常是模型参数的范数(L1范数或L2范数),也可以是其他的复杂度度量。正则化的目的是在训练模型时平衡拟合训练数据和控制模型复杂度之间的关系,从而使模型具有更好的泛化能力。

在线性回归等模型中,正则化项可以写为:
正则项 = λ ⋅ ∣ ∣ θ ∣ ∣ p \text{正则项} = \lambda \cdot ||\theta||_p 正则项=λ∣∣θp
其中, ∣ ∣ θ ∣ ∣ p ||\theta||_p ∣∣θp表示模型参数 θ \theta θ的范数(可以是L1范数或L2范数), λ \lambda λ表示正则化参数,用于控制正则项的强度。

通过调整正则化参数 λ \lambda λ的值,可以控制正则化项的影响程度。当 λ \lambda λ较大时,正则化项的影响较强,模型的复杂度降低,有助于防止过拟合。当 λ \lambda λ较小时,正则化项的影响较弱,模型的复杂度增加,有助于更好地拟合训练数据。

总的来说,正则化通过引入正则项来约束模型,使其更加简单和泛化能力更强,从而提高机器学习模型的性能。

🎯实战–求L1和L2范数

In [1]: import numpy as np

In [2]: W = np.array([3, 5, 6, 7, 8])

In [3]: np.abs(W)
Out[3]: array([3, 5, 6, 7, 8])

In [5]: np.sum(np.abs(W))
Out[5]: 29

In [6]: L1 = np.sum(np.abs(W))

In [7]: L1
Out[7]: 29

In [8]: np.square(W)
Out[8]: array([ 9, 25, 36, 49, 64])

In [10]: L2 = np.sum(np.square(W))

In [11]: L2
Out[11]: 183

In [13]: L2 = np.sqrt(np.sum(np.square(W)))

In [14]: L2
Out[14]: 13.527749258468683

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/813733.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode36.Valid-Sudoku<有效的数独>

题目: 思路: 这题并不难,它类似于N皇后问题。在N皇后问题中,行,列,对角线,写对角线,都不能出现连续的皇后。 本题类似,不过他是行,列,还有一个B…

【数据结构篇C++实现】- 图

友情链接:C/C系列系统学习目录 文章目录 🚀一、图的基本概念和术语1、有向图和无向图3、基本图和多重图4、完全图5、子图6、连通、连通图和连通分量7、强连通图、强连通分量8、生成树、生成森林9、顶点的度、入度和出度10、边的权和网11、稠密图、稀疏图…

【点云处理教程】00计算机视觉的Open3D简介

一、说明 Open3D 是一个开源库,使开发人员能够处理 3D 数据。它提供了一组用于 3D 数据处理、可视化和机器学习任务的工具。该库支持各种数据格式,例如 .ply、.obj、.stl 和 .xyz,并允许用户创建自定义数据结构并在程序中访问它们。 Open3D 广…

介绍壹牛NFT数字艺术藏品数藏源码

这个版本新增了不少功能,也修复了一些地方。 1.平台新增用户找回密码功能 2.平台新增短信注册(实名制功能) 3.平台新增主图后台添加功能 4.平台修复相关问题,系统高效运行 5、H5端与APP端在新UI完美适配 6、加入宝盒功能&…

04-导数判断凹(concave)凸(convex)性_导数用于泰勒展开

导数与函数凹凸性的关系 函数的二阶导数是和函数的凹凸性是有关系的,凹凸性怎么定义的? 先来做简单的回顾,更多的会在最优化方法里面给大家讲,这里先记住凸函数是向下凸的, 反正就是凹的,是否是凸函数可以…

Linux——平台设备及其驱动

目录 前言 一、平台设备 二、平台驱动 三、平台驱动简单实例 四、 电源管理 五、udev 和驱动的自动加载 六、使用平台设备的LED 驱动 七、自动创建设备节点 前言 要满足 Linux 设备模型,就必须有总线、设备和驱动。但是有的设备并没有对应的物理总线&#x…

【双评价笔记】农业指向之水资源评价

农业指向水资源单项评价是基于区域内及邻近地区气象站点长时间序列降水观测资料,通过空间插值得到多年平均降水量分布图层,降水量按照200,400,800,1200这个间断点分为好(很湿润),较好(湿润),一般(半湿润),较差(半干旱),差(干旱)5 个等级。 本次实验过程采用的评价分…

谷粒商城第七天-商品服务之分类管理下的分类的拖拽功能的实现

目录 一、总述 1.1 前端思路 1.2 后端思路 二、前端实现 2.1 判断是否能进行拖拽 2.2 收集受影响的节点,提交给服务器 三、后端实现 四、总结 一、总述 这个拖拽功能对于这种树形的列表,整体的搬迁是很方便的。但是其实现却并不是那么的简单。 …

CMU15-213 课程笔记 01-课程概览

知识点 这门课的目的:深入理解当你执行代码时,计算机在做什么 LLDB:基于 LLVM 的命令行调试器,类似 GBD 内存引用 Bug typedef struct {int a[2];double d; } struct_t;double fun(int i) {volatile struct_t s;s.d 3.14;s.a…

Flowable-服务-邮件任务

目录 定义图形标记XML内容邮件服务器配置界面操作 定义 Flowable 支持通过自动的邮件服务任务(Email Task)增强业务流程,它可以向一个或多个收信人发送 邮件,支持 cc,bcc,HTML 内容等。 流程流转到邮件任务…

xshell连接liunx服务器身份验证不能选择password

ssh用户身份验证不能选择password 只能用public key的解决办法 问题现象 使用密码通过Workbench或SSH方式(例如PuTTY、Xshell、SecureCRT等)远程登录ECS实例时,遇到服务器禁用了密码登录方式错误. 可能原因 该问题是由于SSH服务对应配置文件/etc/ssh/sshd_config中…

【软件安装】MATLAB_R2021b for mac 安装

Mac matlab_r2021b 安装 下载链接:百度网盘 下载链接中所有文件备用。 我所使用的电脑配置: Macbook Pro M1 Pro 16512 系统 macOS 13.5 安装步骤 前置准备 无此选项者,自行百度 “mac 任何来源”。 1 下载好「MATLAB R2021b」安装文…

stm32 舵机 cubemx

文章目录 前言一、cubemx配置二、代码1.serve.c2.serve.h3.主函数 总结 前言 stm32对舵机进行控制,很简单直接一个pwm就可以实现 pwm的周期是50HZ占空比分别对应 一个0.5ms的高电平对应于0度 一个1.5ms的高电平对应于90度 一个2.5ms的高电平对应于180度 因此&#…

【C语言】扫雷(保姆级教程+内含源码)

C系列文章目录 前言 一,模块化编程 二,游戏思路与逻辑 三,实现游戏步骤/过程 1,菜单界面(menu) 2,实现多行多列扫雷 3, 实现多个雷 4,棋盘初始化 5,棋盘的打印 6,布置雷…

连接器信号完整性仿真教程 六

连接器信号完整性仿真教程五中,讲了波导端口中同轴波导端口及多Pin波导端口的设置。本将继续以实例演示的方式讲解波导端口中的微带(Microstrip Line)波导端口的设置及其在连接器信号完整性仿真中的应用。 一 微带线(Microstrip Line) 由介基材(Dielectric Substrate)及…

正则表达式速通

简介 正则表达式,我们可以看作通配符的增强版,可以帮我们匹配指定规则的字符串,在计算机中应用广泛,比如说爬虫、网站的登录表单等。 原视频:https://www.bilibili.com/video/BV1da4y1p7iZ 学习正则表达式的常用工具…

【LeetCode每日一题】——566.重塑矩阵

文章目录 一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【题目提示】七【解题思路】八【时间频度】九【代码实现】十【提交结果】 一【题目类别】 矩阵 二【题目难度】 简单 三【题目编号】 566.重塑矩阵 四【题目描述】 在 MATLAB 中&…

【C++ 程序设计】实战:C++ 实践练习题(1~10)

目录 01. 二维数组 02. 奇偶性 03. 指针与变量 04. 员工薪资 05. 整型值&#xff08;%4d 进行格式化&#xff09; 06. 求三个数中的最大值和最小值 07. 同一字母次数统计 08. 字符串回文判断 09. 闰年判断 10. 交换两个双精度数 01. 二维数组 #include <stdio.…

系统学习Linux-MySQL主从复制及读写分离(五)

部署MySQL主从异步复制 在MySQL Master上的配置NTP时间同步服务器 [rootlocalhost ~]# rpm -q ntpntp-4.2.6p5-28.el7.centos.x86_64[rootlocalhost ~]# vim /etc/ntp.conf #添加两行server 127.127.1.0fudge 127.127.1.0 stratum 8 启动NTP服务 [rootlocalhost ~]# system…

pytorch(续周报(1))

文章目录 2.1 张量2.1.1 简介2.1.2 创建tensor2.1.3 张量的操作2.1.4 广播机制 2.2 自动求导Autograd简介2.2.1 梯度 2.3 并行计算简介2.3.1 为什么要做并行计算2.3.2 为什么需要CUDA2.3.3 常见的并行的方法&#xff1a;网络结构分布到不同的设备中(Network partitioning)同一层…