也谈特征值和特征向量的几何意义

news2024/11/24 10:55:53

在当前的大数据分析时代,数据降维是一个重要的分析技术。而谈到数据降维,就离不开一门最为抽象难懂的数学学科分支——线性代数。有人可能会问:一堆向量和矩阵符号的线性代数到底有鸟用?简单地不科学地说,线性代数就是一门让m维世界和n维世界相互交互的科学。

古希腊著名的哲学家阿基米德曾经说:“给我一个支点,我能撬动地球。”

在元宇宙盛行的新时代,有这样一坨做保险数据分析的精算师说:“给我一个矩阵,我能把n维的元宇宙变为一条线.” ( “线”性代数高手中的网络用语: 看我来 “秒线” 一切?   :)

开个玩笑后,开始说正事。今天想聊的是数据降维或者说线性代数绕不开的两个名词——特征值和特征向量。看到CSDN里有很多解释特征值和特征向量的帖子,有些提到了他们的几何意义,但是看完之后,感觉大多数的帖子写的都太学术了,让新手看得云里雾里。所以,今天我也从一个保险精算师的角度,谈谈特征值和特征向量的几何解释,希望我的解释,能让更多的新人理解。

为了说明问题的实质,直接上一个简单的例子,数据也会设计的尽量简单。我会尽量避免教科书式的公式,为了不让新人看着那些公式越看越迷糊。

有这样一个矩阵:

\begin{pmatrix} 4 & 3\\ 2 & -1 \end{pmatrix}

这里先把它的特征值和特征向量给出来:它有两个特征值,一个是5,对应的一个特征向量是(3,1);另一个特征值是-2,对应的一个特征向量是(1,-2)。(PS:为了让这些数值都在10以内,用 python 试了一阵子,算是找到比较理想的这个例子)

下面,开始说重点的东西,也就是特征值和特征向量的几何意义。

我们将上面那个矩阵的2个列向量,(4,2)和(3,-1)作为A点和B点画在坐标系里。

然后,我们以特征值5对应的那个特征向量(3,1)作为C点,也画在坐标系里。(PS:这里仅以特征值5为例,来做解释。另一个特征值-2,如果有人想解释,可以自己试一试)

先画出上面的坐标图像,下面开始解释。

注意特征值5对应的那个特征向量(3,1),它的使用方法是,将坐标图中的向量OA变为3倍,也就是到达了点D。随后,在D点的基础上,再加上1倍的向量OB,也就是从D点到达了E点。

我们看看原点O、点C、点E有什么特性?看到了吧,3点共线。

而且不仅是3点共线,OE的长度是OC长度的5倍。这个5倍是什么东西?其实就是矩阵的特征值5.

看懂了这个例子以后,希望你再深刻体会一下下面这个比较抽象的自然段语言:

“ 在线性代数里,矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。”

在这段话里,有2个句号。第一句,提到了矩阵乘法就是从旋转和伸缩,我在此前的CSDN博客文章中已经说过这个道理。然后就是第二句话,就是今天谈的东西。

在我们的例子中,那个矩阵 [ [4,3], [2,-1] ]对特征向量OC,也就是从O点到C(3,1),只使向量发生了伸缩(具体是伸长了5倍,也就是特征值),而不对向量产生旋转的效果。You must see it.

不旋转,是很关键的一件事。从数据降维的角度讲,我们将本来是在2维的坐标系里又伸长/又旋转的一个复杂的工作,改变为在一个1维的坐标轴OC上把它直接伸长5倍就ok了。

明白了这个道理,我相信你就明白了特征值和特征向量的几何意义。其实,像主成分分析、因子分析这些主要的数据降维技术,都是采用了相同的思路,所以这些降维技术在疯狂使用特征值和特征向量这些东西。

实际上,在工作中,我能看到很多新人根据他们在学校所学,都能够完成相应的工作,学校教了他们 how to do,但是,能够 真正理解 why to do 的新人其实挺少的。希望此文能够让更多的新人,理解 how to do 背后的东西。

这就是一个 how to do 做的不如新人、但更理解 why to do 的做保险数据分析的精算师写的一篇面对新人的入门文章。未来的元宇宙,期待着你去“秒线” ! : )

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/89646.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【tiktok小店运营小知识】 tiktok小店也会被封吗?有哪些原因呢?

最近开tiktok小店的小伙伴越来越多,运营过程中也会碰到很多问题。有小伙伴问, tiktok小店也会被封吗?有哪些原因呢? tiktok小店也会被封吗?有哪些原因呢? 答案是肯定的。TikTok需要进一步规范店铺经营&…

SRM是什么意思?盘点4个顶级SRM系统

SRM是什么意思?SRM系统,一般指供应商关系管理系统。供应商管理系统是采购管理系统的一个重要模块,强调企业与供应商之间协作共赢。相信在市场动荡的今天,企业与供应商之间的强关联、共命运对于企业来说不失为稳固根基、扩张业务的…

JavaScript系列之ES6默认导出与默认导入

文章の目录一、默认导出二、默认导入三、按需导出四、按需导入五、直接导入并执行模块代码写在最后一、默认导出 语法: export default 默认导出的成员每个模块中,只允许使用唯一的一次 export default,否则会报错! 二、默认导入…

Generative Modeling by Estimating Gradients of the Data Distribution阅读笔记

目录概述传统score-based generative modeling介绍score matchingLangevin dynamics传统score-based generative modeling存在的问题流型假设上的问题低密度区域的问题Noise Conditional Score Network噪声条件分数网络(Noise Conditional Score Networks)annealed Langevin dy…

Kafka 架构、核心机制和场景解读

摘要 Kafka 是一款非常优秀的开源消息引擎,以消息吞吐量高、可动态扩容、可持久化存储、高可用的特性,以及完善的文档和社区支持成为目前最流行的消息队列中间件。 Kafka 的开发社区一直非常活跃,在消息引擎的领域取的不俗成绩之后&#xf…

组装式应用新基建——小程序容器技术

近年来,面对不断变化的业务环境和快速迭代的业务需求,“组装式应用”凭借其灵活性、复用性等优势,成为了重要战略技术趋势。 一直以来,传统应用程序开发面临着诸多挑战:一是没有足够的开发能力;二是选错技…

sql中的!=操作符的天坑(务必警觉)(=在处理null时也是同样有坑)

最近在测试数据,偶尔需要写sql进行数据比对,例如这样的语句: if( column_a ! column_b, 1, 0),万万没想到就是这样的sql语句差点要了我的命。 其实对一般的数据,这条校验语句是没有问题的,最后再筛选一下1的…

Stm32旧版库函数10——A4988 单个步进电机 16拍

#include "stm32f10x_lib.h" #include "motor.h" u8 Step; void GPIO_Key(void) { GPIO_InitTypeDef GPIO_InitStructure; GPIO_InitStructure.GPIO_Pin GPIO_Pin_0|GPIO_Pin_1; // 选中管脚9 GPIO_InitStructure.GPIO_Mode …

使用java实现 分布式任务调度平台XXL-JOB 部署及使用

XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用。 详细的特性和优点参考官网地址:https://www.xuxueli.com/xxl-job/ 一、任务调度 0.下载官方源…

为什么微服务一定要有网关呢

一、什么是服务网关 服务网关 路由转发 过滤器1、路由转发:接收一切外界请求,转发到后端的微服务上去; 2、过滤器:在服务网关中可以完成一系列的横切功能,例如权限校验、限流以及监控等,这些都可以通过…

Anaconda环境GDAL库基于whl文件的配置方法

本文介绍在Anaconda环境下,基于.whl文件安装Python中高级地理数据处理库GDAL的方法。 在文章Anaconda下Python中GDAL模块的下载与安装方法(https://blog.csdn.net/zhebushibiaoshifu/article/details/124307748)中,我们介绍了基于…

[附源码]计算机毕业设计的实验填报管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: Springboot mybatis MavenVue等等组成,B/S模式…

我是如何使用docker安装nginx并配置https服务的

文章目录前言一、前期准备1、备案好的域名2、安装nginx2.1 下载nginx的docker镜像2.2 新建用于映射的目录2.3 从容器中拷贝nginx配置2.4 启动 nginx二、配置步骤1、申请免费的证书2、下载证书3、把证书上传至服务器4、配置 .conf 文件4.1 后端接口服务 api.conf 配置4.2 前端项…

数据智仓功能介绍(四)

字段设置 使用场景介绍 字段设置,即在数据智仓中,对输入上一数据处理节点的字段进行显示和隐藏、排序、重命名等操作。 操作配置 对数据类型的转换,主要用户复杂数据的处理的情况下 ,例如某个字段是JSON ,那么通过数…

用 JS 解析 excel 文件需要分几步

八月长江万里晴,千帆一道带风轻。 大家好,我是嘿嘿,今天来聊一聊如何使用 JS 来解析 excel 文件,当然不是直接使用 exceljs、sheetjs 之类的库,那就没意思了,而是主要说一下 JS 解析 excel 表格是如何实现的…

STM32F4 IAP 跳转 APP问题

1. 概念 IAP 的作用,网上其他资料已经有很多介绍了,这里放一个链接,不进行深入的介绍。本文的关注重点是Bootloader在跳转APP程序中出现的问题。 IAP的实现原理讲解以及中断向量表的偏移 2. 程序 本人主要做应用层的开发,所有Boo…

深蓝学院-多传感器融合定位课程-第7章-基于滤波的融合方法I

专栏文章: 深蓝学院-多传感器融合定位课程-第1章-概述_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第2章-3D激光里程计I_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第3章-3D激光里程计II_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第…

自学100天,零基础转行软件测试,我要以更好的姿态奔赴下一场山海~

三年大专一场空 专业是电子商务,18年毕业,当时在报考时时觉得电子商务挺高大上的,觉得电商肯定会有前途,以后毕业肯定好找工作,跟大多数人一样,我开始幻想我以后毕业以后的纸醉金迷的生活,我以…

落地 DevOps,探索高效研发运营一体化解决方案

前言与概述 伴随着企业业务的快速发展,为了支撑业务发展,提高 IT 对业务的支撑能力建设。在研发工程协同方面,希望加强代码管理,实现持续构建、自动化测试、自动化部署、自动化运维,同时加强产品的安全和质量管理&…

华为路由器 静态路由

需求&#xff1a; 实现 PC1 与 PC2 互通 1、拓扑图 主机IP掩码网关PC1192.168.10.10255.255.255.0192.168.10.1PC2192.168.40.40255.255.255.0192.168.40.1PC3192.168.30.30255.255.255.0192.168.30.1 2、R1 路由器 <Huawei>undo ter mo Info: Current terminal monit…