也谈特征值和特征向量的几何意义

news2026/2/9 2:03:17

在当前的大数据分析时代，数据降维是一个重要的分析技术。而谈到数据降维，就离不开一门最为抽象难懂的数学学科分支——线性代数。有人可能会问：一堆向量和矩阵符号的线性代数到底有鸟用？简单地不科学地说，线性代数就是一门让m维世界和n维世界相互交互的科学。

古希腊著名的哲学家阿基米德曾经说：“给我一个支点，我能撬动地球。”

在元宇宙盛行的新时代，有这样一坨做保险数据分析的精算师说：“给我一个矩阵，我能把n维的元宇宙变为一条线.” （ “线”性代数高手中的网络用语：看我来 “秒线” 一切？：）

开个玩笑后，开始说正事。今天想聊的是数据降维或者说线性代数绕不开的两个名词——特征值和特征向量。看到CSDN里有很多解释特征值和特征向量的帖子，有些提到了他们的几何意义，但是看完之后，感觉大多数的帖子写的都太学术了，让新手看得云里雾里。所以，今天我也从一个保险精算师的角度，谈谈特征值和特征向量的几何解释，希望我的解释，能让更多的新人理解。

为了说明问题的实质，直接上一个简单的例子，数据也会设计的尽量简单。我会尽量避免教科书式的公式，为了不让新人看着那些公式越看越迷糊。

有这样一个矩阵：

$\begin{pmatrix} 4 & 3\\ 2 & -1 \end{pmatrix}$

这里先把它的特征值和特征向量给出来：它有两个特征值，一个是5，对应的一个特征向量是（3，1）；另一个特征值是-2，对应的一个特征向量是（1，-2）。（PS：为了让这些数值都在10以内，用 python 试了一阵子，算是找到比较理想的这个例子）

下面，开始说重点的东西，也就是特征值和特征向量的几何意义。

我们将上面那个矩阵的2个列向量，（4，2）和（3，-1）作为A点和B点画在坐标系里。

然后，我们以特征值5对应的那个特征向量（3，1）作为C点，也画在坐标系里。（PS：这里仅以特征值5为例，来做解释。另一个特征值-2，如果有人想解释，可以自己试一试）

先画出上面的坐标图像，下面开始解释。

注意特征值5对应的那个特征向量（3，1），它的使用方法是，将坐标图中的向量OA变为3倍，也就是到达了点D。随后，在D点的基础上，再加上1倍的向量OB，也就是从D点到达了E点。

我们看看原点O、点C、点E有什么特性？看到了吧，3点共线。

而且不仅是3点共线，OE的长度是OC长度的5倍。这个5倍是什么东西？其实就是矩阵的特征值5.

看懂了这个例子以后，希望你再深刻体会一下下面这个比较抽象的自然段语言：

“ 在线性代数里，矩阵乘法对应了一个变换，是把任意一个向量变成另一个方向或长度不同的新向量。在这个变换的过程中，原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换，不对这些向量产生旋转的效果，那么这些向量就称为这个矩阵的特征向量，伸缩的比例就是特征值。”

在这段话里，有2个句号。第一句，提到了矩阵乘法就是从旋转和伸缩，我在此前的CSDN博客文章中已经说过这个道理。然后就是第二句话，就是今天谈的东西。

在我们的例子中，那个矩阵 [ [4,3], [2,-1] ]对特征向量OC，也就是从O点到C(3，1)，只使向量发生了伸缩（具体是伸长了5倍，也就是特征值），而不对向量产生旋转的效果。You must see it.

不旋转，是很关键的一件事。从数据降维的角度讲，我们将本来是在2维的坐标系里又伸长/又旋转的一个复杂的工作，改变为在一个1维的坐标轴OC上把它直接伸长5倍就ok了。

明白了这个道理，我相信你就明白了特征值和特征向量的几何意义。其实，像主成分分析、因子分析这些主要的数据降维技术，都是采用了相同的思路，所以这些降维技术在疯狂使用特征值和特征向量这些东西。

实际上，在工作中，我能看到很多新人根据他们在学校所学，都能够完成相应的工作，学校教了他们 how to do，但是，能够真正理解 why to do 的新人其实挺少的。希望此文能够让更多的新人，理解 how to do 背后的东西。

这就是一个 how to do 做的不如新人、但更理解 why to do 的做保险数据分析的精算师写的一篇面对新人的入门文章。未来的元宇宙，期待着你去“秒线” ! : )

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/89646.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

也谈特征值和特征向量的几何意义

相关文章

【tiktok小店运营小知识】 tiktok小店也会被封吗？有哪些原因呢？

SRM是什么意思？盘点4个顶级SRM系统

JavaScript系列之ES6默认导出与默认导入

Generative Modeling by Estimating Gradients of the Data Distribution阅读笔记

Kafka 架构、核心机制和场景解读

组装式应用新基建——小程序容器技术

sql中的!=操作符的天坑(务必警觉)(=在处理null时也是同样有坑)

Stm32旧版库函数10——A4988 单个步进电机 16拍

使用java实现分布式任务调度平台XXL-JOB 部署及使用

为什么微服务一定要有网关呢

Anaconda环境GDAL库基于whl文件的配置方法

[附源码]计算机毕业设计的实验填报管理系统Springboot程序

我是如何使用docker安装nginx并配置https服务的

数据智仓功能介绍（四）

用 JS 解析 excel 文件需要分几步

STM32F4 IAP 跳转 APP问题

深蓝学院-多传感器融合定位课程-第7章-基于滤波的融合方法I

自学100天，零基础转行软件测试，我要以更好的姿态奔赴下一场山海~

落地 DevOps，探索高效研发运营一体化解决方案

华为路由器静态路由