这么理解矩阵乘法，让你吊打面试官

这么理解矩阵乘法，让你吊打面试官

news2026/3/23 23:03:46

大家好啊，我是董董灿。

很多与深度学习算法相关的面试，面试官可能都会问一个问题，那就是你是如何理解矩阵乘算法的。

更有甚者，会让你当场手写矩阵乘算法，然后问细节，问如何优化，面试现场，残忍至极。

那矩阵乘法的本质到底是什么呢？为什么在神经网络中，甚至如今的大模型中，有那么多矩阵乘法出现呢？

1、矩阵乘法的本质

我查了很多资料，得出一个结论：矩阵乘法的本质，是资源的整合和再创。

举个例子。

你是一个鸡尾酒调酒师，家里储存了很多鸡尾酒的原料，有金酒、利口酒、柠檬汁和可乐等等。

今天家里来了 3 位客人，他们分别喜欢喝“自由古巴”、“长岛冰茶”以及“龙舌兰日出”这 3 款鸡尾酒，并向你下了单。

希望你给他们调配出来各自喜欢的鸡尾酒。

巧的是，这 3 款鸡尾酒的原料都是金酒、利口酒、柠檬汁和可乐。

你作为一个调酒师，分分钟就把客人的爱好的鸡尾酒给调出来了。

怎么做的呢？你知道配方：

自由古巴: 20%金酒 + 45% 利口酒 + 10%柠檬汁 + 25%可乐
长岛冰茶: 60%金酒+ 30%利口酒 + 5% 柠檬汁 + 5% 可乐
龙舌兰日出：30%金酒 + 10%利口酒 + 30%柠檬汁 + 30%可乐

你在调配鸡尾酒的过程中，是按照这个配方来调配的。

这里的原料，比如利口酒和可乐，就是输入资源，配比(比如可乐的 25% )就是赋予该资源的权重。

将相同的原料按照不同的配比混合起来，就得到了不同口味的鸡尾酒。

这种做法，可以抽象一下，写成一个公式：

自由古巴 = 0.2 x 金酒 + 0.45 x 利口酒 + 0.1 x 柠檬汁 + 0.25 x 可乐
长岛冰茶 = 0.6 x 金酒 + 0.3 x 利口酒 + 0.05 x 柠檬汁 + 0.05 x 可乐
龙舌兰日出 = 0.3 x 金酒 + 0.1 x 利口酒 + 0.3 x 柠檬汁 + 0.3 x 可乐

我们知道矩阵乘法的规则是，左矩阵的第一行乘以右矩阵的第一列，得到第一个值，第一行乘以第二列得到第二个值，...，以此类推

上面这种连乘的操作，就可以用矩阵乘法来表示。

左矩阵是一行四列，代表原料。

右矩阵是四行三列，每一列代表对应原料的配比。

按照矩阵乘法的规则，他们的结果应该是一个一行三列的矩阵，分别代表调配出来的三种鸡尾酒。

看到这是不是有点熟悉了。

矩阵乘法，通过相乘累加的操作，实际上是对资源（鸡尾酒的原料）的整合和再创（创造出了新的口味，如自由古巴）。

2、深度学习中的矩阵乘法

回到深度学习算法中，矩阵乘法的右矩阵通常是权值矩阵，是作为模型的参数被训练出来的。

一个模型，在对多种数据集训练之后，模型就学习到了一个权值矩阵，实际上一个模型中会学到很多个权值矩阵，这里用一个举例子说明。

这个权值矩阵可以很好的匹配多种输入数据，并对输入数据进行整合和再创。

卷积和全连接算法，或多或少都是一种矩阵乘法，将其转换为矩阵乘法之后，那么和权值矩阵对应的另一个矩阵，就是输入数据。

假设输入的数据是一张图片，那么图片中一个通道维度代表图片的一个特征，通过矩阵乘法对通道进行乘累加操作，便可以实现特征之间的整合和再创。

也就是所谓的特征融合，跟调酒是不是很像？

更显而易见的例子体现在全连接层上，全连接层通过矩阵乘法的运算，把所有的特征全部进行了融合，最终可能就会得到某一个类别。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1151114.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

用大白话聊聊SpringBoot的自动配置原理（面试题详解）

用大白话聊聊SpringBoot的自动配置原理（面试题详解）

首先，SpringBoot的自动配置不等于自动装配！ 自动配置是Auto-Configuration，针对的是SpringBoot中的配置类， 而自动装配是Autowire，针对的是Spring中的依赖注入。进入主题： 自动配置简单来说就是自动去把…

阅读更多...

告诉你一个真实的短视频自媒体收入

告诉你一个真实的短视频自媒体收入

我是卢松松，点点上面的头像，欢迎关注我哦！ 10个月前我分享了《这一年半我在短视频的收入》都是真实的，最近我看到有人在分享卢松松做短视频的收入，玩视频又被赋予了很多内容，我这说明下也是一些小感悟分享…

阅读更多...

故障诊断模型 | Maltab实现CNN卷积神经网络故障诊断

故障诊断模型 | Maltab实现CNN卷积神经网络故障诊断

文章目录效果一览文章概述模型描述源码设计参考资料效果一览文章概述故障诊断模型 | Maltab实现CNN卷积神经网络故障诊断模型描述卷积神经网络（convolutional neural network）是具有局部连接、权重共享等特性的深层前馈神经网络，最早主要是用来处理图像信息。相比于全…

阅读更多...

电路的电线的拼接

电路的电线的拼接

不积跬步无以至千里，今天小编也是复习今天学习的内容，废话不多说，看博客吧！！！ 目录准备条件操作成品准备条件操作将定制的套管插入导线当中，24V或者0V是尖端的端子，后面根…

阅读更多...

【排序算法】归并排序详解！深入理解！思想+实现！

【排序算法】归并排序详解！深入理解！思想+实现！

🎥 屿小夏 ： 个人主页 🔥个人专栏 ： 算法—排序篇 🌄 莫道桑榆晚，为霞尚满天！ 文章目录 📑前言🌤️归并排序的思想☁️基本思想☁️归并的思想实现☁️分治法 &#x1f3…

阅读更多...

H5游戏源码分享-跳得更高

H5游戏源码分享-跳得更高

H5游戏源码分享-跳得更高控制跳动踩到云朵上 <!DOCTYPE html> <html> <head><meta http-equiv"Content-Type" content"text/html; charsetUTF-8"><meta http-equiv"Content-Type" content"text/html;"&g…

阅读更多...

利用ChatGPT进行股票走势分析

利用ChatGPT进行股票走势分析

文章目录 1. 股票分析2. 技巧分析3. 分析技巧21. 股票分析这张图片显示了一个股票交易软件的界面。以下是根据图片内容的一些解读：股票代码: 图片右上角显示的代码是“600517”，这是股票的代码。图形解读: 该图展示了股票的日K线图。其中，蜡烛图表示每日的开盘、收盘、最…

阅读更多...

Rest风格基本语法与实战

Rest风格基本语法与实战

1，前置知识点 1.1 GetMapping，PostMapping，PutMapping，DeleteMapping 平时我们都是使用RequestMapping，然后通过它的method属性来指定请求的方式，这样是有些麻烦的，然后这四个标签就是来简化这…

阅读更多...

Day 16 python学习笔记

Day 16 python学习笔记

静态方法静态方法，只需要在方法前添加 staticmethod， 方法就可以不写形参self，可以通过实例对象.方法名调用，也可以通过类名.方法名调用例： class Test:staticmethoddef test1():print("你好")def nums(se…

阅读更多...

异步 AIMD 收敛

异步 AIMD 收敛

给出的一直都是同步 AIMD 收敛，所以简单，但不至于 bbr 单流情形退化成简陋。给出一个异步 AIMD 收敛过程是必要的，可见，它同样是简洁优美的： 虽然我没有标注太多，它始终没有成为一团乱麻。和同步 AIM…

阅读更多...

Linux tar打包命令

Linux tar打包命令

Linux 系统中，最常用的归档（打包）命令就是 tar，该命令可以将许多文件一起保存到一个单独的磁带或磁盘中进行归档。不仅如此，该命令还可以从归档文件中还原所需文件，也就是打包的反过程，称为解打…

阅读更多...

随机链表的复制（Java详解）

随机链表的复制（Java详解）

一、题目描述给你一个长度为 n 的链表，每个节点包含一个额外增加的随机指针 random ，该指针可以指向链表中的任何节点或空节点。构造这个链表的深拷贝。深拷贝应该正好由 n 个全新节点组成，其中每个新节点的值都设为其对应的原节点的…

阅读更多...

英语——分享篇——常用人物身份

英语——分享篇——常用人物身份

常用人物身份家庭成员类 father 父亲 mother 母亲 grandmother（外）祖母 grandfather（外）祖父 son 儿子 daughter 女儿 uncle 叔叔，舅舅 aunt 婶母，舅母 brother 兄弟 sister 姐妹 nephew 侄子 niece…

阅读更多...

Centos7下生成https自签名证书

Centos7下生成https自签名证书

1、安装openssl yum install openssl2、生成带密码的私有秘钥文件 openssl genrsa -des3 -out server.key 2048使用带密码的私有秘钥文件时需要输入密码，这里直接输入：123456 3、生成不带密码的私有秘钥文件 openssl rsa -in server.key -out serve…

阅读更多...

考虑时空相关性的风电功率预测误差MATLAB代码

考虑时空相关性的风电功率预测误差MATLAB代码

微❤关注“电气仔推送”获得资料（专享优惠） 风电功率预测置信区间误差分析拟合 1.风电功率预测误差--时空相关性展示第一一个时间段的风电功率预测与实际风电功率值的比较。填充区域表示预测的不确定性，显示了95%置信区间内预测可能的范围…

阅读更多...

vulnhub momentum 靶机复盘

vulnhub momentum 靶机复盘

环境配置到学校了原来的桥接配置要改这里记录几个点备忘 1.virtualbox 桥接未指定重新安装驱动VBoxNetLwf.inf 2.配置完靶机启动失败手动安装VBoxNetLwf.inf 不要用virtualbox自带的netlwfinstall 3.配置完nmap扫不到 rw init/bin/bash 进去看看网卡配置信息收集…

阅读更多...

【Java系列】HashMap

【Java系列】HashMap

HashMap 介绍HashMap 类提供了很多有用的方法添加键值对(key-value)创建一个字符串（String）类型的 key 和字符（String）类型的 value：访问元素删除元素删除所有键值对(key-value)可以使用 clear 方法：计算大…

阅读更多...

基于SSM的养老院管理系统

基于SSM的养老院管理系统

基于SSM的养老院管理系统的设计与实现~ 开发语言：Java数据库：MySQL技术：SpringSpringMVCMyBatisVUE工具：IDEA/Ecilpse、Navicat、Maven 系统展示摘要养老院管理系统是一个基于SSM（Spring、Spring MVC、MyBatis&…

阅读更多...

基于SSM的航空订票系统

基于SSM的航空订票系统

基于SSM的航空订票系统的设计与实现~ 开发语言：Java数据库：MySQL技术：SpringSpringMVCMyBatis工具：IDEA/Ecilpse、Navicat、Maven 系统展示主页用户界面管理员界面摘要基于SSM的航空订票系统是一款面向旅客、航空公司和旅…

阅读更多...

FreeRTOS_信号量之二值信号量

FreeRTOS_信号量之二值信号量

目录 1. 信号量简介 2. 二值信号量 2.1 二值信号量简介 2.1.1 二值信号量无效 2.1.2 中断释放信号量 2.1.3 任务获取信号量成功 2.1.4 任务再次进入阻塞态 2.2 创建二值信号量 2.2.1 vSemaphoreCreateBinary() 2.2.2 xSemaphoreCreateBinary() 2.2.3 xSemaphoreCrea…

阅读更多...

推荐文章

最新文章