使用大模型进行代码阅读——关于LLaMA模型代码的一些思考

使用大模型进行代码阅读——关于LLaMA模型代码的一些思考

news2025/4/26 23:35:08

使用大模型进行代码阅读

关于LLaMA模型代码的一些思考

关于这个模型的代码其实挺简单的，如果了解transformer decoder的代码，这个代码理解起来相对会比较容易一些，但是在这个代码里面有几个问题，是自己的一些思考或者是疑问点吧，然后我就尝试去用大模型帮我去做了一些回答。

但是还是有一个疑问就是，为什么queries不需要存到缓存里面？

后来自己尝试理解了一下，是不是因为在进行attention计算的时候，我的key和value都是局部的，但是算的时候要跟整个序列即q去进行attention打分。而且key和value它是通过滑动窗口的形式去进行存储的，在计算和填充的时候会被多次的用到，但是我觉得query也是会被多次用到的，大模型告诉我说因为query后面不会被用的，所以不需要存储，有一点疑惑。

OK，下面我们来看一下效果吧。确实有被惊艳到。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/460284.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【NLP教程】用python调用百度AI开放平台进行情感倾向分析

【NLP教程】用python调用百度AI开放平台进行情感倾向分析

一、背景 Hi，大家！我是马哥python说 ，一名10年程序猿。今天我来演示一下：通过百度AI开放平台，利用python调用百度接口进行中文情感倾向分析，并得出情感极性分为积极、消极还是中性以及置信度结果。二…

阅读更多...

HTB-Cache

HTB-Cache

HTB-Cache 信息收集80端口立足www-data -> ashash -> luffyluffy -> root 信息收集 80端口主页是一些hacker的介绍。作者介绍能收集可能的用户名ASH以及有一个其他项目可能有用，如下： “Check out his other projects like Cache:HMS(Hosp…

阅读更多...

【Python小技巧】使用Gradio 构建基于ChatGPT的AI绘图 Web 应用（附源码）

【Python小技巧】使用Gradio 构建基于ChatGPT的AI绘图 Web 应用（附源码）

文章目录前言一、Gradio是什么？二、使用Gradio构建基于ChatGPT的 Web 应用1. 安装gradio库2. 安装openai库（ChatGPT的python库）3. Web 应用示例（源代码） 总结前言都说ChatGPT也可以生成图片，好奇的我也…

阅读更多...

母婴市场竞争激烈，如何通过软文营销脱颖而出

母婴市场竞争激烈，如何通过软文营销脱颖而出

如今，随着宝宝数量增加以及人们对孩子的重视程度的增加，母婴市场愈发火爆。然而，母婴行业的竞争也越来越激烈，企业需要不断开拓新市场才能生存。在这样的情况下，软文营销成为了母婴企业拓展市场的一种有效方式。首先&…

阅读更多...

Docker Compose的安装教程、使用教程示例

Docker Compose的安装教程、使用教程示例

Docker Compose的安装教程、使用教程示例安装教程下载修改权限创建软链测试是否安装成功使用教程1: 定义python应用2.创建容器的Dockerfile文件3.定义docker-compose脚本web容器：redis容器： 4.使用Compose构建并运行您的应用程序5.访问浏览器安装教程…

阅读更多...

【人体姿态估计】（一）原理介绍

【人体姿态估计】（一）原理介绍

【人体姿态估计】（一）原理介绍一、背景人体姿态估计本质上是一个关键点检测的项目； 关键点检测在生活中的应用十分广泛，包括人脸识别、手势识别，而人体姿态估计则是对身体的关键点进行检测； 本文将介…

阅读更多...

Python学习中更适合中国宝宝的报错整理~

Python学习中更适合中国宝宝的报错整理~

人生苦短，我用python 最近有很多小伙伴说实在是看不懂报错的类型， 这次就给大家整理好了基本上玩python会遇到的报错问题更适合中国宝宝体制喔~ python 安装包资料:点击此处跳转文末名片获取在python中不同的异常可以用不同的类型 （pyt…

阅读更多...

【Python小技巧】使用Gradio构建基于ChatGPT的 Web 应用（附源码）

【Python小技巧】使用Gradio构建基于ChatGPT的 Web 应用（附源码）

文章目录前言一、Gradio是什么？二、使用Gradio构建基于ChatGPT的 Web 应用1. 安装gradio库2. 安装openai库（ChatGPT的python库）3. Web 应用示例（源代码） 总结前言随着人工智能的不断发展，各种智能算法越…

阅读更多...

爆料一家互联网中厂的年终奖，真香。

爆料一家互联网中厂的年终奖，真香。

前不久刷到宇宙条32岁员工14万的月薪截图，突然想起来已经快四月底了，正是各大互联网公司年终奖开奖的时候，但相比以往，今年互联网圈好像安静了很多。各种“凡尔赛”的年终奖金额刷屏的情况不复存在。各家大厂都暗戳戳地分完了奖…

阅读更多...

js实现iframe框架的面包屑功能

js实现iframe框架的面包屑功能

js实现iframe框架的面包屑功能什么是iframe框架什么是面包屑面包屑的js实现思路代码实现小结什么是iframe框架 iFrame全称Inline Frame是HTML中的一个标签，用于在一个HTML文档中嵌入另一个HTML文档。iFrame框架可以将一个HTML文档嵌入到另一个HTML文档中的一个独…

阅读更多...

后代选择器

后代选择器

知识点： 代码： <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta http-equiv"X-UA-Compatible" content"IEedge"> <meta name"viewport" c…

阅读更多...

深度学习入门到实践：相关基础概述

深度学习入门到实践：相关基础概述

绪论深度学习（Deep Learning）是近年来发展十分迅速的研究领域，并且在人工智能的很多子领域都取得了巨大的成功。从根源来讲，深度学习是机器学习的一个分支，是指一类问题以及解决这类问题的方法。深度学习问题…

阅读更多...

【Arduino SD卡和数据记录教程】

【Arduino SD卡和数据记录教程】

【Arduino SD卡和数据记录教程】 1. 前言2. 工作原理3. Arduino SD 卡模块代码4. Arduino SD卡数据记录1. 前言在本Arduino教程中，我们将学习如何将SD卡模块与Arduino板一起使用。此外，结合DS3231实时时钟模块，我们将制作一个数据记录示例，将温度传感器的数据存储到SD卡中…

阅读更多...

分布式消息队列Kafka（一）

分布式消息队列Kafka（一）

一.kafka基础架构 （1）Producer：消息生产者，就是向 Kafka broker 发消息的客户端。 （2）Consumer：消息消费者，向 Kafka broker 取消息的客户端。 （3）Consumer…

阅读更多...

每日一个小技巧：1分钟告诉你截图翻译软件哪个好用

每日一个小技巧：1分钟告诉你截图翻译软件哪个好用

随着互联网的发展，我们对各种语言文字的翻译需求越来越高。在翻译时，大家经常会遇到一些生词或专业术语，这时候我们就需要使用翻译软件来帮助理解。但是，有些时候大家需要翻译的内容并不是一段文本，而是一张图片或截图…

阅读更多...

《前端bug齁逼多，真假开发说》2023/4/10-2023/4/18问题汇总

《前端bug齁逼多，真假开发说》2023/4/10-2023/4/18问题汇总

1 高德地图运行抱错 INVALID_USER_SCODE 这里是错误信息对应原因错误信息列表-参考手册-地图 JS API | 高德地图API 这里是高德地图api设置说明准备-入门-教程-地图 JS API | 高德地图API 如果你自己能排查出错误那不用看我的，如果都写的对还是抱错…

阅读更多...

最常用的从A到Z的Linux命令，真的很好记，三分钟刷完！

最常用的从A到Z的Linux命令，真的很好记，三分钟刷完！

Linux的命令行是一个非常强大的工具。如果你知道如何利用Linux命令，你可以轻松地在Linux系统中执行各种任务。在这篇文章中，我们将介绍从A到Z的Linux命令。 alias alias命令允许你为常用的命令设置一个短的别名，以节省时间和减少敲击。例如&…

阅读更多...

界面开发框架Qt新手入门 - 自定义排序/筛选模型示例（一）

界面开发框架Qt新手入门 - 自定义排序/筛选模型示例（一）

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写，所有平台无差别运行，更提供了几乎所有开发过程中需要用到的工具。如今，Qt已被运用于超过70个行业、数千家企业，支持数百万设备及应用。自定义排序/筛选模型…

阅读更多...

IBL-镜面反射（LUT篇）

IBL-镜面反射（LUT篇）

1. LUT需要求解什么首先我们将镜面反射部分的积分分割为两个部分。 L o ( p , ω o ) ∫ Ω L i ( p , ω i ) d ω i ∗ ∫ Ω f r ( p , ω i , ω o ) n ⋅ ω i d ω i L_{o}\left(p, \omega_{o}\right)\int_{\Omega} L_{i}\left(p, \omega_{i}\right) d \omega_{i} * …

阅读更多...

基于异常值鲁棒性问题的极限学习机的回归问题研究（Matlab代码实现）

基于异常值鲁棒性问题的极限学习机的回归问题研究（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…

阅读更多...

推荐文章

最新文章