【Datawhale AI夏令营第四期】魔搭-大模型应用开发方向笔记 Task04 RAG模型人话八股文Bakwaan

【Datawhale AI夏令营第四期】魔搭-大模型应用开发方向笔记 Task04 RAG模型人话八股文Bakwaan_Buddy项目创空间部署

news2026/2/13 0:01:46

【Datawhale AI夏令营第四期】魔搭-大模型应用开发方向笔记 Task04 RAG模型人话八股文Bakwaan_Buddy项目创空间部署

什么是RAG：

在这里插入图片描述

我能把这个过程理解为Kimi.ai每次都能列出的一大堆网页参考资料吗？Kimi学了这些资料以后，根据这里面的信息综合还生成的答案，而不是仅仅基于自己的现有知识库回答。
Kimi本体认证：差不多就是这个意思！RAG=AI自己的知识库+现成输入/网上现找的，现学提炼信息回答 在这里插入图片描述

一个完整的RAG链路：

在这里插入图片描述
有道截屏翻译一下：

也就是说，我们传给AI解析的东西都会塞进数据库？那是不是机密的东西（比如未发表的自己的论文）就不能给AI纠错了？、

遗憾的是，确实是这样。

Kimi的后半段说的也很对，需要充分披露AI的使用情况。想之前我港硕在读的时候，我们有门课的老师就允许我们用AI，但是必须在作业开头声明使用的AI及其具体用途，比如翻译润色、资料收集等。
在这里插入图片描述

想起来之前一个很常见的例子：好像是词向量空间里面，男人到国王的距离与女人到女王的距离差不多。

之前在Youtube看推荐算法网课的时候，记得很对推荐的选项也是离线完成的。
RAG的在线计算过程和推荐算法感觉有很多相似之处。
在这里插入图片描述
说到推荐系统，Youtube上有一个推荐系统网课挺不错，是基于小红书的技术路线做的剖析。B站上好像也有。
https://www.youtube.com/watch?v=5dTOPen28ts&list=PLvOO0btloRntAi-VnV06M1Bu0X1xljUUP
传送门（需要科学上网）

在这里插入图片描述

现有的开源框架：

在这里插入图片描述

我猜这里是RAG的关键？让模型学到知识库里面的东西。

代码当中这个get_similarity函数就是在算余弦相似度：

这段RAG代码定义了两个主要的类，VectorStoreIndex 和 LLM。
VectorStoreIndex负责管理文档、找相似的。在这里插入图片描述
LLM类型要常见一些，之前其他大模型应用里面也有差不多的类，在这负责查询文档生成文本。
那么，RAG的核心是否就依赖于这个额外输入的knowledge.txt呢？

知识库的文本数据被读取，生成向量表示，和模型的其他自有知识库里面的知识一起参与余弦相似度匹配（计算问题向量与知识库中每个文档向量之间的余弦相似度），如果最相似，知识库就发挥了作用，与模型现有的其他知识一起参与生成回答。

RAG模型的两个主要组件：检索组件用来管理和检索文档向量，生成组件用于生成回答。
在这里插入图片描述

项目开发遇到的BUG：

说回项目开发这块，我之前用的DeepSeek的模型，现在按照Task03的案例换回浪潮大模型，但是遇到一个很致命的问题——运行模型弹出的俩浏览器网页我的电脑都打不开。
在这里插入图片描述

一位群友提供了一个解决方案：

我尝试了但是还是不行。

然后另一位大佬说要做端口转发，但我完全没听过这是啥……

于是我又继续在群里厚脸皮请教，刚刚那位大佬表示：我没把命令形式写对。
在这里插入图片描述
以防万一，我这次直接让Kimi帮我写了一段规范的：

streamlit run app.py --server.address 127.0.0.1 --server.port 6006

这次就没问题啦！耶！！！
在这里插入图片描述
但是我的程序还是跑不起来，不知道为什么老找不到模型……

我看了一下被我模仿……哦不借鉴的Task03的AI科研助手，原来他这里专门定义的模型路径跟我那个不一样，有个“-”和“_”的区别，怪不得我打不开！！
在这里插入图片描述
我的代码：
果然不报这个错误了！！
经过我的一番操作和通义千问不厌其烦地努力，手工删除了很多借鉴，咳咳，别人模型引入的一些莫名其妙不需要的多余变量，现在总算是迁移模型成功了！

人话：能跑了。
但是显而易见，这个迁移后的效果不怎么好……
在这里插入图片描述
增加了随机种子以后好了一些，但是显然回答的质量远不如之前DeepSeek的模型高。

而且整个【换一换】按钮老重复出现，我暂时还不知道该怎么改掉。
效果不算太让我满意，但是就我目前水平来说感觉一下子也提不起来，而且确实这个夏令营的进度太！赶！了！我还同时参加了AIGC方向的夏令营，两边都在猛追进度。我决定先看看部署如何是好，之前看了Streamlit好像就有这个功能。
看起来还不算太难？
在这里插入图片描述
注意这个注册邮箱不能是QQ邮箱，否则显示不出校验码。
但是我换了港硕邮箱，发现他认不出我是真人……163邮箱也不行。

另一个部署平台也注册不了……

这就有点尴尬了……

创空间部署装环境

我试了AI给我建议的部署平台，俩都不行，后面我找到了ModelScope的疑似部署地址创空间，下面这个是教程：https://www.modelscope.cn/docs/%E5%88%9B%E7%A9%BA%E9%97%B4%E5%88%9B%E5%BB%BA%E4%B8%8E%E6%90%AD%E5%BB%BA
传送门
我创空间部署的时候遇到了一个奇葩问题：环境没对——No Module named ‘langchain’。
在这里插入图片描述
问了热心群友，终于搞明白了应该怎么给创空间装环境让他不要报错“缺少模块”。

这个问题解决了以后，后面又遇到Torch和CUDA不配合的问题：

还是这位好心的大佬，教我把调用了GPU的代码让AI改CPU！

在这里插入图片描述

在这里插入图片描述
然后果然代码没再报错了。但我感觉CPU好像不太聪明的样子，看不到运行结果？？
群里这位大佬摸索的这个部署逻辑基本对。
要有个app.py，requirements.txt库写上所有依赖的环境包，创空间会自动读取这俩运行装库，跑代码，没报错=部署成功一大半了（环境没挂），后续就是功能测试和代码内部逻辑问题。
在这里插入图片描述

Task03AI科研助手案例：

我第一次运行装环境也报错。
在这里插入图片描述

大佬说更新pip和改一下传参的写法。

我再跑了一次装环境的命令发现报错消失了，但是始终提示找不到他这代码文件。确实看只装了环境，也没有拉代码库下来的命令，我就自己建了个.py代码跑。
中间报错我问通义千问也是半懂不懂的，反正缺啥库就装，一顿操作猛如虎。
在这里插入图片描述
然后莫名其妙就跑起来了，AMAZING！

喂它一个之前实习公司讲座介绍的关于AI调参的论文试试：
北大巨佬的学术成果，瞻仰一下。

啊这……？？？？？

整不会了，先放放。停机的时候都给网站卡出彩花了。
在这里插入图片描述