此为看完视频What is Retrieval-Augmented Generation (RAG)?后的笔记。
视频很intuitive,上面这张截屏包含了所有RAG的要点。
RAG是一个框架,解决了LLM的2个问题:
- No source。没有来源,没有证据来支持或证明你的观点。
- 过时。LLM只包括训练时包含的信息。
作者举了个例子,例如她孩子问:在我们的太阳系中,哪个行星拥有最多的卫星?
作者会回答:木星,有88颗卫星。
作者的答案是脱口而出的,但是未必有可信的证据(如NASA),同时,随着科学的进步,现在我们发现所以土星拥有最多的卫星,146 个。当然,未来答案还可能会变。
那RAG到哪里去寻找增强呢,答案就是作者左手上方的那四个青色的正方形:data store或content store。
data store可以是互联网,也可以是用户/企业私有的数据。如果有了新的知识,我们可以丰富或更新我们的data store。
这就解决了过时的问题。
可信方面,则是让大模型(客户端)去查询可信的数据源,从而避免了幻觉或数据泄露的问题。
所以,在RAG框架下,提示(prompt)包括3部分:
- 用户的问题
- 提请注意的指令
- (增强)检索到的内容