大模型知识检索RAG业务实践实践(初级篇)
1.知识检索大图
大模型是现在一个非常热门的话题,大模型表现出的生成能力也是非常惊艳。但是强如 GPT4 这样的大模型,它在知识更新和幻觉上也会存在问题。比如说我们问互联网行业有什么大事,GPT4 的回答是三年前的内容。主要是说疫情和互联网监管等三年前的信息。原因是因为训练 GPT4 的知识是截止于 2021 年的。另外一个就是幻觉问题,你问大模型美团 CEO 是谁?GPT4 回答王慧文,但实际上是王兴。那对于生成模型的这两个问题:知识更新和幻觉,在金融领域的话是比较致命的。金融领域比如对于金融行情描述等等,都是需要实时的知识更新的。在保险理赔领域,如果出现幻觉问题,问了一个重疾险能赔吗?如果说能赔,是要负法律责任的。对于一个金融这种严谨高时效性的场景,我们就需要解决这两个问题。
有效的解决方案就是知识检索。通过检索高时效、可信、丰富的知识,让大模型根据检索的知识进行可控的生成。
下面我们就看一下整个知识检索的大图: