ModaHub魔搭社区：详解GPTCache 系统的五个主要组件

news2026/2/8 12:15:21

目录

LLM 适配器（LLM Adapter）

Embedding 生成器（Embedding Generator）

缓存管理器（Cache Manager）

相似性评估器（Similarity Evaluator）

后期处理器（Post Processors）

所以整个 GPTCache 系统共包含五个主要组件：

LLM 适配器（LLM Adapter）

适配器将 LLM 请求转换为缓存协议，并将缓存结果转换为 LLM 响应。由于想让 GPTCache 变得更加透明（这样用户无需额外研发，便可将其轻松集成到我们的系统或其他基于 ChatGPT 搭建的系统中），所以适配器应该方便轻松集成所有 LLM，并可灵活扩展，从而在未来集成更多的多模态模型。

目前，我们已经完成了 OpenAI 和 LangChain 的适配器。未来，GPTCache 的接口还能进一步扩展，以接入更多 LLM API。

Embedding 生成器（Embedding Generator）

Embedding 生成器可以将用户查询的问题转化为 embedding 向量，便于后续的向量相似性检索。为满足不同用户的需求，我们在当下支持两种 embedding 生成方式。第一种是通过云服务（如 OpenAI、Hugging Face 和 Cohere 等）生成 embedding 向量，第二种是通过在 ONNX 上使用本地模型生成 embedding 向量。

后续，GPTCache 还计划支持 PyTorch embedding 生成器，从而将图像、音频文件和其他类型非结构化数据转化为 embedding 向量。

缓存管理器（Cache Manager）

缓存管理器是 GPTCache 的核心组件，具备以下三种功能：

缓存存储，存储用户请求及对应的 LLM 响应向量存储，存储 embedding 向量并检索相似结果逐出管理，控制缓存容量并在缓存满时根据 LRU 或 FIFO 策略清除过期数据缓存管理器采用可插拔设计。最初，团队在后端实现时使用了 SQLite 和 FAISS。后来，我们进一步扩展缓存管理器，加入了 MySQL、PostgreSQL、Milvus 等。

逐出管理器通过从 GPTCache 中删除旧的、未使用的数据来释放内存。必要时，它从缓存和向量存储中删除数据。但是，在向量存储系统中频繁进行删除操作可能会导致性能下降。所以，GPTCache 只会在达到删除阈值时触发异步操作（如构建索引、压缩等）。

相似性评估器（Similarity Evaluator）

GPTCache 从其缓存中检索 Top-K 最相似答案，并使用相似性评估函数确定缓存的答案是否与输入查询匹配。

GPTCache 支持三种评估函数：精确匹配（exact match）、向量距离（embedding distance）和 ONNX 模型评估。

相似性评估模块对于 GPTCache 同样至关重要。经过调研，我们最终采用了调参后的 ALBERT 模型。当然，这一部分仍有改进空间，也可以使用其他语言模型或其他 LLM（如 LLaMa-7b）。对于这部分有想法的小伙伴可以联系我们！

后期处理器（Post Processors）

后期处理器整理最终响应返回给用户。它可以返回最相似的响应或根据请求的温度参数调整响应的随机性。如果在缓存中找不到相似的响应，后期处理器则会将请求转发给 LLM 来生成响应，同时生成的响应将被存储在缓存中。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/718094.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Flink DataStream之从Kafka读数据

Flink DataStream之从Kafka读数据

搭建Kafka 参考：centos7下kafka2.12-2.1.0的安装及使用_kafka2.12-2.1.0 steam_QYHuiiQ的博客-CSDN博客启动zookeeper [rootlocalhost kafka_2.12-2.8.1]# pwd /usr/local/wyh/kafka/kafka_2.12-2.8.1 [rootlocalhost kafka_2.12-2.8.1]# ./bin/zookeeper-server…

阅读更多...

Windows 环境下Docker 安装伪分布式 Hadoop

Windows 环境下Docker 安装伪分布式 Hadoop

Windows 环境下Docker 安装伪分布式 Hadoop 1、环境2、拉取镜像3、启动容器4、预备操作4.1安装vim4.1.1 更新软件包信息4.1.2 安装vim 4.2 换源4.2.1 备份镜像源设置文件4.2.2 编辑镜像源设置文件4.2.3 重新更新一下软件包信息 4.3 同步上海时间4.3.1 安装 tzdata4.3.2 设置 tz…

阅读更多...

[AJAX]原生AJAX——服务端如何发出JSON格式响应，客户端如何处理接收JSON格式响应

[AJAX]原生AJAX——服务端如何发出JSON格式响应，客户端如何处理接收JSON格式响应

服务端代码： <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> &l…

阅读更多...

IPV6使用越来越广，您会配置吗？

IPV6使用越来越广，您会配置吗？

前面针对IPv6写过一篇文章，但是好多网友反映没有读懂，今天再给大家把内容浓缩一下，教给大家如何配置。 IPV6的推出主要是为了解决地址空间的不足，从而进一步的促进互联网的发展。IPV6地址空间大到惊人，有人比喻地球上…

阅读更多...

Rust in Action笔记第十章进程、线程和容器

Rust in Action笔记第十章进程、线程和容器

Rust的闭包也就是类似lambda表达式，大致的格式是|a, b| {...} ，竖线里面的是参数，花括号里面的是函数逻辑；通过thread::spawn(|| {})产生的线程，括号内的参数实际上就是一个闭包，因为创建新的线程不需要参数…

阅读更多...

【论文阅读】StyleganV1 算法理解

【论文阅读】StyleganV1 算法理解

文章目录为什么提出？具体是怎么做的？1.解耦的思想（对应文章第四章4.Disentanglement studies）1.1 感知路径长度（对应4.1Perceptual path length）1.2 线性可分离性（对应4.2Linear separability&…

阅读更多...

Chrome DevTools、Vue DevTools、vs和DevTools调试

Chrome DevTools、Vue DevTools、vs和DevTools调试

目录 Elements DOM节点（增删改）调试 Styles DOM结构增删属性模拟元素的伪状态，方便调试 Computed Layout Event Listeners Network Application 资源列表（可改）本地存储Cookie、WebStorage（loca…

阅读更多...

人工智能学习07--pytorch22--目标检测：YOLO V3 SPP

人工智能学习07--pytorch22--目标检测：YOLO V3 SPP

视频链接： https://www.bilibili.com/video/BV1t54y1C7ra/?vd_sourceb425cf6a88c74ab02b3939ca66be1c0d yolov3 spp spp：空间金字塔池化 trick：实现的小技巧，方法。（ up：Bag of Freebies里有很多trick&…

阅读更多...

【C++学习笔记】C++中的异常概念异常的使用注意事项异常的优缺点

【C++学习笔记】C++中的异常概念异常的使用注意事项异常的优缺点

异常 1 C语言传统的处理异常的方式2 C异常的概念3 异常的使用以及注意事项3.1 异常的简单使用3.2 使用异常的注意事项3.3 异常的重新抛出3.4 异常规范3.5 异常安全 4 C标准库的异常体系5 异常的优缺点6 总结 1 C语言传统的处理异常的方式 C语言传统的错误处理机制：…

阅读更多...

https安全传输原理：

https安全传输原理：

内容来自思学堂： 信息裸奔——>对称加密——>非对称加密——>非对称和对称加密——>权威第三方机构CA数字签名

阅读更多...

C++图形开发（5）：逐渐变大（小）的小球

C++图形开发（5）：逐渐变大（小）的小球

文章目录 1.逐渐变大的小球2.逐渐变小的小球今天所讲的逐渐变大（小）的小球实际上就是基于上次的缓慢下落的小球的基础上的（下落的小球详见：C图形开发（4）：下落的小球） 1.逐渐变大的…

阅读更多...

蓝桥杯专题-试题版含答案-【数数小木块】【精挑细选】【国王的魔镜】【字符串逆序输出】

蓝桥杯专题-试题版含答案-【数数小木块】【精挑细选】【国王的魔镜】【字符串逆序输出】

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 👉关于作者专注于Android/Unity和各种游…

阅读更多...

每日浅读SLAM论文——简析Cartographer

每日浅读SLAM论文——简析Cartographer

文章目录二维激光SLAM简单框架前端scan matchingSubmaps构建后端分支定界优化csm（CorrelativeScanMatch） 代码实现框架 Cartographer（论文名：Real-Time Loop Closure in 2D LIDAR SLAM）是目前二维激光SLAM中应用最广…

阅读更多...

postman不能进行并发测试

postman不能进行并发测试

1.按照网上文档的配置 2.在登录接口里睡眠5s，如果是并发的话，所有的请求都会一起睡眠5s 3.测试结果：请求是每隔5s串行执行的

阅读更多...

Linux定时任务-定时执行Shell脚本

Linux定时任务-定时执行Shell脚本

主要是使用Linux的crontab工具来实现的，有两个方法，一个放在contab 列表里面，另一个是放在contab文件里面（其实原理是一致的）。 crontab 列表 cd /tmp # 创建一个shell脚本 vim hello.sh #!/bin/bash echo "hel…

阅读更多...

钳形表校准装置单匝法校准钳形电流表

钳形表校准装置单匝法校准钳形电流表

交流大电流源输出标准电流信号到直径为1 m的单匝半圆铜环，电流输出铜环分为大小铜环，适配于校准不同钳口大小的钳形电流表。方案优势：完全符合《JJF 1075-2015 钳形电流表校准规范》中主要推荐的单匝法校准钳形电流表的要求，操控…

阅读更多...

全景感知—让视图上云更便捷，存储更安全

全景感知—让视图上云更便捷，存储更安全

6月15日，由腾讯云主办的“数实共进产业行浙江站”在杭州圆满开展，活动中腾讯云存储高级产品经理张泽南进行了“全景感知，让视图上云更便捷，存储更安全”主题演讲，与行业伙伴深度交流新一代视图计算解决方案&#xff0c…

阅读更多...

Redis中的介绍和安装教程(配置文件)

Redis中的介绍和安装教程(配置文件)

1.Redis简单的介绍 redis是一种键值对的NoSql数据库，这里有两个关键字： 键值对 Nosql 其中键值型，是指Redis中存储的数据都是以key.value对的形式多种多样，可以实字符串、数值、甚至json，可以参考HashMap 然后NoSq…

阅读更多...

TiDB（5）：TiDB-读取历史数据

TiDB（5）：TiDB-读取历史数据

接下来介绍 TiDB 如何读取历史版本数据，包括具体的操作流程以及历史数据的保存策略。 1 功能说明 TiDB 实现了通过标准 SQL 接口读取历史数据功能，无需特殊的 client 或者 driver。当数据被更新、删除后，依然可以通过 SQL 接口将更新/删除前…

阅读更多...

MySQL容器无法输入或显示中文异常解决

MySQL容器无法输入或显示中文异常解决

如果使用docker创建了MySQL容器，但是进入容器后发现无法输入中文，也就是在插入数据的时候中文直接显示为空，数据表里的中文也显示为空，解决方法是： 1，临时方法该方法只在每一次进入容器的命令上添加参数&a…

阅读更多...

推荐文章

最新文章