RAG与LLM原理及实践（7）--- Chroma query应用层策略及实现原理

RAG与LLM原理及实践（7）--- Chroma query应用层策略及实现原理

news2026/2/15 2:20:08

背景

Chroma query 底层查询的 query 思想是相同的，甚至在vector db 的世界中，都大同小异。如果你有看前面写的 RAG与LLM原理及实践（5）--- Chroma query 源码分析

应该比较清楚query的运作原理，说直白就是在memory或是disk中通过暴力查询比较与HNSW算法（NSW算法的变种，分层可导航小世界）进行分析得到。

其中向量比较的几种方式，如果你看了前面写的 RAG与LLM原理及实践（4）--- 语义相似度距离衡量的三种方式chroma示例应该也比较清楚，就是cosine，l2，ip 几种比较方式。

这是底层运作的基本思想。但是站在应用层的角度，query可以有所不同。下面的内容聚焦在站在应用层的角度，从chroma源码进行分析，彻底理解 query 在应用层上的调用及使用场景。在开始说明具体问题之前，你需要了解在词句评估时，几个比较重要的概念。

Similarity & Redundancy

相似度 (Similarity) 与冗余度 (Redundancy)是两个不同概念，它们用于在选择嵌入时评估嵌入与查询之间的关系以及已选集合之间的关系。

相似度 (Similarity)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1883815.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

写代码，为什么还需要作图？

写代码，为什么还需要作图？

引言古人云 ：一图胜千言，闲人说：无图无真相。在日常的聊天工具当中，无论是使用微信，还是钉钉。使用图片或表情包的频次越来越高，那是为什么呢？其实在互联网没有那么发达的时候，我…

阅读更多...

Adobe Premiere 视频编辑软件下载安装，pr全系列分享轻松编辑视频

Adobe Premiere 视频编辑软件下载安装，pr全系列分享轻松编辑视频

Adobe Premiere，自其诞生之日起，便以其卓越的性能和出色的表现，稳坐视频编辑领域的王者宝座，赢得了无数专业编辑人员与广大爱好者的青睐。这款强大的视频编辑软件，凭借其丰富的功能和灵活的操作性，为用户提…

阅读更多...

（1）Jupyter Notebook 下载及安装

（1）Jupyter Notebook 下载及安装

目录 1. Jupyter Notebook是什么？2. Jupyter Notebook特征3. 应用3. 利用Google Colab安装Jupyter Notebook3.1 什么是 Colab？3.2 访问 Google Colab 1. Jupyter Notebook是什么？ 百度百科: Jupyter Notebook（此前被称为 IPython …

阅读更多...

函数创建单链表---无n型，需要 while 循环 + scanf

函数创建单链表---无n型，需要 while 循环 + scanf

题目： #include <stdlib.h> struct link{int data;struct link *next; }; struct link* creatLink(); int main(){struct link *head,*p;headcreatLink();for(phead->next ;p;pp->next )printf("%d ",p->data );return 0; }/* 请在这里填…

阅读更多...

501、二叉搜索树中的众数

501、二叉搜索树中的众数

给你一个含重复值的二叉搜索树（BST）的根节点 root ，找出并返回 BST 中的所有众数（即，出现频率最高的元素）。如果树中有不止一个众数，可以按任意顺序返回。假定 BST 满足如下定义&#xff1…

阅读更多...

泛微E9开发根据故障来源新增明细行，并且初始化错误类型

泛微E9开发根据故障来源新增明细行，并且初始化错误类型

根据故障来源新增明细行，并且初始化错误类型 1、需求说明2、实现方法3、扩展知识点3.1 批量修改字段值或显示属性3.1.1 格式3.1.2 参数3.1.3 演示 3.2 根据字段ID获取字段信息3.2.1 格式3.2.2 参数3.2.3 演示 1、需求说明用户对出现故障的机器或设备进行判断问题判…

阅读更多...

第十四届蓝桥杯省赛C++A组F题【买瓜】题解（AC）

第十四届蓝桥杯省赛C++A组F题【买瓜】题解（AC）

70pts 题目要求我们在给定的瓜中选择一些瓜，可以选择将瓜劈成两半，使得最后的总重量恰好等于 m m m。我们的目标是求出至少需要劈多少个瓜。首先，我们注意到每个瓜的重量最多为 1 0 9 10^9 109，而求和的重量 m m m 也最多为…

阅读更多...

Linux高并发服务器开发（八）Socket和TCP

Linux高并发服务器开发（八）Socket和TCP

文章目录 1 IPV4套接字结构体2 TCP客户端函数 3 TCP服务器流程函数代码粘包 4 三次握手5 四次挥手6 滑动窗口 1 IPV4套接字结构体 2 TCP客户端特点：出错重传每次发送数据对方都会回ACK，可靠 tcp是打电话的模型，建立连接使用连接关闭连接…

阅读更多...

探索SOLIDWORKS 2024设计增强功能

探索SOLIDWORKS 2024设计增强功能

随着技术的不断进步和市场的日益竞争，工程设计和制造行业对于快捷、准确和创新的工具需求日益增长。SOLIDWORKS作为3D CAD设计软件，一直致力于为用户提供更强大、更便捷的设计工具。SOLIDWORKS 2024的发布，再次证明了其在设计增强功能方面的持…

阅读更多...

代码随想录算法训练营Day55|42.接雨水、84.柱状图中最大的矩形

代码随想录算法训练营Day55|42.接雨水、84.柱状图中最大的矩形

接雨水 42. 接雨水 - 力扣（LeetCode） 暴力解法对计算接到的雨水，有两种方式，一是按照行来计算。另一种是按列计算按列计算容易不乱。基本思路如下： 对每列i进行循环，在循环中，找到该列左…

阅读更多...

python-逻辑语句

python-逻辑语句

if else语句不同于C：else if range语句： continue continue的作用是： 中断所在循环的当次执行，直接进入下一次 continue在嵌套循环中的应用 break 直接结束所在的循环 break在嵌套循环中的应用 continue和break，在…

阅读更多...

【TB作品】atmega16 计算器，ATMEGA16单片机，Proteus仿真

【TB作品】atmega16 计算器，ATMEGA16单片机，Proteus仿真

实验报告：基于ATmega16单片机的简易计算器设计 1. 实验背景计算器是日常生活和工作中不可或缺的工具，通过按键输入即可实现基本的四则运算。通过本实验，我们将利用ATmega16单片机、矩阵键盘和LCD1602显示屏，设计并实现一个简易…

阅读更多...

【TB作品】智能台灯，ATMEGA16单片机，Proteus仿真

【TB作品】智能台灯，ATMEGA16单片机，Proteus仿真

智能台灯 1 adc检测光强光敏电阻显示电压 2 光强太高也就是高于临界值就关闭小灯 3 光强太低也就是低于临界值就打开小灯 3 按键修改临界值显示实验报告：基于ATMEGA16单片机的智能台灯设计与Proteus仿真 1. 实验背景智能台灯是一种能够根据环境光强自动调…

阅读更多...

【Altium】AD-焊盘介绍

【Altium】AD-焊盘介绍

【更多软件使用问题请点击亿道电子官方网站】 1、文档目标介绍PCB设计工具中焊盘的组成 2、知识点为元件创建封装时，焊盘都是不可获取的部分，一个完整的焊盘，包含了哪些部分，各自又是什么作用。 3、软硬件环境 1&#xff…

阅读更多...

算法笔记：模拟过程（螺旋遍历矩阵）

算法笔记：模拟过程（螺旋遍历矩阵）

1 模拟过程 “模拟过程题”通常指的是那些要求编程者通过编写代码来“模拟”或重现某个过程、系统或规则的题目。这类题目往往不涉及复杂的数据结构或高级算法，而是侧重于对给定规则的精确执行和逻辑的清晰表达。其中螺旋遍历矩阵的题目就是一类典型的模拟过程题…

阅读更多...

学习笔记（linux高级编程）7

学习笔记（linux高级编程）7

2._exit 系统调用 void _exit(int status); 功能: 让进程退出,不刷新缓存区参数: status:进程退出状态返回值: 缺省回调函数 3.atexit int atexit(void (*function)(void)); 功能: 注册进程退出前执行的函数参数: function:函数指针指向void返回值void参数的函数指针返…

阅读更多...

吴恩达《LangChain for LLM Application Development》课程笔记

吴恩达《LangChain for LLM Application Development》课程笔记

目录 1. 前言 2. 课程笔记 2.1. 模型、提示和解析器 2.2. LLM记忆，上下文管理 2.3. 链式操作 2.4. 文档问答 2.4.1. stuff 方法 2.4.2. 其他方法 2.5. LLM应用评估 2.6. 代理 2.6.1. 预定义工具 2.6.2. 自定义工具代码资源： 1. 前言 LangC…

阅读更多...

汇聚荣拼多多电商好不好？

汇聚荣拼多多电商好不好？

拼多多电商好不好?这是一个值得探讨的问题。拼多多作为中国领先的电商平台之一，以其独特的商业模式和创新的营销策略吸引了大量用户。然而，对于这个问题的回答并不是简单的好或不好，而是需要从多个方面进行综合分析。一、商品质量来看拼多…

阅读更多...

混合专家模型（MoE）的前世今生

混合专家模型（MoE）的前世今生

在文章《聊聊最近很火的混合专家模型（MoE）》中，我们简单介绍了MoE模型的定义和设计，并且比较了MoE和Dense模型的区别，今天我们继续来回顾一下MoE模型发展的历史和最新的发展现状。从去年GPT-4发布至今，MoE…

阅读更多...

AIGC重塑创意设计：不仅能带来新技术，更能引发新思考

AIGC重塑创意设计：不仅能带来新技术，更能引发新思考

随着科技的飞速发展，AIGC（生成式人工智能）已经逐渐成为创意设计领域的一股新势力。从影视制作到游戏设计，从平面广告到数字媒体，AIGC的影响力无处不在，它不仅带来了全新的技术手段，更在深层次上…

阅读更多...

推荐文章

最新文章