什么是Vector Database?

什么是Vector Database?

news2026/2/16 11:15:54

此为看完视频What is a Vector Database?后的笔记。

作者首先对数据库做了分类，其中RTweb表示real time web app。

然后对用例做了分类，最后一个就是适合于AI的近似搜索。

好处，包括灵活性，可扩展性和性价比。

本视频最重要的是讲向量数据库的特征，即vector和embedding。

这两个特征是配合工作的。在这里插入图片描述
vector就是向量，就是数组，就是一组数，就是一组浮点数。可以看OpenAI的例子。

在OpenAI的文档中，embedding的定义为：

Get a vector representation of a given input that can be easily consumed by machine learning models and algorithms.
获取给定输入的向量表示，机器学习模型和算法可以轻松使用该表示。

vector和embedding经常互换使用，但既然这里分开了，也可以说下他们的细微区别。

vector是名词，是一组数；embedding是动词，是向量化的过程，或将数据表示为向量的技术，以捕获有意义的信息、语义关系或上下文特征，按照（What are vector embeddings?）的说法，虽然嵌入和向量可以在向量嵌入的上下文中互换使用，但“嵌入”强调以有意义和结构化的方式表示数据的概念，而“向量”指的是数字表示本身。

在OpenAI的例子中，输入一个对象（如文本），OpenAI返回向量，然后你可以存入向量数据库中，如Oracle 23c或SingleStore。
在这里插入图片描述
如果你订阅了OpenAI，可以试下这个通过API实现embedding的例子。

最后，说下好处。

灵活性：关系型，文档，Graph等，任何类型的数据都可以向量化
可扩展性：这里指的是数据的扩展/增长
性价比：指搜索性能很好

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1526194.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【bioinformation 10】ADMET-CYPs抑制剂预测实战

【bioinformation 10】ADMET-CYPs抑制剂预测实战

🌞欢迎来到AI医学的世界 🌈博客主页：卿云阁 💌欢迎关注🎉点赞👍收藏⭐️留言📝 🌟本文由卿云阁原创！ 📆首发时间：🌹2024年3月17日&am…

阅读更多...

/usr/local/bin/docker-compose: line 1: Not: command not found

/usr/local/bin/docker-compose: line 1: Not: command not found

安装docker-compose 检查是否安装成功 docker-compose --version 出错 /usr/local/bin/docker-compose: line 1: Not: command not found 检查下载连接是否正确官网 https://dockerdocs.cn/compose/install/ 根据官网上连接下载发现下载不了在版本前加个V 就可以解决版…

阅读更多...

4.1_4 文件的物理结构

4.1_4 文件的物理结构

文章目录 4.1_4 文件的物理结构（一）文件块、磁盘块（二）文件分配方式——连续分配（三）文件分配方式——链接分配（1）链接分配——隐式链接（2）链接分配——显式链…

阅读更多...

JETSON 配置并跑通 NanoDet

JETSON 配置并跑通 NanoDet

JETSON 配置 NanoDet 文章目录 JETSON 配置 NanoDetNanoDet 介绍源码环境搭建及测试配置 NanoDet 的环境环境配置过程中遇到的问题：环境配置完毕验证 NanoDet NanoDet 介绍可以参考这个博客：NanoDet：这是个小于4M超轻量目标检测模型源码 …

阅读更多...

什么是网站？为什么要搭建网站？

什么是网站？为什么要搭建网站？

网站：简单来说，网站就是通过互联网来展示信息的页面集合。它可以在电脑或者手机上打开，提供各种功能，比如查看新闻、购买商品、搜索信息等。一、建网站的目的：展示个人或企业的存在网站建设的首要目的之一是展示个人…

阅读更多...

23-分支和循环语句_习题练习

23-分支和循环语句_习题练习

1、转换以下ASClI码为对应字符并输出他们：73,32,99, 97,110,32,100,111,32,105,116,33 输入：无输出：一行输出转换题目中给出的所有ASClI码对应的字符，无需以空格隔开。输入： int main() {int i 0;int arr[] { …

阅读更多...

加拿大光量子计算公司Xanadu入局英国多企业量子合作计划

加拿大光量子计算公司Xanadu入局英国多企业量子合作计划

内容来源：量子前哨（ID：Qforepost） 编辑丨慕一编译/排版丨沛贤深度好文：1200字丨8分钟阅读英国航空发动机制造商罗尔斯罗伊斯（Rolls-Royce）、英国量子计算公司Riverlane和加拿大量子计算公…

阅读更多...

【Nutx3】middleware目录介绍

【Nutx3】middleware目录介绍

简言记录下nuxt3middleware目录的使用方法。 middleware middleware是存放路由中间件的文件目录。路由中间件有三种： 匿名（或内联）路由中间件直接在页面中定义。已命名的路由中间件，放在 middleware/ 中，页面使用…

阅读更多...

leetcode代码记录（移除元素

leetcode代码记录（移除元素

目录 1. 题目：2. 我的代码：小结： 1. 题目： 给你一个数组 nums 和一个值 val，你需要原地移除所有数值等于 val 的元素，并返回移除后数组的新长度。不要使用额外的数组空间，你必须仅使用 O(1)…

阅读更多...

Docker入门二（应用部署、迁移与备份、DockerFile、docker私有仓库、Docker-Compose）

Docker入门二（应用部署、迁移与备份、DockerFile、docker私有仓库、Docker-Compose）

文章目录一、应用部署1.MySQL部署2.Redis部署3.Nginx部署二、迁移与备份1.容器做成镜像2.镜像备份和恢复(打包成压缩包） 三、DockerFile0.镜像从哪里来？1.什么是DockerFile2.DockerFile 构建特征3.DockerFile命令描述4.构建一个带vim的centos镜像案例5…

阅读更多...

网安渗透攻击作业（4）

网安渗透攻击作业（4）

Unload-labs-01 function checkFile() { var file document.getElementsByName(upload_file)[0].value; if (file null || file "") { alert("请选择要上传的文件!"); return false; } //定义允许上传的文件类型 v…

阅读更多...

面渣逆袭：Java基础面试题，46道Java基础八股文（4.8万字，30+手绘图）

面渣逆袭：Java基础面试题，46道Java基础八股文（4.8万字，30+手绘图）

1、什么是 Java？ Java是一种广泛使用的编程语言，由Sun Microsystems（现为Oracle Corporation的一部分）在1995年首次发布。它是一种面向对象的语言，这意味着它支持通过类和对象的概念来构造程序。 Java设计有一个核心理…

阅读更多...

软件工程-第5章结构化设计

软件工程-第5章结构化设计

5.1 总体设计的目标及其表示方法 5.2 总体设计变换设计基本步骤： 第1步：设计准备--复审并精华系统模型； 第2步：确定输入、变换、输出这三部分之间的边界； 第3步：第一级分解--系统模块结构图顶层和第一层…

阅读更多...

arcgis数据导出到excel

arcgis数据导出到excel

将arcgis属性数据导出到excel： 1） 工具箱\系统工具箱\Conversion Tools.tbx\Excel\Excel 转表 2）用excel打开导出的图层文件中后缀为.dbf的数据（方便快捷，但是中文易乱码）

阅读更多...

GPT-5：人工智能的下一个前沿即将到来

GPT-5：人工智能的下一个前沿即将到来

当我们站在人工智能新时代的门槛上时，GPT-5即将到来的呼声愈发高涨且迫切。作为革命性的GPT-3的继任者，GPT-5承诺将在人工智能领域迈出量子跃迁式的进步，其能力可能重新定义我们与技术的互动方式。通往GPT-5之路通往GPT-5的旅程已经标记着…

阅读更多...

鸿蒙Harmony应用开发—ArkTS声明式开发（容器组件：FolderStack）

鸿蒙Harmony应用开发—ArkTS声明式开发（容器组件：FolderStack）

FolderStack继承于Stack(层叠布局)控件，新增了折叠屏悬停能力，通过识别upperItems自动避让折叠屏折痕区后移到上半屏说明： 该组件从API Version 11开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本。子组件…

阅读更多...

探秘atoi与atof的模拟之路：从原理到实践的全能指南！

探秘atoi与atof的模拟之路：从原理到实践的全能指南！

目录编辑一.atoi及atof库函数的工作原理 1.1atoi 1.2atof 1.3使用时的注意事项注意事项 1. 检查输入字符串是否为 NULL 2. 检查字符串是否仅包含有效的数字字符 3. 检查转换结果是否在预期范围内 4. 使用更健壮的替代函数二. 模拟实现atoi和atof 2.1模拟 atoi…

阅读更多...

罗马不是一天建成的：DevOps 转型分步指南

罗马不是一天建成的：DevOps 转型分步指南

“罗马不是一天建成的”这句格言非常适合 DevOps。许多公司都渴望通过“闪电战”获得市场主导地位的即时满足感，但DevOps 的真正成功是一场马拉松，而不是短跑。它需要致力于建立可持续的 DevOps 文化——一种从头开始促进协作、自动化和安全性的文化。 …

阅读更多...

计算机设计大赛题目：基于深度学习的中文对话问答机器人

计算机设计大赛题目：基于深度学习的中文对话问答机器人

文章目录 0 简介1 项目架构2 项目的主要过程2.1 数据清洗、预处理2.2 分桶2.3 训练 3 项目的整体结构4 重要的API4.1 LSTM cells部分：4.2 损失函数：4.3 搭建seq2seq框架：4.4 测试部分：4.5 评价NLP测试效果：4.6 梯度截断…

阅读更多...

Linux编程4.8 网络编程-建立连接

Linux编程4.8 网络编程-建立连接

1、服务器端 #include <sys/types.h> #include <sys/socket.h>int listen(int sockfd, int backlog);返回：成功返回0，出错返回-1。参数：sockfd:套接字的文件描述符backlog:定义了sockfd的挂起连接队列可能增长的最大长度。…

阅读更多...

推荐文章

最新文章