数据库管理-第157期 Oracle Vector DB AI-08（20240301）

news2025/2/22 4:40:32

数据库管理157期 2024-03-01

数据库管理-第157期 Oracle Vector DB & AI-08（20240301）
- 1 创建示例向量
- 2 查找最近向量
- 3 基于向量簇组的最近向量查询
- 总结

数据库管理-第157期 Oracle Vector DB & AI-08（20240301）

作者：胖头鱼的鱼缸（尹海文）
Oracle ACE Associate: Database（Oracle与MySQL）
国内某科技公司 DBA总监
10年数据库行业经验，现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家、年度墨力之星，ITPUB认证专家，OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号，非著名社恐（社交恐怖分子）
公众号：胖头鱼的鱼缸；CSDN：胖头鱼的鱼缸（尹海文）；墨天轮：胖头鱼的鱼缸；ITPUB：yhw1809。
除授权转载并标明出处外，均为“非法”抄袭。

进入新的一个月，昨天可能是很多国产数据库开始较大规模使用遇到的第一个闰二月，听说有些国产数据库直接跳过了2月29日来到了3月1日，挺好玩的。
本期内容，模拟在一个二维平面上进行近似查询。

1 创建示例向量

按照下图内容，以X和Y轴创建对应的向量信息：

CREATE TABLE IF NOT EXISTS vt1
         (id   NUMBER NOT NULL,
          v    VECTOR(2, FLOAT32),
               PRIMARY KEY (id)
         );

DESC vt1;

INSERT INTO vt1 VALUES (1, '[3, 3]'),  (2, '[5, 3]'),  (3, '[7, 3]'),
                       (4, '[3, 5]'),  (5, '[5, 5]'),  (6, '[7, 5]'),
                       (7, '[3, 7]'),  (8, '[5, 7]'),  (9, '[7, 7]');

COMMIT;

SELECT * FROM vt1 ORDER BY id;

2 查找最近向量

1.以下图方式，查找q点(0,5)最近的3个向量点：

从图中实际情况来看最近的为2,1,3或者2,3,1。

SELECT id
FROM   vt1
ORDER  BY  vector_distance(vector('[5, 0]'), v)
FETCH FIRST 3 ROWS ONLY;

2.以下图方式，查找q点(3,0)最近的3个向量点：

从图中实际情况来看最近的为1,2,3。

SELECT id
FROM   vt1
ORDER  BY  vector_distance(vector('[3, 0]'), v)
FETCH FIRST 3 ROWS ONLY;

3.以下图方式，查找q点(3,9)最近的3个向量点：

从图中实际情况来看最近的为7,8,4。

SELECT id
FROM   vt1
ORDER  BY  vector_distance(vector('[3, 9]'), v)
FETCH FIRST 3 ROWS ONLY;

4.以下图方式，查找q点(3.1,6.9)最近的4个向量点：

从图中实际情况来看最近的为7,4,8,5或者7,8,4,5。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[3.1, 6.9]'), v)
FETCH FIRST 4 ROWS ONLY;

3 基于向量簇组的最近向量查询

目前，vector_distance的结果依赖于两个内容：

对于向量簇来说，查询向量所在的位置，以特定向量或坐标为中心,比如(5,5)
结果集有多少行

然而，向量数据通常由一组向量簇组成，并且数据往往不是均匀分布的。也可能存在零个或多个数据簇。因此，向量簇往往表示相似数据的组。例如：地址、汽车类型、人名、报告或书籍等。
1.下面的示例有5个向量簇。因此我们会在vt1表中添加其他4组向量簇。这里你会发现一个向量簇中有负值（或坐标）。

INSERT INTO vt1 VALUES (21, '[9, -1]'),
                       (22, '[10, -1]'),
                       (23, '[11, -1]'),
                       (24, '[9, -3]'),
                       (25, '[10, -4]'),
                       (26, '[12, -3]') ;
INSERT INTO vt1 VALUES (31, '[13, 6]'),
                       (32, '[14, 7]'),
                       (33, '[14, 4]'),
                       (34, '[16, 6]') ;
INSERT INTO vt1 VALUES (41, '[0, 7]'),
                       (42, '[1, 7]'),
                       (43, '[1, 6]'),
                       (44, '[0, 5]'),
                       (45, '[1, 5]') ;
INSERT INTO vt1 VALUES (51, '[5, 9]'),
                       (52, '[7, 9]'),
                       (53, '[6, 10]'),
                       (54, '[5, 11]'),
                       (55, '[7, 11]') ;

COMMIT ;

SELECT * FROM vt1;

2.以下图方式，查找q点(16,4)最近的3个向量点：

从图中实际情况来看，我们希望结果是3x。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[16, 4]'), v)
FETCH FIRST 3 ROWS ONLY;

3.以下图方式，查找q点(7,-5)最近的5个向量点：

从图中实际情况来看，我们希望结果是2x。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[7, -5]'), v)
FETCH FIRST 5 ROWS ONLY;

4.以下图方式，查找q点(6,10)最近的5个向量点：

从图中实际情况来看，我们希望结果是5x。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[6, 10]'), v)
FETCH FIRST 5 ROWS ONLY;

5.以下图方式，查找q点(6,8)最近的4个向量点：

从图中实际情况来看，我们希望结果是8,9,51,52。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 4 ROWS ONLY;

6.以下图方式，查找q点(2.5,8.5)最近的4个向量点：

从图中实际情况来看，我们希望结果是x,4x,5x。

SELECT id
FROM   vt1
ORDER  BY vector_distance(vector('[2.5, 8.5]'), v)
FETCH FIRST 4 ROWS ONLY;

总结

本期通过多个实际案例演示了Oracle Vector DB中如何实现近似查询。
老规矩，知道写了些啥。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1482442.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

数据库管理-第157期 Oracle Vector DB AI-08（20240301）

数据库管理157期 2024-03-01

数据库管理-第157期 Oracle Vector DB & AI-08（20240301）

1 创建示例向量

2 查找最近向量

3 基于向量簇组的最近向量查询

总结

相关文章

多层感知器（神经网络）与激活函数

C 嵌入式系统设计模式 15：基本并发概念

GEE数据集——GLC_FCS30D - 全球 30 米土地覆被变化数据集（1985-2022 年）

青少年CTF2024 #Round1 wp web

【MySQL】复合查询（重点）-- 详解

【AIGC】微笑的秘密花园：红玫瑰与少女的美好相遇

100M服务器能同时容纳多少人访问

精品SSM的选修课管理系统选课签到打卡

leetcode--接雨水（双指针法，动态规划，单调栈）

Laravel Octane 和 Swoole 协程的使用分析二

持安科技孙维伯：零信任在攻防演练下的最佳实践｜DISCConf 2023

Leetcode 第 386 场周赛题解

网站添加pwa操作和配置manifest.json后，没有效果排查问题

决定西弗吉尼亚州地区版图的关键历史事件

小程序事件处理

学习：GPT-4技术报告2023.3

SpringBoot之Actuator的两种监控模式

XSS初级漏洞靶场

网络防御第6次作业

会声会影使用教程:5分钟学会会声会影