数据库管理-第158期 Oracle Vector DB AI-09(20240304)

news2024/11/16 9:35:11

数据库管理158期 2024-03-04

  • 数据库管理-第158期 Oracle Vector DB & AI-09(20240304)
    • 1 创建示例表
    • 2 添加过滤条件的向量近似查询
      • 示例1
      • 示例2
      • 示例3
      • 示例4
      • 示例5
      • 示例6
      • 示例7
    • 总结

数据库管理-第158期 Oracle Vector DB & AI-09(20240304)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Associate: Database(Oracle与MySQL)
国内某科技公司 DBA总监
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家、年度墨力之星,ITPUB认证专家,OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭。

一个周末过去了,感觉也没休息好,现在困得很,人整体也不大舒服。
上一期,已经展示了使用vector_distance()函数,由小到大排序输出向量距离对应结果。与专用向量数据库只存储向量且只能针对向量记性运算不同,Oracle Vector DB还可以同传统关系型数据库一样,在向量相关的SQL中添加where子句,在相似性搜索上增加过滤选项。相似性搜索与关系过滤、表连接叠加使用是一个非常强大的功能,不仅丰富了向量数据的使用方式,也简化了向量数据的使用。

1 创建示例表

按照下图创建示例表VT2,这张表是通过上一期的VT1表来创建,但是为每个向量增加了形状、颜色、大小等其他属性:
image.png

CREATE TABLE vt2 AS SELECT * FROM vt1;

ALTER TABLE vt2 ADD (vsize varchar2(16),
                     shape varchar2(16),
                     color varchar2(16)
                    );

DESC vt2;

image.png
修改向量对应大小:

UPDATE vt2
SET    vsize = 'Small'
WHERE  id IN (1, 4, 6, 8, 9, 21, 23, 26, 33, 44, 45, 52);

UPDATE vt2
SET    vsize = 'Medium'
WHERE  id IN (5, 22, 25, 32, 34, 42, 43, 53, 54, 55);

UPDATE vt2
SET    vsize = 'Large'
WHERE  id IN (2, 3, 7, 24, 31, 41, 51);

COMMIT;

修改向量对应形状:

UPDATE vt2
SET    shape = 'Square'
WHERE  id IN (1, 3, 6, 42, 43, 54);

UPDATE vt2
SET    shape = 'Triangle'
WHERE  id IN (2, 4, 7, 22, 31, 41, 44, 55);

UPDATE vt2
SET    shape = 'Oval'
WHERE  id IN (5, 8, 9, 21, 23, 24, 25, 26, 32, 33, 34, 45, 51, 52, 53);

COMMIT;

修改向量对应颜色:

UPDATE vt2
SET    color = 'Red'
WHERE  id IN (5, 8, 24, 26, 33, 34, 42, 44, 45, 53, 54, 55);

UPDATE vt2
SET    color = 'Green'
WHERE  id IN (1, 4, 6, 21, 31, 52);

UPDATE vt2
SET    color = 'Blue'
WHERE id IN (2, 3, 7, 9, 22, 23, 25, 32, 41, 43, 51);

COMMIT;

检查表数据:

SELECT id, vsize, shape, color, v 
FROM   vt2
ORDER  BY id;

image.png
按大小、颜色、形状来查看向量:

SELECT vsize, count(vsize)
FROM   vt2
GROUP  BY vsize;

SELECT color, COUNT(color)
FROM   vt2
GROUP  BY color;

SELECT shape, COUNT(shape)
FROM   vt2
GROUP  BY shape;

image.png

2 添加过滤条件的向量近似查询

示例1

在上一期我们将查找与(16,3)最接近的三个向量。我们不关心实际距离,而是关心对象本身的ID。然而,在本次查询中,我们返回距离,以便将结果与下一个查询进行比较。
该查询的目的是从下图中检索以下Vectors。这里我们还限定了向量的ID范围(即指定向量簇):
image.png

SELECT id, vsize, shape, color, 
       to_number(vector_distance(vector('[16, 3]'), v)) distance
FROM   vt2
WHERE  id > 30 AND id < 40
ORDER  BY vector_distance(vector('[16, 3]'), v)
FETCH FIRST 3 ROWS ONLY;

image.png

示例2

还是上面那个向量点(16,3),依然从对应向量簇中查找最近的3个向量,但是我们这次添加过滤条件为圆形,如下图:
image.png

SELECT id, vsize, shape, color, 
       to_number(vector_distance(vector('[16, 3]'), v)) distance
FROM   vt2
WHERE  id > 30 AND id < 40
AND    shape = 'Oval'
ORDER  BY vector_distance(vector('[16, 3]'), v)
FETCH FIRST 3 ROWS ONLY;

image.png

示例3

这次查找与向量点(6,8)最近的10个向量,我们先不考虑距离,仅考虑ID,如下图:
image.png

SELECT id, vsize, shape, color
FROM   vt2
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 10 ROWS ONLY;

image.png

示例4

还是向量点(6,8),只不过我们过滤红色,如下图:
image.png

SELECT id, vsize, shape, color
FROM   vt2
WHERE  color = 'Red'
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 10 ROWS ONLY;

image.png

示例5

还是向量点(6,8),在红色基础上添加椭圆形过滤条件,如下图:
image.png
注意,这里仅有8个红色的椭圆形,虽然SQL中要求输出前10,但是只有8个结果。

SELECT id, vsize, shape, color
FROM   vt2
WHERE  color = 'Red'
AND    shape = 'Oval'
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 10 ROWS ONLY;

image.png

示例6

还是向量点(6,8),红色、椭圆形、小的过滤条件,如下图:
image.png
注意,这里仅有4个红色的小的椭圆形,虽然SQL中要求输出前10,但是只有4个结果。

SELECT id, vsize, shape, color
FROM   vt2
WHERE  color = 'Red'
AND    shape = 'Oval'
AND    vsize  = 'Small'
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 10 ROWS ONLY;

image.png

示例7

还是向量点(6,8),红色、椭圆形、小的过滤条件,现在再增加ID>10,如下图:
image.png
注意,这里ID大于10的仅有3个红色的小的椭圆形,虽然SQL中要求输出前10,但是只有3个结果。

SELECT id, vsize, shape, color
FROM   vt2
WHERE  color = 'Red'
AND    shape = 'Oval'
AND    vsize  = 'Small'
AND    id    > 10
ORDER  BY vector_distance(vector('[6, 8]'), v)
FETCH FIRST 10 ROWS ONLY;

image.png

总结

本期简单演示了一下vector+where的SQL查询操作,除了常规where,还可以多表联查,例如按范式将大小、形状、颜色存放在其他表中,这些以后再做演示。
老规矩,知道写了些啥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1490843.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么采集GBK或GB2312等特殊字符编码的网站数据

如果要采集的网站是GBK或GB2312等特殊字符编码&#xff0c;采集结果可能是一堆看不懂的文字或乱码&#xff0c;无法使用。 通常网页文章采集工具有字符编码选项&#xff0c;默认是UTF-8&#xff08;现在大部分网站都是&#xff09;&#xff0c;改选为GBK或GB2312字符编码即可&…

无人机/飞控--ArduPilot、PX4学习历程记录(1)

本篇博客用来记录个人学习记录&#xff0c;存放各种文章链接、视频链接、学习历程、实验过程和结果等等.... 最近在整无人机项目&#xff0c;接触一下从来没有接触过的飞控...(听着就头晕)&#xff0c;本人纯小白。 目录 PX4、Pixhawk、APM、ArduPilot、Dronecode Dronekit…

【ArcPy】游标访问几何数据

访问质心坐标相关数据 结果展示 代码 import arcpy shppath r"C:\Users\admin\Desktop\excelfile\a2.shp" with arcpy.da.SearchCursor(shppath, ["SHAPE","SHAPEXY","SHAPETRUECENTROID","SHAPEX","SHAPEY",&q…

【Mybatis】批量映射优化 分页插件PageHelper 逆向工程插件MybatisX

文章目录 一、Mapper批量映射优化二、插件和分页插件PageHelper2.1 插件机制和PageHelper插件介绍2.2 PageHelper插件使用 三、逆向工程和MybatisX插件3.1 ORM思维介绍3.2 逆向工程3.3 逆向工程插件MyBatisX使用 总结 一、Mapper批量映射优化 需求: Mapper 配置文件很多时&…

高精准无人机激光雷达标定板

无人机激光雷达标定板是一种用于校准无人机激光雷达系统的工具&#xff0c;它可以帮助无人机获取更准确、更可靠的数据&#xff0c;从而提高无人机的导航精度和自主控制能力。本文将从无人机激光雷达标定板的基本概念、作用、应用领域、市场现状和发展趋势等方面进行介绍。 一…

LeetCode 1976.到达目的地的方案数:单源最短路的Dijkstra算法

【LetMeFly】1976.到达目的地的方案数&#xff1a;单源最短路的Dijkstra算法 力扣题目链接&#xff1a;https://leetcode.cn/problems/number-of-ways-to-arrive-at-destination/ 你在一个城市里&#xff0c;城市由 n 个路口组成&#xff0c;路口编号为 0 到 n - 1 &#xff…

【音视频开发好书推荐1】《RTC程序设计:实时音视频权威指南》

1、WebRTC概述 WebRTC&#xff08;Web Real-Time Communication&#xff09;是一个由Google发起的实时音视频通讯C开源库&#xff0c;其提供了音视频采集、编码、网络传输&#xff0c;解码显示等一整套音视频解决方案&#xff0c;我们可以通过该开源库快速地构建出一个音视频通…

12-Linux部署Zookeeper集群

Linux部署Zookeeper集群 简介 ZooKeeper是一个分布式的&#xff0c;开放源码的分布式应用程序协调服务&#xff0c;是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件&#xff0c;提供的功能包括&#xff1a;配置维护、域名服务、分布式同步、组服务等。…

设计模式:六大原则 ③

一、六大设计原则 &#x1f360; 开闭原则 (Open Close Principle) &#x1f48c; 对扩展开放&#xff0c;对修改关闭。在程序需要进行拓展的时候&#xff0c;不能去修改原有的代码&#xff0c;实现一个热插拔的效果。简言之&#xff0c;是为了使程序的扩展性好&#xff0c;易…

4步教你完成一篇让人挑不出毛病的产品需求文档!

“需求”这个词是产品经理工作中的常客&#xff0c;产品需求文档也贯穿于整个产品经理的日常工作中&#xff0c;本周小编将通过什么是产品需求文档&#xff0c;产品需求文档的作用、如何写好产品需求文档等方面分享如何写出一篇让你挑不出毛病的PRD&#xff0c;让需求文档助力产…

光分路器概述

光分路器主要有两种 技术&#xff1a; ㈠平面波导型光分路器(PLC Splitter) PLC分路器的封装是指将平面波导分路器上的各个导光通路&#xff08;即波导通路&#xff09;与光纤阵列中的光纤一一对准&#xff0c;然后用特定的胶&#xff08;如环氧胶&#xff09;将其粘合在一起…

计算机系统中的文件系统梳理

看之前&#xff0c;大家动动小手点个关注&#xff0c;谢谢。 原文地址&#xff1a;计算机系统中的文件系统梳理 - Pleasure的博客 下面是正文内容&#xff1a; 前言 这是一篇笔记 我之所以要选择这个话题&#xff0c;是因为前几天在对TF卡进行格式化的时候遇到了问题。有些专…

每日一练 | 华为认证真题练习Day192

1、下面是路由器RTB的部分输出信息&#xff0c;关于输出信息描迷错误的是: A. 接口上动态加入的组播组个数是1。 B. 加入的组播组地址是225.1.1.2 C. DISPLAY IGMP GROUP命令用来查看IGMP组播组信息&#xff0c;包括通过成员报告动态加入的组播组和通过命令行静态加入的组播组…

抖音视频下载软件|视频批量采集工具

便捷操作&#xff0c;高效采集 在快节奏的数字化时代&#xff0c;我们的视频下载软件提供了简单便捷的操作流程&#xff0c;让用户能够高效地采集所需视频内容。用户只需输入关键词并点击开始抓取&#xff0c;系统会自动搜索指定关键词下的抖音视频数据&#xff0c;并将待解析视…

2024年软考考试安排和报名时间出来了!有重大变化!

软考办2024年软考考试安排终于发布了!变化很大!信息系统项目管理师上半年考、系统集成项目管理工程师下半年考。很多科目一年只考一次了! 温馨提示&#xff1a; 1、目前这个文件&#xff0c;软考办官网还未发布&#xff0c;但是陕西软考办官方已经发布了2024年考试安排&…

kafka查看消息两种方式(命令行和软件)+另附发送消息方式

1、命令行方式 ①找到kafka安装文件夹 ②执行命令 #指定offset为指定时间作为消息起始位置 kafka-consumer-groups.sh \ --bootstrap-server 20.2.246.116:9092 \ --group group_1 \ --topic lanxin_qiao \ --reset-offsets \ --to-datetime 2023-07-19T01:00:00.000 \ -exe…

有没有想过找个编程的贴身帮手?一步一步引入编程路上的副驾驶--copilot

辅助编程&#xff0c;或者说智能编程&#xff0c;这个概念不是这两年才提出&#xff0c;但比较成型的产品就在这几年&#xff0c;这里有一款智能编程的软件叫做copilot&#xff0c;从软件的名字我们知道&#xff0c;他貌似定位还蛮准确的&#xff0c;意思是你编程路上的副驾驶&…

第十三届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组 统计子矩阵

#include<iostream> #include<algorithm> #include<cstring> #include<string> #include<vector> #include<queue>using namespace std;int cnt,temp; int n,m,K; int a[505][505]; int pre[505][505];//二维前缀和void sol() {cin>>…

《RabbitMQ实战指南》读书笔记

第一章 RabbitMQ简介 1.1 什么是消息中间件 消息&#xff08;message&#xff09;是指在应用间传递的数据。 消息队列中间件&#xff08;Message Queue Middleware&#xff0c;简称MQ&#xff09;&#xff0c;是指提供平台无关的、高效可靠的消息传递机制的中间件。 MQ通常又…

生成哈夫曼树 - 华为OD统一考试(C卷)

OD统一考试&#xff08;C卷&#xff09; 分值&#xff1a; 100分 题解&#xff1a; Java / Python / C 题目描述 给定长度为 n 的无序的数字数组&#xff0c;每个数字代表二叉树的叶子节点的权值&#xff0c;数字数组的值均大于等于 1 。 请完成一个函数&#xff0c;根据输入…