数据库管理-第152期 Oracle Vector DB AI-04(20240220)

news2024/10/5 20:18:15

数据库管理152期 2024-02-20

  • 数据库管理-第152期 Oracle Vector DB & AI-04(20240220)
    • 1 常用的向量检索方法
      • 聚类
      • 图搜索
      • 哈希
      • 量化
    • 2 Oracle Vector DB中的索引
      • 索引(默认)
    • 索引(高级)
    • 3 EMBEDDINGS
      • SQL EMBEDDINGS 函数
      • OONX
    • 总结

数据库管理-第152期 Oracle Vector DB & AI-04(20240220)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Associate: Database(Oracle与MySQL)
网思科技 DBA总监
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家,ITPUB认证专家,OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭。

由于上一篇的一些“误操作”,导致公众号发文删了,当天重发没有办法触发群发效果,所以可能有些人会发现没看过03。

1 常用的向量检索方法

聚类

K-Means 和 Faiss
image.png

图搜索

Hierarchical Navigable Small Worlds (HNSW)
image.png

哈希

局部敏感哈希(Locality Sensitive Hashing)LSH

量化

Product Quantization (PQ):有损压缩

2 Oracle Vector DB中的索引

在Oracle Vector DB中,可以在Vector数据类型列上创建vector index来提升向量检索的性能:

索引(默认)

create vector index vector_idx on vector_table (data_vector)
organization [inmemory neighbor graph | neighbor partition]

距离计算:欧几里德
向量索引的选择取决于organization子句:

  1. In-Memory Neighbor Graph organization:HNSW
  2. Neighbor Partition organization:IVF

索引(高级)

可以指定向量索引类型参数、距离函数、精度等:

create vector index vector_idx on vector_table (data_vector) organization neighbor partition parameters (num_centroids 1024);

3 EMBEDDINGS

在Oracle Vector DB除直接通过外部导入向量外,也内建支持多种向量生产方式:

SQL EMBEDDINGS 函数

原生支持生成向量数据:

select id, image from cat_images order by VECTOR_DISTANCE(img_vec, EMBEDDING(resnet_50 USING :input_img)) fetch first 2 rows only;

image.png

OONX

Open Neural Network eXchange embedding 模型:

DECLARE
  model_source BLOB := NULL;
BEGIN
  model_source :=
  DBMS_CLOUD.get_object
  ( credential_name =>
  'OBJ_STORE_CRED',
  object_uri	=> 'https://objectstorage…bucketname/o/resnet50bundle.onnx’);

  DBMS_DATA_MINING.import_onnx_model
  ( model_name	=> "resnet50",
  model_data	=> model_source,
  metadata		=> JSON('{ function : "embedding" }')
);
END;

总结

本期简单讲解了一下,Oracle Vector索引以及内建向量EMBEDDING能力。
老规矩,知道写了些啥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1460706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

单片机stm32智能鱼缸

随着我国经济的快速发展而给人们带来了富足的生活,也有越来越多的人们开始养鱼,通过养各种鱼类来美化居住环境和缓解压力。但是在鱼类饲养过程中,常常由于鱼类对水质、水位及光照强度有着很高的要求,而人们也由于工作的方面而无法…

计算机组成原理(6)-----指令执行过程

目录 1.指令周期的概念 2.指令周期的数据流 (1)取指周期 (2)间址周期 (3)执行周期 (4)中断周期 3.指令执行方案 (1)单指令周期 (2&#…

力扣 309. 买卖股票的最佳时机含冷冻期

题目来源:https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-with-cooldown/description/ C题解:动态规划 状态1:表示持有股票。更新为之前持有股票(dp[i-1][0])或者不持有股票且不处于冷冻期后买入&…

怎么去除图片水印?推荐两个一键去水印方法

在数字时代,图片已成为我们日常交流、学习和工作中的重要媒介。然而,很多时候,我们在网上找到心仪的图片时,却发现它们被加上了水印,影响了观赏和使用。此时我们就需要在保证版权的前提下,去除图片中的水印…

LDRA Testbed软件静态分析_软件质量度量

系列文章目录 LDRA Testbed软件静态分析_操作指南 LDRA Testbed软件静态分析_自动提取静态分析数据生成文档 LDRA Testbed软件静态分析_Jenkins持续集成_(1)自动进行静态分析的环境搭建 LDRA Testbed软件静态分析_Jenkins持续集成_(2)配置邮件自动发送静态分析结果 LDRA Testb…

华为配置直连三层组网直接转发示例

华为配置直连三层组网直接转发示例 组网图形 图1 配置直连三层组网直接转发示例组网图 业务需求组网需求数据规划配置思路配置注意事项操作步骤配置文件扩展阅读 业务需求 企业用户接入WLAN网络,以满足移动办公的最基本需求。且在覆盖区域内移动发生漫游时&#xff…

【力扣hot100】刷题笔记Day7

前言 身边同学已经陆陆续续回来啦,舍友都开始投简历了,我也要加油啦!刷完hot100就投! 73. 矩阵置零 - 力扣(LeetCode) 标记数组:空间复杂度O(mn) class Solution:def setZeroes(self, matrix:…

LeetCode--代码详解 59. 螺旋矩阵 II

59. 螺旋矩阵 II 题目 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix 。 示例 1: 输入:n 3 输出:[[1,2,3],[8,9,4],[7,6,5]]示例 2: 输入&a…

【Effective Objective - C】—— 系统框架

【Effective Objective - C】—— 系统框架 47.熟悉系统框架CoreFoundation框架其他框架要点 48. 多用块枚举,少用for循环for循环使用Objective-C 1.0的NSEnumerator遍历快速遍历基于块的遍历方式要点 49.对自定义其内存管理语义的collection使用无缝桥接要点 50.构…

利用MATLAB/Simulink仿真模型加速嵌入式控制系统的开发——以多学科融合的电机控制为例

电机控制涵盖了广泛的应用领域,从家用电器到工业设备,从电动汽车到航空航天,其重要性不言而喻。从过去到现在,再到未来,电机控制技术的发展经历了显著的变革,并持续推动着相关行业的进步。 一、电机控制的…

pip镜像源:清华镜像、阿里云镜像、豆瓣镜像与如何修改默认镜像源

pip镜像源:清华镜像、阿里云镜像、豆瓣镜像与如何修改默认镜像源 🌈 个人主页:高斯小哥 🔥 高质量专栏:【Matplotlib之旅:零基础精通数据可视化】 🏆🏆关注博主,随时获取…

git clone 克隆代码报错

在拉取代码的时候报这个错误,也看了一下地址是正确的的,网络也正常。然后ping gitlab.com执行也没问题,如果有问题就是是环境问题。我以为是git名字和邮箱没有绑定的原因,结果绑定了还是这个问题,这个时候就只好百度啦…

OpenAI划时代大模型——文本生成视频模型Sora作品欣赏(六)

Sora介绍 Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。 Sora这一名称源于日文“空”(そら sora),即天空之意,以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模…

数据结构---字典树(Tire)

字典树是一种能够快速插入和查询字符串的多叉树结构,节点的编号各不相同,根节点编号为0 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。 核心思想也是通过空间来换取时间上的…

Elastic Stack--01--简介

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 Elastic Stack 简介为什么要学习ESDB-Engines搜索引擎类数据库排名常年霸榜![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/051342a83f574c8c910cda522…

YOLOv8改进 | 进阶实战篇 | 利用辅助超推理算法SAHI推理让小目标无所谓遁形(支持视频和图片)

欢迎大家订阅我的专栏一起学习YOLO! 一、本文介绍 本文给大家带来的是进阶实战篇,利用辅助超推理算法SAHI进行推理,同时官方提供的版本中支持视频,我将其进行改造后不仅支持视频同时支持图片的推理方式,SAHI主要的推理场景是针对于小目标检测(检测物体较大的不适用,…

WMS仓储管理系统解决方案如何释放智能仓库的潜力

随着科技的不断进步与创新,智能化仓储设备正逐渐成为企业转型升级的必备利器。越来越多的企业纷纷投入巨资,打造智能仓库,以应对激烈的市场竞争。与传统仓库相比,智能仓库凭借其高效、准确、自动化的特点,成为了企业提…

在springboot项目中调用openai API及我遇到的问题

这两天我在自己的网站中集成了openai API,引入chatgpt对话机器人,中途遇到了很多坑,记录一下。文章中会涉及一些付费工具,如果你有类似功能的工具,完全可以使用自己的。(主要是我想澄清一下,我不…

LPDDR6与LPDDR5 ZQ Calibration技术探讨

LPDDR6相比LPDDR5在ZQ校准这一块删除了command-based相关的描述,删除了ZQ校准模式切换的描述,仅支持background-based的校准。 回顾一下LPDDR5 基于background-based的校准: background ZQC是通过MR28 OP[5]来选择的,当选择为0&a…

一个基于C#开发的、开源的特殊字符输入法

emoji表情在社交网络非常流行,我们在手机也非常方便输入,但是在PC电脑我们一般需要到归集好的网页拷贝,所以今天推荐一个Windows小工具,让你方便输入特殊字符和emoji表情。 01 项目简介 这是一个基于C#开发的开源项目&#xff0…