PostgreSQL 与对象存储的结合: 在 MinIO 中访问外部数据

news2024/11/15 19:54:27

数据领域最激动人心的发展之一是湖仓一体功能在所有主要数据库供应商中的兴起。Snowflake 和 SQL Server 长期以来一直采用这一点,现在 PostgreSQL 正在通过 pg_lakehouse 拥抱这种范式转变,使得利用现代数据湖进行分析、AI 等比以往任何时候都更容易。随着越来越多的传统数据库继续允许您查询对象存储中的数据,AWS 选择弃用 Amazon S3 Select,这也许并非巧合。该领域有更多的进入者可以成功地为客户提供此功能以及更多功能。

虽然绿地化提供了为特定用例定制技术堆栈的快感,但完整的淘汰和替换策略很少可行,也不明智。相反,前进的道路在于利用现有的数据库技术进行计算,同时投资于世界一流的对象存储。在这个现代时代,数据和存储才是真正的价值,因为查询引擎虽然很重要,但已经变得商品化和可互换。pg_lakehouse使目前使用PostgreSQL的许多企业能够采用这种策略,使他们能够在不牺牲现有投资的情况下使用现代数据湖为未来进行构建。pg_lakehouse 是由 ParadeDB 开发的开源扩展。此扩展利用了 PostgreSQL 现有的外部数据包装器功能,并通过与 Apache DataFusion 的集成进行了增强,以提供对各种数据源的高性能分析。

从 SQL 到对象存储:新前沿

PostgreSQL长期以来一直支持外部表和扩展,使其能够与外部数据源进行交互。新的 pg_lakehouse 扩展延续了这一传统,使 PostgreSQL 能够查询存储在 MinIO 等对象存储系统中的数据。这不仅仅是一个附加组件,而是 PostgreSQL 现有功能的扩展,允许用户将外部对象存储视为其数据库中的本机表。与 MinIO Enterprise Object Store 配对,用户可以存储大量数据,同时将其与现有的 SQL 工作流集成。数据工程师们欢欣鼓舞,因为PostgreSQL已经成为对象存储的查询引擎。

为什么这很重要

在现代数据环境中,有效存储和分析数据的能力至关重要。就其本身而言,传统数据库在可扩展性和灵活性方面存在局限性,尤其是在处理大型数据集或多样化的数据格式时。现代数据湖架构结合了数据湖和数据仓库的优点,可以解决这些挑战。通过分解计算和存储,此体系结构使企业能够独立扩展资源,从而优化性能和成本。此外,现代数据湖支持各种 AI/ML 工作负载,确保数据始终可访问、具有弹性且安全,即使在地理位置分散的大型部署中也是如此。

PostgreSQL 和 MinIO 企业对象存储

将 PostgreSQL 与 MinIO 的企业对象存储 (EOS) 集成为构建现代数据湖奠定了坚实的基础,提供的功能可确保您的数据具有可扩展性、安全性和高性能。

1 . 使用 MinIO 跨数据源查询:使用 pg_lakehouse 扩展直接查询存储在 MinIO 中的数据。目前,与 S3 兼容的对象存储(如 MinIO)支持 CSV 格式。PostgreSQL 可以将这些文件视为本机表,使您能够执行复杂的分析,而无需移动数据。ParadeDB 表示,对 Iceberg 的支持将很快可用,进一步扩展数据湖的多功能性。对 Iceberg 的支持将很快推出,进一步扩展数据湖的多功能性。

2 . 企业级可扩展性:MinIO 的架构专为大规模而设计,可以毫不费力地管理 EB 级数据。MinIO 使用基于服务器池的分布式架构,允许水平扩展,这意味着您可以添加更多池以增加容量和性能,而不会造成中断。这种设计非常适合处理现代企业的大规模数据需求,确保您的基础设施能够随着数据需求的增长而增长。

3 . 高级安全性:安全性在现代数据架构中至关重要。MinIO EOS 提供强大的安全功能,包括用于服务器端加密的 MinIO Enterprise KMS(密钥管理系统)。EOS KMS确保您的数据在静态和传输过程中都得到加密,从而保持最高级别的数据保护。

4 . 高性能:MinIO Enterprise Cache 功能通过将频繁访问的数据存储在更靠近应用程序的位置,显着提高了数据访问速度。这对 PostgreSQL 查询特别有利,因为在 PostgreSQL 查询中,减少延迟可以加快查询执行速度,尤其是对于存储在数据湖中的大型数据集。世界上只有一种最快的对象存储,并且使用 NVMe SSD 的 GET 操作超过 325 GiB/s,PUT 操作超过 165 GiB/s,因此只有一种真正的对象存储选择来支持 PostgreSQL 作为查询引擎。

5 . 使用 MinIO 控制台简化管理:MinIO Enterprise Console 提供了一个基于 Web 的直观界面,用于在一个地方管理所有对象存储,包括监控、用户管理和策略执行。在构建现代数据湖时,这种易管理性至关重要,因为它允许管理员从单一界面有效地监督存储层。

通过利用 MinIO 企业对象存储的这些功能,结合 PostgreSQL 的强大功能,您很快将能够构建一个现代、安全且高度可扩展的现代数据湖,以满足当今数据密集型环境的需求。此设置不仅可以增强您的分析能力,还可以为面向未来的数据策略奠定坚实的基础,确保您的基础架构能够适应不断变化的数据管理环境。

开始使用 pg_lakehouse

安装过程很简单,官方 ParadeDB 文档中提供了详细的设置说明。作为 AGPL-3.0 许可的开源项目,pg_lakehouse 鼓励社区贡献并确保扩展保持免费和可访问性,使其成为希望使用 PostgreSQL 和 MinIO 实现数据基础设施现代化的组织的重要工具。

继续构建

通过 pg_lakehouse 将湖仓一体功能集成到 PostgreSQL 中,结合 MinIO 强大的对象存储,为现代数据需求提供了强大的解决方案。此举不仅仅是增加功能,而是反映了行业中更广泛的趋势,即数据湖和数据仓库融合在一起,提供两全其美的服务。随着越来越多的数据库采用类似的功能,数据分析的未来看起来比以往任何时候都更加光明和集成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2068290.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java 搜索二维矩阵 I II,多数元素 I II,分治法 二分法 摩尔投票法】

搜索二维矩阵 I II,多数元素,分治法 & 二分法 & 摩尔投票法 题目1:力扣-搜索二维矩阵[https://leetcode.cn/problems/search-a-2d-matrix/description/](https://leetcode.cn/problems/search-a-2d-matrix/description/)分治-排除法分…

了解精密零部件加工制造的关键技术

在现代工业领域中,精密零部件的加工制造起着至关重要的作用。从高端电子设备到航空航天领域,都离不开高精度的零部件。时利和详细解析了解精密零部件加工制造的关键技术,对于推动工业发展的重要性。 高精度的加工设备是实现精密零部件制造的基…

嬴图 | 从数据到智能,解密物流业的“智慧大脑”——图数据库的颠覆性力量

前言 早在3000年前,古埃及、希腊、罗马就开始利用航运系统开启了物资运输和分配,并形成了奥斯提亚、亚历山大港等古代超级物流中心;而在古中国和古印加,完善的驿站系统又将物资、人员、供给等方面进行了升级支持,从制…

MATLAB进阶:矩阵代数

今天我们学习矩阵在MATLAB中的运算。 运算符 与数组运算相同: A. ’转罝 A’(共轭)转罝 共轭转置(A’或A†): 对于一个复数矩阵A,其共轭转置记作A’或A†。共轭转置不仅将矩阵A的行和列互…

用于超声电影中同时检测关键帧和地标的贝叶斯网络| 文献速递-大模型与多模态诊断阿尔茨海默症与帕金森疾病应用

Title 题目 A Bayesian network for simultaneous keyframe and landmark detection inultrasonic cine 用于超声电影中同时检测关键帧和地标的贝叶斯网络 01 文献速递介绍 超声电影(Ultrasonic cine)是超声检查中常见的保存形式,允许实…

ComsolMatlab 可扩展设计的高效低频阻抗调制声学超材料

参考文献:Zeng K, Li Z, Guo Z, et al. Acoustic metamaterial for highly efficient low-frequency impedance modulation by extensible design[J]. Extreme Mechanics Letters, 2022, 56: 101855. 我们提出了一种创新的低频宽带高效吸声材料,其设计原…

基于Kotlin Multiplatform实现静态文件服务器(五)

Netty简介 Netty 是一个利用 Java 的高级网络的能力,隐藏其背后的复杂性而提供一个易于使用的 API 的客户端/服务器框架。 文件服务 文件服务基于Netty框架实现,关于Netty,可以了解:https://netty.io/。 class BootStrapServe…

“购物也能赚钱?‘随机返利‘模式颠覆你的消费体验!“

近期,关于“消费即享随机返利”的话题在张三与李四之间频繁提及,这一新颖的消费机制究竟是何方神圣? 实质上,它并非某种实体物品,而是一种创新的营销策略,旨在促进商品销售。去年,一位精明的商家…

【25届秋招】饿了么0817算法岗笔试

目录 1. 第一题2. 第二题3. 第三题 ⏰ 时间:2024/08/17 🔄 输入输出:ACM格式 ⏳ 时长:100min 本试卷还有单选和多选部分,但这部分比较简单就不再展示。 最近终于有时间继续整理之前的笔试题了,因为时间仓促…

Gartner发布2024年终端和工作空间安全成熟度曲线:24项相关技术发展和应用状况及趋势

由于攻击者使用人工智能来增强网络钓鱼和终端攻击,企业需要高级安全措施来阻止入侵行为。此技术成熟度曲线可帮助安全和风险管理领导者识别可增强终端和工作空间保护的技术。 需要知道什么 网络安全创新层出不穷,但区分真正的进步与短暂的趋势却很困难。…

如何在Python中使用IP代理

在网络爬虫、数据抓取等应用场景中,使用IP代理可以有效避免IP被封禁,提高爬取效率。本文将详细介绍如何在Python中使用IP代理,帮助你在实际项目中灵活应用。 准备工作 在开始之前,你需要准备以下工具和资源: Python环…

Go Convey测试框架入门(go convey gomonkey)

Go Convey测试框架入门 介绍 GoConvey是一款针对Golang的测试框架,可以管理和运行测试用例,同时提供了丰富的断言函数,并支持很多 Web 界面特性。 Golang虽然自带了单元测试功能,并且在GoConvey框架诞生之前也出现了许多第三方测…

JAVA后端程序拉取私人仓库的npm包并将该程序打包成jar包

当前有一个系统用于导出项目,而每次导出的项目并不可以直接使用,需要手动从npm私人仓库中获取一个npm包然后将他们整合到一起它才是一个完整的项目,所以目前我的任务就是编写一个java程序可以自动地从npm私人仓库中拉取下来那个模板代码到指定…

虚拟机网络的三种模式,NAT模式,桥接模式,仅主机模式

一、首先说最简单的也就是桥接模式 使用桥接模式会在虚拟机生成一个虚拟交换机,连接到主机的网卡,所以他们是能互相ping通的。 二、NAT模式,我感觉是最复杂的一个模式 使用nat模式,主机会多出一个网卡,这个网卡vmnet…

微信小程序获取当前位置并自定义浮窗

1、在腾讯地图api申请key(添加微信小程序的appid)。 每个Key每日可以免费使用100次,超过次数后会导致地图不显示。可以多申请几个Key解决。WebService API | 腾讯位置服务腾讯地图开放平台为各类应用厂商和开发者提供基于腾讯地图的地理位置…

推荐一个国内Midjourney镜像站,限时充值享5折优惠 结尾附实测图片

作为一名绘画爱好者,你是否曾梦想过将脑海中的画面转化为现实?现在,有了群嘉智创平台(ai.qunzjia.cn),这一切都将成为可能。群嘉智创是国内领先的AI对话与Midjourney绘画服务平台,通过接入国内多…

如何使用ssm实现校园美食交流系统+vue

TOC ssm026校园美食交流系统vue 第1章 概述 1.1 研究背景 随着现代网络技术发展,对于校园美食交流系统现在正处于网络发展的阶段,所以对它的要求也是比较严格的,要从这个系统的功能和用户实际需求来进行对系统制定开发的发展方式&#xf…

【MySQL】 黑马 MySQL进阶 笔记

文章目录 存储引擎MySQL的体系结构存储引擎概念存储引擎特点InnoDBMyISAMMemory 存储引擎选择 索引概述结构B Tree(多路平衡查找树)B TreeHash为什么InnoDB存储引擎选择使用Btree索引结构? 分类思考题 语法SQL性能分析(索引相关)SQL执行频率慢查询日志p…

VMware Workstation Pro 下载

文章目录 VMware Workstation ProVMware下载与安装 VMware Workstation Pro VMware Workstation Pro 对个人用户已经完全免费! VMware下载与安装 第一步:进入vmware的官网 VMWare已被收购,因此它会跳到, Broadcom 注册页面&…

[Meachines] [Easy] granny IIS 6.0+CVE-2017-7269+进程迁移+MS15-051权限提升

信息收集 IP AddressOpening Ports10.10.10.15TCP:80 $ nmap -p- 10.10.10.15 --min-rate 1000 -sC -sV -Pn PORT STATE SERVICE VERSION 80/tcp open http Microsoft IIS httpd 6.0 |_http-server-header: Microsoft-IIS/6.0 | http-methods: |_ Potentially risky…