停止向供应商提供您的数据

news2025/1/12 13:31:25

组织管理其数据基础设施的方式正在发生重大转变。越来越多的公司认识到存储和计算分离的优势,从而获得更好的性能、成本节约和可扩展性。这一趋势是由 AI 和 ML 工作负载日益复杂所推动的,这些工作负载需要灵活、高性能的系统。Databricks 首席执行官 Ali Ghodsi 是这一转变的杰出倡导者。在最近的一次演讲中,他强调了组织控制自己的数据的重要性。他鼓励公司停止依赖 Snowflake 和 Databricks 等供应商来管理他们的数据,而是使用基于对象存储构建的数据湖。好处?更多控制、更低的成本以及扩展数据基础设施以满足不断增长的需求的能力。Ghodsi 的信息是供应商构建、销售和倡导更具成本效益和灵活性的数据架构的更广泛运动的一部分。事实证明,存储和计算紧密集成的传统系统不足以处理 AI 和 ML 的海量数据量和处理需求。像 Databricks 这样的供应商比以往任何时候都更加投入计算,并将存储留给一流的对象存储软件。这种策略的峰值实现是在现代数据湖中,通常称为湖仓一体。现代数据湖将数据湖的灵活性与数据仓库的性能相结合。在 Databricks 等供应商的支持下,存储和计算的这种解耦标志着数据架构的关键转变,使组织能够构建高度灵活且可扩展的数据基础架构,以满足 AI 和 ML 工作负载的需求,同时最大限度地提高控制力并最大限度地降低成本。

Decoupling: 为什么它会改变游戏规则

在整个行业中,许多人都认识到,过去的单体系统已经不再适用。由 MinIO 等对象存储提供支持的现代数据湖正在成为面向未来的基础设施的标准。这种转变不仅仅是为了节省资金,尽管它确实如此,它还是为了让组织能够处理未来的数据需求,同时与当今的 AI/ML 系统、模型和工具合作。在数据呈指数级增长且 AI/ML 工作负载越来越普遍的世界中,对灵活、经济高效的基础设施的需求至关重要。传统的数据平台(如 Hadoop)通常集成了存储和计算,这在理论上听起来很高效,但在实践中会导致效率低下。使用这些传统架构,您最终需要为闲置的计算资源或未充分利用的存储付费。借助解耦架构,您可以独立扩展存储和计算。对于 AI 和机器学习来说,这是一个巨大的优势:可以有效地存储海量数据集,并且可以动态分配计算资源用于模型训练、数据处理或分析。

使用 Object Storage Anywhere 构建现代数据湖

如果您希望构建能够处理 AI 和 ML 需求的现代数据湖,那么高性能对象存储是必不可少的。例如,MinIO 提供针对大规模数据优化的企业级对象存储。通过使用像 MinIO 这样的系统,组织可以确保其现代数据湖具有高度可扩展性、可靠性和高性能,这三点在处理大型 AI/ML 数据集时至关重要。MinIO 可以部署在本地、私有云、公共云、colos、边缘或工作负载需要的任何地方。全部使用易于获取的商用硬件。这就是现代数据湖的魔力真正发挥作用的地方:您可以将对象存储用于数据湖,同时在任何需要的地方享受数据仓库的性能优势,而不会被数据饥渴的供应商提供的昂贵专有解决方案所束缚,这些供应商希望创建人工围墙花园来困住您。实际上,这意味着您的数据科学家和机器学习工程师可以直接从对象存储查询和访问大量数据以训练模型,无论数据需要在哪里。这就是真正控制自己的数据的意义所在。

保障未来

随着组织重新考虑其数据架构,确保大量数据的安全性比以往任何时候都更加重要。MinIO 的企业对象存储密钥管理服务器 (KMS) 为管理数十亿个加密密钥提供了可扩展、高度可用的解决方案,这对于在对象级别加密数据至关重要。KMS 与硬件安全模块 (HSM) 和基于云的 HSM 无缝集成,为加密操作提供了强大的信任基础,无论是在云中、本地还是边缘。MinIO 还支持多租户,允许组织通过加密区域隔离不同的团队或部门,确保敏感数据受到保护并保持对 GDPR 和 HIPAA 等法规要求的合规性。结合身份和访问管理 (IAM)、服务器端加密和审计日志记录,MinIO 确保您的数据在现代数据湖架构的每一层都得到保护

构建未来

为了在 AI 和 ML 时代保持竞争力,组织必须重新考虑其数据战略。Lakehouse 模型正迅速成为现代、可扩展数据环境的黄金标准。通过采用灵活的高性能存储解决方案,而不是随意将数据移交给供应商,企业可以确保他们有能力处理当今的数据需求和未来的挑战。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2131149.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自定义Spring-start学习笔记

Spring Boot Start的创建和使用 start的工作原理(网图) 1. 设置Maven项目: 创建一个新的Maven或Gradle项目,并在项目的pom.xml文件中添加必要的Spring Boot依赖项和插件。下面以maven项目为例: 创建Spring Boot项目 ,并在项目的…

私域流量的价值探索:开源链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序的助力

摘要:本文从渠道视角深入剖析私域流量的特殊价值,探讨其作为一种新的销售渠道所具有的重要意义。同时引入开源链动 21 模式、AI 智能名片和 S2B2C 商城小程序等创新元素,阐述它们如何为私域流量的发展提供新的动力和机遇,进一步提…

UE5安卓项目打包安装

Android studio安装 参考:https://docs.unrealengine.com/5.2/zh-CN/how-to-set-up-android-sdk-and-ndk-for-your-unreal-engine-development-environment/ 打开android studio的官网:Download Android Studio & App Tools - Android Developers …

浅谈电动汽车火灾特点及扑救对策研究

0引言 电动汽车火灾事件增多,其特点包括电池高能量密度、快速热释放和烟雾毒性。本文提出应对策略:加强火灾预防,完善电池管理系统,提高电池安全性能;使用干粉灭火器、气溶胶灭火系统等灭火剂;对严重火灾采…

力扣13.罗马数字转整数

4.定义一个哈希存字符和对应的数字 16.定义ans存最终数字 17.定义n存字符串长度 18.开始循环 19.设置value存第一个字符的值 20.如果第一个字符的值小于下一个字符的值,比如IV那么值就是V-I 反之则正常+ 最后返回

【实证分析】中国工业经济-数实产业技术融合与企业全要素生产率(2008-2022)

数据简介:本数据参考黄先海和高亚兴老师(2023)的研究方法,对原文数据进行了年份扩充,更新到了2008-2022年。并按照原文的处理方法对样本进行了清洗和筛选。 数据范围:上市企业层面时间跨度:200…

利用Leaflet.js创建交互式地图:添加Popup

在现代Web开发中,交互式地图已成为展示地理位置数据的强大工具。Leaflet.js是一个开源的JavaScript库,它提供了一个简单易用的界面来创建这样的地图。在本文中,我们将探讨如何使用Leaflet.js创建一个交互式地图,并添加Popup来显示…

配置WSL(单纯记录

[参考链接(https://blog.csdn.net/mustuo/article/details/133960230) 1.开始相关功能 在控制面板-启用或关闭windows功能中 勾选适用于Linux的Windows子系统和虚拟机平台 重启后用管理员权限打开Powershell dism.exe /Online /Enable-Feature /FeatureName:VirtualMachinePl…

js TypeError: Cannot read property ‘initialize’ of undefined

js TypeError: Cannot read property ‘initialize’ of undefined 在JavaScript开发旅程中,遇到TypeError: Cannot read property ‘initialize’ of undefined这样的错误提示,无疑是令人沮丧的。这个错误通常意味着你试图访问一个未定义对象的initiali…

Mac 电脑 git credential osxkeychain问题之一

git credential osxkeychain问题,无法拉取最新代码,failed to get:-128 1.问题描述 不知道是系统还是brew进行了更新,启动项目后 git pull 无法拉取最新代码,git项目git pull 操作时突然提示:git credential osxkeych…

NPU 与 GPU 相比,有什么差别?| 技术速览

编者按: 随着2024年被业界誉为“AI PC元年”,各大笔记本电脑厂商纷纷推出搭载NPU的全新AI PC,而在介绍产品性能时,“NPU”一词频频被提及。但NPU和我们所熟知的GPU之间的区别究竟是什么? 我们今天为大家分享的这篇文章…

RS485隔离方案对比

RS485总线作为一种通用串口通信总线,在工业智能仪表、通讯设备等领域中应用广泛,得益于其优秀的抗干扰能力、长距离传输能力以及高数据传输速率。然而,在实际应用中,RS485总线在面临复杂电磁环境和远距离通信时,可能会受到各种电气干扰,导致信号传输不稳定,甚至可能损坏…

STM32G474读写FLASH

STM32G474读写FLASH主要用来将FLASH的部分页用来存储用户数据,以及分析是如何将“主FLASH存储器”作为引导区。 1、FLASH说明 STM32片内的FLASH分成两部分:主存储块、信息块。 “主FLASH存储器”用来存放用户程序,也就是我们写的程序,都存放在这里。 “…

LabVIEW编程快速提升的技术

在LabVIEW程序员的成长过程中,很多技术和概念看似简单、常用,但真正掌握并能熟练运用,往往需要踏踏实实的实践与积累。没有什么是能够一蹴而就的,唯有通过不断的专注与深入,才能获得显著的提升。要想在LabVIEW开发上取…

Maven 常见问题以及常用命令

常见问题 : 1. 识别不了maven项目 mvn clean install -Dmaven.test.skiptrue //构建 2. 打jar包时报异常 指定下jdk版本 常用命令: mvn clean mvn package mvn install mvn deploy

电气负载模拟器

电气负载仿真的概念涉及控制电力电子转换器,使其行为类似于实际电气负载。例如,电压源逆变器 (VSI) 可以仿真感应电机。在不同情况下,负载仿真器的使用至关重要。它有助于分析在各种负载条件和环境下将多台机器连接到电网的可行性。的部分是&…

【数据结构初阶】栈接口实现及经典OJ题超详解

文章目录 1. 概念与结构1. 1 栈底层结构选型 2. 栈实现2. 1 栈的定义2. 2 栈的初始化2. 3 入栈2. 4 判空2. 5 出栈2. 6 取栈顶元素2. 7 栈大小2. 8 栈销毁2. 9 打印 3. 经典OJ题3. 1 有效的括号 1. 概念与结构 栈是一种特殊的线性表,其只允许在固定的一端进行插入和…

IMS 注册流程(详细)

目录 业务模型 图1 EPC 网络附着示意图 图2 IMS 网络注册示意图 注册信令流程 图3 基本注册流程(EPC网络-融合HLR/HSS) IMS 注册流程 01:UE->P-CSCF 02:P-CSCF->I-CSCF 03:I-CSCF 处理 04:…

组成原理:体系结构,CPU,存储器,Cache

1,系统架构 1.1,组成结构 【硬件】是指计算机的实体部分,它由看得见摸得着的各种电子元件,各类光、电、机设备的实物组成。所有硬件通过总线和接口连接在一起,构成一台完整的计算机。 (1)运算器…

Spark的介绍

一、分布式的思想 不管是数据也好,计算也好,都没有最大的电脑,而是多个小电脑组合而成。 存储:将3T的文件拆分成若干个小文件,例如每500M一个小文件,将这些小文件存储在不同的机器上 。 -- HDFS 计算&#…