2024年大数据不完全预测

news2024/9/22 1:16:56

人工智能的进步可能是2024年的主要推动力,也凸显出大数据的挑战——如何存储、管理、管理和使用大数据——从未如此紧迫。,因为如果作为基石的数据失控,人工智能就没有意义了。当然反之亦然。

人工智能的进步可能是2024年的主要推动力,也凸显出大数据的挑战——如何存储、管理、管理和使用大数据——从未如此紧迫。,因为如果作为基石的数据失控,人工智能就没有意义了。当然反之亦然。

在新的一年里,大数据会给我们带来什么?尽管科技发展很难预测,行业专家仍然试图通过对大数据领域的预测,为我们揭示未来。

数据库提供商Percona的技术传道者Dave Stokes表示,人们对矢量数据库的兴趣将会激增。然而,它无法“独当一面”。

Stokes预测:“矢量数据库将成为许多人讨论的热门新领域,但几年后最终将被关系数据库所吸收。”“每隔10年左右,就会有一种‘新’数据库技术被宣布为关系数据库,开发人员也会加入这一潮流,结果却发现关系模型非常灵活,关系数据库供应商可以轻松地将新技术应用到他们的产品中。

不同数据孤岛的存在一直是数据工程师的眼中钉。但据Hammerspace的营销高级副总裁Molly Presley称,2024年将带来一线希望,因为一种集中式的数据编排形式将占据中心位置。

“组织将开始从‘存储和复制’转向数据编排的世界。”Presley说,“在人工智能进步的推动下,现在存在强大的工具来分析数据并梳理出可操作的见解。然而,文件存储基础设施并没有跟上这些进步的步伐。与试图通过将文件副本从一个地方移动到另一个地方来管理存储筒仓和分布式环境的解决方案不同,数据编排帮助组织将来自不同筒仓和位置的数据集成到单个命名空间中,并在最有价值的时间和地点自动放置数据,从而更容易分析和获得见解。”

我们存储的大多数数据都是非结构化的。MinIO的联合创始人兼首席执行官Periasamy表示,随着数据的堆积,管理起来真的是一个挑战,但2024年将带来新的管理方法。

“到2024年,随着人工智能应用的飞速发展,我们将看到企业真正的非结构化数据(音频、视频、会议记录、演讲、演示)出现爆炸式增长。从人工智能的角度来看,这是高度‘可学习’的内容,将其收集到人工智能数据湖中将大大提高整个企业的智能能力,但它也带来了独特的挑战。” Periasamy说,“保持数十PB数据的性能存在明显的挑战。这些问题通常不能用传统的SAN/NAS解决方案解决——它们需要现代的、高性能的对象存储的属性。这就是为什么大多数AI/ML技术(如OpenAI、Anthropic、Kubeflow)都利用对象存储,以及为什么大多数数据库都转向以对象存储为中心。”

根据Forrester的研究,企业管理的非结构化数据将在2024年翻一番,为人工智能开辟了潜在的有利可图的新选择。

该分析集团表示:“全球数据和分析决策者表示,他们组织管理的数据中只有27%是非结构化的。”随着公司为客户和员工推出更多的对话体验,生成式人工智能将使这一数字翻一番。企业将争相存储、分析和理解这些大量的非结构化数据。这一趋势将出现在数据管道领域,到2024年,80%的新数据管道将用于获取、处理和存储非结构化数据。

Faction技术和运营副总裁Jeff Heller表示,到2024年,全球许多企业将实施数据优先架构,以简化其数据管理策略。

“公司正在经历范式转变:他们要么选择一种云,要么选择另一种架构来满足他们的需求。” Heller说,“到2024年,企业将需要考虑哪种云计算最适合他们,以充分利用他们的数据。基于短期目标而非长期增长的决策将导致数据锁定。为了及时做出决策,数据需要准确和可访问。对于组织来说,管理数据正变得越来越复杂。对高效数据管理策略的需求是至关重要的。企业将转向提供从所有云的首选位置访问单个数据集的解决方案,以确保数据准确性和提高效率。”

数据管道公司Matillion的首席产品官Ciaran Dynes表示,人工智能革命正在触及生活的方方面面,包括大数据管理。

“在过去的十年里,数据工程师的角色已经从根本上扩展了。” Dynes说,“未来12个月将是科技公司让数据工程师的工作变得更简单的一年。新工具将进入市场,集成到现有的平台中,从而能够将生成式人工智能添加到现有的数据管道中,并能够在内部部署这些模型,这样用户就可以像使用ChatGPT一样与这些模型进行实时交互。不管市场上的工具是什么,明年对数据工程师的重新培训也将是巨大的需求,以掌握提示工程,如何微调这些模型,如何大规模提高他们的生产力。明年,数据工程师的生活将变得更加有趣。”

你有多看重数据工程师?据Snowflake公司产品管理总监Jeff Hollan说,到2024年,它们的价值将会更高。

Hollan说:“有很多人认为,人工智能革命将取代数据工程师的角色。事实并非如此,事实上,他们的数据专业知识将比以往任何时候都更加重要,只是以一种新的、不同的方式。为了跟上不断变化的形势,数据工程师需要了解生成式人工智能如何增加价值。由数据工程师构建和管理的数据管道可能是连接大型语言模型的第一个地方,以便组织释放价值。数据工程师将是那些了解如何使用模型并将其插入数据管道以自动提取价值的人。他们还需要监督和理解人工智能的工作。”

当数据由云中的第三方管理时,您可能会觉得数据失去了控制。Ngrok的首席技术官 Peter Shafton预测,2024年将是你开始重新掌控自己数据的一年。

Shafton说:“2024年的数据管理将显著转向更易于访问和控制。”“虽然过去十年见证了基于云计算的数据解决方案的热潮,但钟摆又回到了更多的自我管理。这种转变背后的原因有两个:隐私和成本效益。数据泄露的持续威胁以及对更严格的访问控制的需求使企业对仅依赖外部云平台持谨慎态度。此外,云数据存储和处理成本的不可预测性促使组织寻求更具可预测性和成本效益的解决方案。可访问且用户友好的数据管理工具的激增也促进了这一趋势,这些工具通常源于Uber、Netflix和Airbnb等科技巨头开创的开源解决方案。

“数据智能”这个术语已经发展了几年,指的是组织对其数据使用的各种数据管理工具。Nasuni的首席创新官Jim Liddle表示,未来12个月将是这个概念成败的关键。

Liddle说:“数量惊人的公司存储大量数据,仅仅是因为他们不知道数据中有什么,也不知道他们是否需要这些数据。”“数据是准确的和最新的吗?是否正确分类和“可搜索”?它是否兼容?它是否包含个人身份信息(PII)、受保护的健康信息(PHI)或其他敏感信息?它是按需提供还是存档?在未来的一年里,所有公司都将被迫接受人工智能的数据质量、治理、访问和存储要求,然后才能推进数字化转型或改进计划,以获得所需的竞争优势。”

Coalesce的首席执行官兼联合创始人Armon Petrossian表示,如果不能保持数据的质量和完整性,那么你就可以和2024年的GenAI计划说再见了。

他说:“到2024年,随着数据从有价值的资产演变为蓬勃发展的企业的命脉,技术领域将见证一场变革。”“忽视数据质量、完整性和血统的组织将面临挑战,不仅要做出明智的决策,还要实现生成式人工智能、法学硕士和机器学习应用程序和用例的全部潜力。随着今年的发展,我预测,那些忽视建立强大的数据基础和战略的组织将发现,在快速发展的科技行业中保持生存越来越具有挑战性。那些不能适应和优先考虑数据基础的公司将难以超越竞争对手,甚至可能面临在这个竞争激烈的环境中生存的风险。”

数据沿袭构成了一个持续的挑战。altair云计算总工程师Yeshwant Mummaneni预测,2024年,区块链将伸出援手。

Mummaneni说:“由于人工智能/机器学习模型在关键决策中发挥着关键作用,无论是由人类监督还是以完全自主的方式,模型的来源/血统变得至关重要。”“为区块链提供记录、数字身份、签名和利用密码学验证的不变性的基础技术,将成为企业人工智能提供防篡改模型来源的关键方面。”

另一个大数据趋势将像2024年寒冷冬夜的冰晶一样增长:合成数据。这是SAS公司高级分析产品经理斯Potamitis说的。

Potamitis表示:“随着组织面临更严格的监管,以及跨境共享敏感数据变得更具挑战性,合成数据将获得很大的吸引力。”“合成数据可以高精度地捕获原始数据源的统计属性,从而克服监管障碍,为组织开启创新之门。”

ALTR首席执行官Beecham表示,虽然你的大数据存储库感觉不错,但2024年将是数据治理“向左移动”的一年。

Beecham说:“组织将在数据传输的早期实施数据治理和安全措施,在云数据仓库的左侧,这不仅可以保护敏感信息,还可以提高所收集数据的整体质量。”“随着有关数据隐私和安全的法规越来越多,早期优先考虑数据治理和安全的公司将更好地遵守这些法规。到2024年,预计将有大量公司优先考虑数据治理和安全的转移,使他们能够在云数据仓库和湖屋上启动强大的数据访问治理和数据安全功能,并在数据离开源系统时将其扩展到数据。”

在2023年,数据网格在其他技术趋势中退居次要地位(主要风头在于GenAI),但在2024年,数据网格的好处将变得非常明显,不容忽视,Denodo的首席执行官Angel Viña说。

Viña表示:“2024年将是数据网格崛起的关键一年,它包含了数据固有的分布式特性。”“在数据网格中,IT的角色转变为为数据域提供基础以完成其工作,即在整个企业中创建和分发数据产品。转折点将是认识到数据产品应与任何其他产品同等重要。在这个以数据为中心的时代,仅仅包装数据是不够的,企业需要提升终端用户的整体体验。” 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1365789.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1999-2022年上市公司微观企业劳动生产率数据(原始数据+计算代码+处理结果)

1999-2022年上市公司微观企业劳动生产率数据(原始数据计算代码处理结果) 1、时间:1999-2022年 2、来源:原始数据整理自csmar 3、指标:证券代码,证券简称、员工人数,营业收入 4、范围&#x…

C++ 学习系列 -- tuple 原理

一 可变参数模板 variadic template 前面的章节 C 学习系列 -- 模板 template-CSDN博客 我们介绍了 c 中的模板概念,本章则在其基础上介绍了新的概念 可变参数模板 variadic template ,顾名思义,可变参数模板意思为模板参数的类型与数量是变…

浅谈智能照明系统调试阶段节能方案的探究与产品选型

贾丽丽 安科瑞电气股份有限公司 上海嘉定 201801 【摘要】针对当今智能照明系统调试完成前能源浪费的问题,本文结合工程案例,分析研究了智能照明系统调试阶段的节能方法,提出了采用时间控制器来解决能源及人工浪费等问题的方式。实践证明&a…

微众区块链观察节点的架构和原理 | 科普时间

践行区块链公共精神,实现更好的公众开放与监督!2023年12月,微众区块链观察节点正式面向公众开放接入功能。从开放日起,陆续有多个观察节点在各地运行,同步区块链数据,运行区块链浏览器观察检视数据&#xf…

Kafka(六)消费者

目录 Kafka消费者1 配置消费者bootstrap.serversgroup.idkey.deserializervalue.deserializergroup.instance.idfetch.min.bytes1fetch.max.wait.msfetch.max.bytes57671680 (55 mebibytes)max.poll.record500max.partition.fetch.bytessession.timeout.ms45000 (45 seconds)he…

【STM32】STM32学习笔记-DMA数据转运+AD多通道(24)

00. 目录 文章目录 00. 目录01. DMA简介02. DMA相关API2.1 DMA_Init2.2 DMA_InitTypeDef2.3 DMA_Cmd2.4 DMA_SetCurrDataCounter2.5 DMA_GetFlagStatus2.6 DMA_ClearFlag 03. DMA数据单通道接线图04. DMA数据单通道示例05. DMA数据多通道接线图06. DMA数据多通道示例一07. DMA数…

STM32(HAL库) CubeMX+Keil5 建立工程

STM32(HAL库) CubeMXKeil5 建立工程 目标选择 菜单栏 File 新建工程打开工程退出软件 Window 输出窗口的开启软件字体设置 Help 软件帮助文档检查软件更新管理MCU 已存在工程(Existing Projects) 最近打开过的工程(Recent Open…

如何科学评价视频生成模型?AIGCBench:全面可扩展的视频生成任务基准来了!

AIGC领域正迅速发展,特别是在视频生成方面取得了显著进展。本文介绍了AIGCBench,这是一个首创的全面而可扩展的基准,旨在评估各种视频生成任务,主要关注图像到视频(I2V)生成。AIGCBench解决了现有基准的局限…

苹果显示连接iTunes是什么意思?你知道吗?答案来了!

相信使用苹果手机的小伙伴都听说过iTunes软件,但是可能还有小部分人不知道iTunes是什么,以及苹果设备上显示连接itunes是什么意思。对于使用iTunes进行数据备份、恢复等操作的用户来说,出现这个提示意味着您的苹果设备已经与电脑成功连接&…

vue-springboot基于java的实验室安全考试系统

本系统为用户而设计制作实验室安全考试系统,旨在实现实验室安全考试智能化、现代化管理。本实验室安全考试管理自动化系统的开发和研制的最终目的是将实验室安全考试的运作模式从手工记录数据转变为网络信息查询管理,从而为现代管理人员的使用提供更多的…

【Docker基础一】Docker安装Elasticsearch,Kibana,IK分词器

安装elasticsearch 下载镜像 查看版本:Elasticsearch Guide [8.11] | Elastic # 下载镜像 docker pull elasticsearch:7.17.16 # 查看镜像是否下载成功 docker images创建网络 因为需要部署kibana容器,要让es和kibana容器互联 # 创建一个网络&…

并发(10)

目录 61.ReentrantReadWriteLock底层读写状态如何设计的? 62.读锁和写锁的最大数量是多少? 63.本地线程计数器ThreadLocalHoldCounter是用来做什么的? 64.写锁的获取与释放是怎么实现的? 65.读锁的获取与释放是怎么实现的&…

【算法】递归算法理解(持续更新)

这里写目录标题 一、递归算法1、什么情况下可以使用递归?2、递归算法组成部分3、案例:求n的阶乘4、编写一个递归函数来计算列表包含的元素数。5、通过递归找到列表中最大的数字。6、通过递归的方式实现二分查找算法。 一、递归算法 递归(Rec…

浅谈LCD屏幕引脚定义识别

学习单片机,总要驱动LCD屏幕,但是对于没有引脚定义的LCD屏幕该如何应对? 本人研究不深,只谈体会。 比如下面这款屏幕 一、第一种方法 百度大法查引脚定义。查询条件可以是FPC上的丝印,或者是屏幕的尺寸,引脚…

sublime如何取消运行代码状态

sublime如何取消运行代码状态 解决方案待续、更新中 解决方案 1 顶部取消: 工具-----取消编译 这个看自己编译器sublime取消编译是否可用,可用则用 ,否则使用下面方法 2 底部栏取消–如图所示: 取消成功: 待续、更新中 ————————————————————— 以上就…

2024前端炫酷源码分享(附效果图及在线演示)

分享10款非常有趣的前端特效源码 其中包含css动画特效、js原生特效、svg特效以及小游戏等 下面我会给出特效样式图或演示效果图 但你也可以点击在线预览查看源码的最终展示效果及下载源码资源 GSAP-火箭动画特效 GSAP 火箭动画 当氮气充足的情况下 火箭会冲出 并继续飞行 图片…

【Java】设计模式之顺序控制

实际开发中,有时候一些场景需求让多个线程按照固定的顺序依次执行。这个时候就会使用这种模式。 这种模式说白了,就是给线程设定不同的条件,不符合条件的话,就算线程拿到锁也会释放锁进入等待;符合条件才让线程拿到锁…

【解决方案】电能质量在线监测装置和防孤岛保护装置在特斯拉工厂分布式光伏项目的应用

摘要: 随着全球对可再生能源的关注度不断提高,分布式光伏发电系统在近年来得到了广泛应用。分布式光伏发电系统具有环保、灵活等优势,能够有效地缓解能源短缺和环境污染问题。同时,电能质量在线监测装置和防孤岛保护装置在分布式…

leetcode:412. Fizz Buzz(python3解法)

难度:简单 给你一个整数 n ,找出从 1 到 n 各个整数的 Fizz Buzz 表示,并用字符串数组 answer(下标从 1 开始)返回结果,其中: answer[i] "FizzBuzz" 如果 i 同时是 3 和 5 的倍数。a…

开心自走棋:使用 Laf 云开发支撑数百万玩家

先介绍一下开心自走棋 开心自走棋是一款剑与魔法的烧脑自走棋游戏。以著名的魔幻世界观为蓝本,采用了轻松可爱的画面风格,精致细腻的动画和特效来还原魔兽之战。 现在市面上自走棋游戏多是 PvP 玩法为主,而开心自走棋是以 PvE 玩法为主的&a…