13 亿美金买个寂寞?No!AI 时代的数据行业蓄势待发

news2024/9/30 11:24:37

6月底,全球数据分析领域彻底炸锅了。

两大数据分析企业Databricks和Snowflake纷纷将目光瞄准了AI大模型。要知道,这两位对手平时没少对台戏,为性能、产品和技术经常开撕。但在今年的自家大会上,两家企业却出奇的一致,不约而同将主题定位为:Data+AI,并且宣布巨资加码AI大模型!

先是Databricks宣布以13亿美元收购AI大模型初创公司MosaicML,成为今年以来生成式AI领域内公布的最大一笔收购案。后是Snowflake宣布与NVIDIA合作,共同聚焦AIGC和专有大模型的开发。

可能有人会认为,数据分析企业“参和”到AI大模型领域,不是来添乱就是用于资本市场炒作。不过在笔者看来,数据分析企业们巨资加码AI大模型的背后,恰恰是大数据、人工智能技术经过多年发展与积累之后,数智生产力逐渐深入人心,如何高效、安全、便捷地释放数智生产力已成为数智时代千行百业的一道必答题。

Data+AI的本质:释放数智生产力

Databricks斥巨资收购AI大模型的背后逻辑是什么?

这其实是Data+AI的融合大趋势。

众所周知,进入到数字经济时代,数据已被公认为新的核心生产要素,而AI则被视为具有变革性的生产工具,二者结合有望真正带来生产力的飞跃。业界称之为释放数智生产力。

但高效、安全、便捷地释放数智生产力绝非易事。随着海量数据的增长,以及数据技术、人工智能技术的不断迭代与演进,千行百业的用户们也面临着极为复杂的局面:

其一、数据走向海量化和多样化,数据分析和各类模型也趋于复杂化。以OpenAI GPT大模型为例,近年来每一代GPT模型的参数规模呈指数级增加。如今,市场中千亿级的AI大模型屡见不鲜。

现在,训练一个大模型不仅需要耗费巨大的硬件成本,更需要花费大量精力在数据处理、训练等环节,这让很多用户对于AI大模型抱着“想用却不敢用”的心态。

其二、大量智慧场景的涌现,反向推动了更多的数据训练、推理和分析的需求,这对于数据处理、分析等环节要求会越来越高。而在行业领域,各个业务场景尝试接入AI大模型,除了会带来释放生产力之外,还会将数据处理等环节的要求提升到新的高度。数据处理、分析等需要走向自动化、智能化。

其三、数据消费群体持续扩大,带来了前所未有的数据消费局面。过去,数据消费群体往往是少数管理层;现在,大量的业务场景中均需要对数据进行分析、挖掘,这极大推动了数据消费群体的增加。比如,中国的一些股份制银行或者大型制造企业,其数据消费的月活员工早已过万,并且员工占比还在持续提升,在日常业务场景中,“用数”已经融入到各类员工的工作之中。

 事实上,为了更好地帮助用户们高效、安全、便捷地释放数智生产力,数据分析企业这些年在加速推动Data+AI的融合。比如,集成TensorFlow等流行AI框架,支持机器学习工具的开发等。如今,布局AI大模型更像是Data+AI趋势的进一步演进,水到渠成和顺理成章。

那么,生成式AI或者AI大模型会对数据分析带来哪些改变?

首先,AI的融合一定会让数据分析的方式更加智能和便捷,持续降低数据消费和使用的门槛,而生成式AI或者AI大模型则会加速数据分析的智能化,且会对数据分析、智能用数方式带来革命性的影响。

例如,在查询和检索、数据清洗和准备、分析和可视化等诸多环节融入生成式AI能力,让数据分析极为简单与便捷。以数据分析需求的流转为例,过去以以人和人的对话、人和数据平台 GUI的互动过程来完成,业务人员、数据分析师和数据工程师之间需要形成从解释需求到反馈方案的循环,且是预设流程,过程复杂、效率低下且优化迭代困难。

而将生成式AI融入之后,真正改变了过去输入方式、交互方式,可以让数据分析更好地契合用户想法。

国内领先的大数据分析和指标平台厂商 Kyligence是业界最早探索Data+AI的突出代表。早在 2019 年,Kyligence 就推出了 AI 增强引擎,可以根据实际的数据特征和查询习惯等主动分析业务用数模式,以实现数据模型自适应匹配业务查询需求,将高度依赖专家且工作量巨大的的数据建模开发与设计等工作变成自动化和智能化。

无疑,生成式AI和AI大模型的融入,带来更加出色的自然语言理解准确度、思考推理能力和以及自然语言的输出,除了进一步让数据分析加速走向智能化之外,也会彻底影响数据分析、数据消费、用数交互等方式,带来变革性的改变。

当下,无论是云服务商,还是数据分析企业,均认可生成式AI融入到数据分析之中,且在加速布局。据悉,在7月14日即将举办的Kyligence用户大会上,Kyligence将带来Data+AI的重磅新品,目标直指大模型时代下的智能用数。

其次,生成式AI或者AI大模型与数据分析平台的结合,未来会让行业的专有大模型训练、推理等变得更加简单,大模型成本未来有望大幅下降。

当前,大模型的训练与推理依然是一项复杂且成本高昂的工作,动辄数百万美元的训练和研发费用,让很多用户都叫苦不迭,降门槛和降成本对很多用户而言将是善莫大焉。

有专家就认为,数据分析平台和大模型技术的结合,未来有望让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,便捷进行自定义AI模型的开发。

可以说,随着生成式AI的融入,Data+AI正在加速开启新时代,释放数智生产力也指日可待。

如何释放数智生产力:看这里,上海见!

著名AI专家吴恩达认为,随着开源AI算法的普及,成功运用AI技术的关键是数据为中心的AI (Data-centric AI)。深以为然。

今年6月底,13亿美元的收购案为Data+AI打响了第一枪。随着生成式AI、AI大模型开始与数据分析相结合,Data+AI的核心依然是以数据为中心。接下来,Data+AI会对数据分析的交互方式、企业数据使用方式甚至专有大模型的建立等带来哪些新变化和新影响?

在7月14日举办的2023 Kyligence用户大会值得密切关注。Kyligence由 Apache Kylin 创始团队于 2016 年创办,是目前领先的大数据分析和指标平台供应商,连续三年进入Gartner 增强数据分析推荐厂商。

Kyligence在Data+AI的布局,表明中国数据分析企业一直走在业界变革的最前沿,对于AI大模型带来的数据分析交互革命、智能用数同样有着前瞻性的探索和布局。

据悉,在2023 Kyligence用户大会上,Kyligence 将会发布 Data + AI 的重磅新产品。此外,本次大会还将云集海内外行业领袖、技术专家、企业高管以及合作伙伴。此外,来自中金、德邦、平安银行、中信银行、三一重工、亚马逊云科技等多个领域的专家将分享 Data + AI 领域的诸多重磅内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/807795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

opencv+ffmpeg环境(ubuntu)搭建全面详解

一.先讲讲opencv和ffmpeg之间的关系 1.1它们之间的联系 我们知道opencv主要是用来做图像处理的,但也包含视频解码的功能,而在视频解码部分的功能opencv是使用了ffmpeg。所以它们都是可以处理图像和视频的编解码,我个人感觉两个的侧重点不一…

【博客684】Multi-regional高可用模式部署VictoriaMetrics

Multi-regional模式部署VictoriaMetrics 整体架构图 每个工作负载区域(地球、火星、金星)都有一个 vmagent,通过监控设置将数据发送到多个区域。监控设置(地面控制 1,2)包含 VictoriaMetrics 时间序列数据库 (TSDB) 集…

四姑娘山三日游

趁着小孩放暑假,从昆明回来之后,直接自驾到四姑娘山。 第一天 成都-四川省阿坝藏族羌族自治州小金县日隆镇(20230711) 大概9:30从成都市郫都区出发,路线如下:郫都—都江堰–映秀—耿达—卧龙—四姑娘山,中途翻过巴朗…

Notepad++工具通过正则表达式批量替换内容

1.每行末尾新增特定字符串 CtrlH弹出小窗口;查找目标输入$,替换为输入特定字符串;选中循环查找,查找模式选正则表达式;最后点击全部替换 2.每行行首新增特定字符串 CtrlH弹出小窗口;查找目标输入^&…

会议OA之我的会议(会议排座送审)

目录 前言: 2.我的会议: 2.1实现的特色功能: 2.2思路: 2.3功能实现: 我的会议页面:myMeeting.jsp myMeeting.js Dao方法 在mvc中配置info信息 Meeting InfoAction 2.4会议排座的思路: …

第四代SHARC® ADSP-21479KBCZ-2A、ADSP-21479BSWZ-2A、ADSP-21479KSWZ-2A高性能DSP(数字信号处理器)

第四代SHARC Processors 现在内置低功耗浮点DSP产品(ADSP-21478和ADSP-21479),可提供改进的性能、基于硬件的滤波器加速器、面向音频与应用的外设以及能够支持单芯片解决方案的新型存储器配置。所有器件都彼此引脚兼容,而且与以往…

【Android知识笔记】UI体系(二)

什么是UI线程? 常说的UI线程到底是哪个线程?UI线程一定是主线程吗? 下面先给出两条确定的结论: UI线程就是刷新UI所在的线程UI是单线程刷新的关于第二条为什么UI只能是单线程刷新的呢?道理很简单,因为多线程访问的话需要加锁,太卡,所以一般系统的UI框架都是采用单线程…

《重构的时机和方法》,值得程序员仔细研读的一本书

现有代码结构及框架沿用的比较久,持续在其上新增功能,可维护性与可扩展性变得越来越差,随着需求不断增加,现有代码变得越来越臃肿复杂,变得很难维护,甚至出现较严重的性能瓶颈,一般这个时候我们…

Thymeleaf入门

Thymeleaf是前端开发模板,springboot默认支持。前端模板用法大多数是类似的jsp、thymeleaf、vue.js都有while\for\if\switch等使用,页面组件化等。 1.前端模板区别 jsp是前后端完全不分离的,jsp页面写一堆Java逻辑。 thymeleaf好处是html改…

域名解析优先级

浏览器访问过程解析 访问网址——>首先在本地电脑看看hosts里面是否有域名对应IP地址,如何有直接访问对应IP, 如果没有,则联网询问DNS服务器(一般网卡那边都配置了DNS服务器IP) linux hosts 路径: w…

苍穹外卖-day07

苍穹外卖-day07 本项目学自黑马程序员的《苍穹外卖》项目,是瑞吉外卖的Plus版本 功能更多,更加丰富。 结合资料,和自己对学习过程中的一些看法和问题解决情况上传课件笔记 视频:https://www.bilibili.com/video/BV1TP411v7v6/?sp…

中国气象局:到2030年,人工智能在气象应用领域取得世界领先地位

最近,中国气象局发布了《2023-2030年人工智能气象应用工作方案》,旨在加快推进国内人工智能气象应用技术体系建设,提升基础支撑能力,构建健全的人工智能气象应用政策环境,促进人工智能技术在气象观测、预报和服务领域的…

华为H12-821更新了32题,大家注意了

(多选题)使用堆叠和集群技术构建园区网的优势包括以下哪些项? A、业务中断时间大大减少 B、简化网络管理,降低网络部署规划的复杂度 C、可有效减少网络功耗 D、提高网络设备和链路的利用率 正确答案是…

教雅川学缠论02-K线

传统行情上的K线是下图中这样子的 而在缠论中K线是下面这样子的,它没有上影线和下影线 下图是武汉控股2023年7月的日K线 接下来我们将它转换成缠论K线(画图累死我了) K线理解了我们才能进行下一步,目前位置应该很好理解的

C++笔记之vector的resize()和clear()用法

C笔记之vector的resize()和clear()用法 code review! 文章目录 C笔记之vector的resize()和clear()用法1.resize()2.clear() 1.resize() 运行 2.clear() 运行

Python自动计算Excel数据指定范围内的区间最大值

本文介绍基于Python语言,基于Excel表格文件内某一列的数据,计算这一列数据在每一个指定数量的行的范围内(例如每一个4行的范围内)的区间最大值的方法。 已知我们现有一个.csv格式的Excel表格文件,其中有一列数据&#…

设计模式行为型——责任链模式

目录 什么是责任链模式 责任链模式的实现 责任链模式角色 责任链模式类图 责任链模式举例 责任链模式代码实现 责任链模式的特点 优点 缺点 使用场景 注意事项 实际应用 什么是责任链模式 责任链模式(Chain of Responsibility Pattern)又叫职…

【面试题】前端中 JS 发起的请求可以暂停吗?

这个问题非常有意思,我一看到就想了很多可以回复的答案,但是评论区太窄,就直接开一篇文章来写了。 审题 JS 发起的请求可以暂停吗?这一句话当中有两个概念需要明确,一是什么样的状态才能称之为 暂停?二是…

Appium+python自动化(三十五)- 命令启动appium之 appium服务命令行参数(超详解)

简介 前边介绍的都是通过按钮点击启动按钮来启动appium服务,有的小伙伴或者童鞋们乍一听可能不信,或者会问如何通过命令行启动appium服务呢?且听一一道来。 一睹为快 其实相当的简单,不看不知道,一看吓一跳&#xf…

TCP 三次握手四次挥手浅析

大家都知道传输层中的TCP协议是面向连接的,提供可靠的连接服务,其中最出名的就是三次握手和四次挥手。 一、三次握手 三次握手的交互过程如下 喜欢钻牛角尖的我在学习三次握手的时候就想到了几个问题:为什么三次握手是三次?不是…