大数据产品深度与广度并举,腾讯云为数据价值释放带来最优解

news2024/11/24 4:09:16

云原生正在重新定义大数据平台?

目前看的确如此。从2021年Apache Spark和Confluent Kafka宣布支持Kubernetes,到腾讯云等云服务商积极推出多款云原生大数据产品,产业界近年来都在积极探索:如何利用高速发展的云原生技术去解决传统大数据平台的诸多问题,从而进一步降低大数据技术、产品和服务的使用门槛,帮助用户更好地释放数据价值。

如今,云原生大数据平台成为大势所趋。作为国内最早布局云原生大数据领域的厂商,腾讯云在2018就发布初具云原生能力的弹性MapReduce(EMR),到2021年流计算产品Oceanus Serverless版,再到2022年上线EMR容器版……

在2023腾讯全球数字生态大会上,腾讯云并未停下脚步,又密集发布Elasticsearch serverless版、数据湖计算DLC、TCHouse-C云原生弹性版等多款产品,其兼具广度与深度的云原生大数据产品完整版图日渐清晰。

传统大数据平台亟待突破

大数据发展初期,多数企业数据规模不大、业务响应速度要求不高,以Hadoop为代表的传统大数据技术体系对于释放数据价值发挥了关键作用。

但随着数字经济持续发展,数据驱动型业务场景加速涌现,用户们对于大数据开发需求产生了根本性变化,多租户环境下的大数据开发、大数据资源高效利用、新技术快速集成等一系列全新需求。

而传统大数据生态复杂,松耦合的开发方式虽然有灵活、适应面广等优势,但也不可避免的会遇到组件之间匹配成熟度、版本冲突、集成测试困难等挑战,用户在使用时需要耗费大量精力在部署、组件配置等工作上;另外,像一些大数据平台的商业发行版复杂度极高,太多组件不仅缺乏灵活性,还容易带来使用和运维上的额外工作。

Gartner在技术成熟度曲线报告中也指出Hadoop发行版诸多问题近年来处于愈演愈烈的趋势。目前看,云原生技术恰是突破的那味“良药”。众所周知,云原生是最近十年数据中心领域最重要的技术趋势之一,正在对传统技术栈产生颠覆性的影响。在大数据领域,容器、K8S等云原生技术对于大数据产品影响巨大。Gartner就预测,到2025年,部署在云原生平台上的数据应用将增长到95%,这意味着云原生大数据平台未来将势不可挡 。

不过,云原生大数据平台的落地绝非一蹴而就,依然面临着众多技术难题和产品挑战。目前看,在众多大数据厂商中,以腾讯云为代表的云服务商凭借诸多优势,正成为云原生大数据平台领域的引领者。

因为,云服务商并非简单地从单个产品或者单点技术的思维角度来解决传统大数据平台的问题,而是以系统性的整体思维推动云原生大数据的高效落地。

云服务商的这种整体性思维不仅可以让大数据应用的开发、部署和运维更加简单,还能充分发挥公有云分布式架构弹性、灵活、高效等诸多优势;更加重要的是,如今的云不仅仅是一个IT资源的集中地,更像是云、数、智的融合体,云服务商可以推动云原生大数据与AI等新技术、服务进行融合,从而帮助用户更加高效地释放数据价值。

深度与广度并举:腾讯云构建完整云原生大数据版图

就像石油需要经过提炼才能被广泛使用一样,数据也需要经过采集整合、拉通共享和分析应用等才能充分释放价值。因此,数据价值的释放需要经过数据生命周期的完整链路,绝非单个产品或者技术就能完成。

过去十年,移动化、社交化带来了数据指数级增长、数据来源广泛化、数据类型多元化,而像5G、物联网、边缘计算的兴起,让现代数据应用的复杂性进一步提升。而云原生大数据平台最大的价值就是让数据价值释放过程更加简单和方便,帮助用户利用好数据和聚焦应用创新。

一直以来,腾讯云都致力于构建完整的云原生大数据版图,从数据湖计算DLC、云数据仓库TChouse、检索分析引擎Elasticsearch Service等数据基础设施,到涵盖数据开发治理的DataOps数据工具Wedata,再到腾讯云BI等的数据应用分析服务,以层层递进来帮助用户降低数据使用难度和形成数据资产体系。

在2023腾讯全球数字生态大会上,腾讯云又发布了ES-Serverless版、数据湖计算DLC、TCHouse-C云原生弹性版等多款极富竞争力的产品,进一步扩大和完善了云原生大数据的产品版图。

例如,腾讯云此次对云数据仓库TCHouse进行了品牌全面升级,TCHouse划分为TCHouse-C、TCHouse-D和TCHouse-P三大产品系列,共同构成性能与易用性兼具的企业级云数仓体系,有效满足用户在不同业务场景中的选择。

这其中,针对数据来源广泛、数据价值潜力巨大的半结构化数据为主的业务场景,腾讯云发布了TCHouse-C云原生弹性版本。该版本基于ClickHouse 内核,采用存算分离的全新架构,分布式大规模并行处理 MPP 框架可充分利用硬件,Schema-less无需预先定义数据结构和模式,带来巨大的灵活性与扩展性,实现日志检索、APM等场景下非结构化数据实时分析性能20倍提升;另外,通过控制台分钟级构建 ClickHouse 分析集群,简单操作即可快速实现集群扩、缩容和节点变配等;支持独立部署和VPC私有网络隔离,数据访问安全和集群高可用有保障的同时,实现使用成本的大幅下降。

又如,腾讯云还发布了基于自研云原生 Serverless 技术架构打造的云端一站式全托管 Elasticsearch 服务:ES-Serverless版本。开源Elasticsearch存在弹性能力较弱、稳定性不足、资源成本与运维管理成本高等显著缺陷,ES-Serverless版本则支持自动弹性、完全免运维、按需付费,提供从数据接入到索引存储、检索分析的端到端一站式体验,有效解决日志分析、指标监控等业务场景下波峰波谷导致的资源成本高等问题。

再如,腾讯云大数据发布了基于Spark、Presto、Iceberg构建的云原生Serverless湖仓分析服务:数据湖计算DLC。腾讯云数据湖计算DLC覆盖湖场景和仓应用场景,兼具数据湖与数据仓库的优势,采用为降本而设计的云原生存算分离架构,计算和存储均按需使用,并提供高效率实时急速分析能力,内业首个支持百万级/秒 QPS实时入湖以及端到端分钟级时延,广泛适应于BI、交互式分析,AI、科学计算等多种大数据应用场景分析;并且作为云原生Serverless产品形态,数据湖计算DLC实现开箱即用,免底层运维,大幅降低使用门槛和成本。

如今,随着数据应用的丰富性和复杂性持续提升,云原生大数据平台的演进路径也已愈发清晰,即像腾讯云大数据那样,在产品层面实现深度与广度并举的策略,通过构建完整、领先的云原生大数据产品与服务,来帮助用户解决复杂数据问题、充分释放数据价值。

AI融合,让数据价值释放更从容

从技术层面来看,云计算、大数据以及AI具备天然融合的特性。过去十年,云计算的快速发展和普及,为大数据带来弹性、灵活、高效以及坚实的基础设施保障;未来十年,AI是大数据发展的最大驱动力,大数据与AI的融合有望让数据价值释放更加从容。

尤其是AI大模型的兴起,所展示的强大能力和较强的泛用性,正在全球范围内引爆新一轮的数据变革,基于大模型的应用在办公、会议、对话、搜索、广告等领域崭露头角,将极大地推动了大数据与AI的融合。因为,大模型应用的核心是高质量数据,数据的质量又决定着算法的性能、泛化能力和应用效果,而高质量的数据又十分依赖大数据平台来解决与数据相关的“清洗、治理、传输”等环节。

事实上,腾讯云是最早探索与布局大数据与AI融合的厂商之一。腾讯云Elasticsearch serverless 8.8.1版本具备云端AI增强与向量检索能力,将检索能力与大语言模型的自然语言理解能力结合,提供与大模型集成的端到端的搜索与分析体验,实现大数据与AI的协同与融合。

例如,大语言模型应用当前存在知识停滞和缺乏特定领域专业知识的两个典型挑战。为此,Elasticsearch serverless 8.8.1充分利用向量检索和大模型结合,把问题和通过向量检索得到的结果集发送给大模型,大模型可以对私域知识进行语言组织,给出一个人性化的高质量回答。

另外,针对大模型场景,腾讯云还强化了DLC ,依托其Serverless形态下免运维、轻量化、低门槛的特性,以及内置对Pyspark支持与优化、对Jupyter良好集成性,可以高效、稳定地支持大规模的数据预处理,大幅降低大模型对于底层数据基础设施的投入成本,成为AIGC场景首选的大数据底座。

综合观察,腾讯云大数据产品近年来获得了市场的广泛认可,多次入围Forrester、沙利文、赛迪等国内外研究机构的大数据权威报告,其背后离不开腾讯云对于大数据产业发展痛点的洞察、用户行业场景的实践以及新技术的持续探索。面向未来,腾讯云已经构建起深度与广度并举的云原生大数据产品版图,并且加速推动大数据与AI的融合,未来有望为用户的数据价值释放带来最优解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1040721.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python编程:使用 Pillow 将照片转换为1寸报名照片

引言: 在现代科技时代,我们经常需要调整和处理照片以适应特定的需求和用途。本文将介绍如何使用 wxPython 和 Pillow 库,通过一个简单的图形界面程序,将选择的照片转换为指定尺寸的 JPG 格式,并保存在桌面上。 C:\pyt…

基于Java+SpringBoot+Vue火车订票管理系统的设计与实现 前后端分离【Java毕业设计·文档报告·代码讲解·安装调试】

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…

查看docker镜像是由哪些指令创建来的

–no-trunc 是不要省略。 docker history --no-trunc kevinchina/deeplearning:sd_base_cuda116clip7 > history.txtcp -aL ~/.cache/huggingface/hub/models–Salesforce–blip-image-captioning-large/snapshots/e33defe055114d86bec9c0705b71e590cfc0694c/* ~/.cache/hu…

扩散模型:DDPM代码的学习(基于minist数据集)

文章目录 序言一参考资料①代码来源②相关概念理解③公式推导及训练流程讲解④搜索问题的网站⑤模型运行的环境 二代码解读①模型②训练③测试 三主要训练过程的解析 序言 本文主要对一个基于minist数据集搭建的DDPM模型代码中各个模块的含义进行解析,初步记录了自…

Crypto:一眼就解密

题目 根据题目给出的信息可知,flag的为base64编码,数字后面的可以知道为base64编码,解码可得

[AI Agent学习] MetaGPT源码浅析

前言 工作上,需要使用AI Agent,所以需要深入学习一下AI Agent,光阅读各种文章,总觉无法深入细节,所以开看各类AI Agent相关的开源项目,此为第一篇,学习一下MetaGPT的源码。 基本目标 MetaGPT是一…

手机充电器成精会怎样?sanag塞那K30,自带插头和数据线的充电宝

充电宝是大家几乎每天都要用的装备,除了手机之外,现在耳机、手表也经常需要充电,不过相比于电量超大的充电宝,作为日常通勤或者周末郊游的装备,大家应该更倾向于轻巧且支持快充的充电宝,电量方面&#xff0…

leetcode334. 递增的三元子序列(java)

递增的三元子序列 题目描述贪心 题目描述 难度 - 中等 leetcode334. 递增的三元子序列 给你一个整数数组 nums &#xff0c;判断这个数组中是否存在长度为 3 的递增子序列。 如果存在这样的三元组下标 (i, j, k) 且满足 i < j < k &#xff0c;使得 nums[i] < nums[j]…

JOSEF约瑟 抗干扰中间继电器UEG/F-4H UEG/F-8H/110VDC 启动功率大于5W

UEG/F系列 抗干扰中间继电器 系列型号&#xff1a; UEG/F-1H1D/110VDC抗干扰中间继电器&#xff1b;UEG/F-1H1D/220VDC抗干扰中间继电器&#xff1b;UEG/F-1H1D/24VDC抗干扰中间继电器&#xff1b; UEG/F-1H1D/48VDC抗干扰中间继电器&#xff1b;UEG/F-1H1D/125VDC抗干扰中间…

“全景江西·南昌专场”数字技术应用场景发布会 | 万广明市长莅临拓世集团展位,一览AIGC科技魅力

随着数字技术的迅猛发展&#xff0c;传统产业正在发生深刻的变革&#xff0c;新兴产业蓬勃兴起。但要想实现数字经济超常规发展&#xff0c;就要在数字产业化上培育新优势&#xff0c;大力实施数字经济核心产业提速行动&#xff0c;加快推进“一核三基地”建设。在这个数字经济…

下载项目路径下的文件

文件下载&#xff08;比如模板下载&#xff09;&#xff0c;方法之一是先在服务器上创建一个路径&#xff0c;再通过代码里面写死或配置去读取这个路径的下的这个文件进行下载。 这个方法的缺点就是需要提前创建好这个目录&#xff0c;并给文件路径给与读写权限&#xff0c;上线…

助力养殖行业数字化转型,基于深度学习模型开发构建猪脸识别系统

养殖行业的数字化进程在国内还是比较缓慢的&#xff0c;一些大厂在前面的一些探索时期做过一些相关的工作&#xff0c;但是受限于各种因素并没有能够广泛地铺展开来&#xff0c;数字化不应该被理解为非常高大上的遥不可及的东西&#xff0c;数字化也不应该成为中低产的一道鸿沟…

AnsibleFATE部署过程

前言 基本上按照官方文档就行了&#xff0c;先做before deploy&#xff0c;再做three side guide.md。 以下是可能出现的问题 这个AnsibleUndefinedVariable: ‘ansible_ssh_host‘ is undefined.是肯定会遇到的&#xff0c;参考我这篇 安全性限制 ansible提示 warning&…

java单例的几种实现方式

单例模式 1.饿汉式&#xff08;线程安全&#xff09;2.懒汉式&#xff08;线程不安全&#xff09;3.懒汉式(线程安全)4. 双重校验5. 静态内部类6. 反射对于单例的破坏7. 序列化对于单例的破坏8.枚举(推荐方式) 1.饿汉式&#xff08;线程安全&#xff09; 在类加载期间初始化静…

写SAE评测,获 Airpods 2大奖【集结令】!

Serverless 应用引擎 SAE 开启测评有奖&#xff01;名额有限&#xff0c;先到先得&#x1f3c6;&#xff01; Serverless应用引擎SAE是一款极简易用、自适应弹性的容器化应用平台。现面向所有用户发出诚挚邀请&#xff0c;参与一分钟部署在线游戏&#xff0c;写下宝贵评测反馈。…

【操作系统笔记七】进程和线程

进程的组成 进程要读取 ELF 文件&#xff0c;那么&#xff1a; ① 要知道文件系统的信息&#xff0c;fs_struct② 要知道打开的文件的信息&#xff0c;files_struct 一个进程除了需要读取 ELF 文件外&#xff0c;还可以读取其他的文件中的数据。 进程中肯定有一个 mm_struct…

华为云云耀云服务器L实例评测|如何保障华为云云耀云服务器L实例的安全和性能

引言 云耀云服务器L实例是华为云提供的高性能计算实例&#xff0c;为用户提供稳定可靠的云计算环境。为了保障实例的安全和性能&#xff0c;用户可以通过设置防火墙和安全组策略来限制网络访问和防止恶意攻击。华为云提供了灵活的管理工具&#xff0c;用户可以通过控制台、API…

【AD】【规则设置】【pcb】默认规则设置

默认规则设置 PCB画板规则的设置1. 间距规则2. 线宽规则3. 过孔规则设置方法盖油的效果&#xff08;左侧&#xff09;过孔的外径盖油 - 8mil 【负片层】过孔的外径盖油 - 8mil 【正片层&#xff08;信号走线层&#xff09;】 【tip】焊盘形状的选取 4.铺铜高级设置&#xff0c;…

快速排序代码及时间空间复杂度

快速排序&#xff08;Quick Sort&#xff09;是一种高效的排序算法&#xff0c;它的平均时间复杂度为 O(n log n)&#xff0c;是许多排序算法中性能最好的之一。下面是快速排序的代码示例和时间空间复杂度分析&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#x…

计算机网络相关知识点(二)

TCP如何保证传输过程的可靠性&#xff1f; 校验和&#xff1a;发送方在发送数据之前计算校验和&#xff0c;接收方收到数据之后同样需要计算&#xff0c;如果不一致&#xff0c;那么代表传输有问题。 确认应答序&#xff0c;序列号&#xff1a;TCP进行传输时数据都进行了编号…