伴随着数字经济的高速发展,越来越多的企业管理者都开始认识到数据才是企业最宝贵的资产,并为此不断加速企业的数字化转型与升级。而在数据库领域,云原生已经当仁不让地成为了当下最炙手可热的技术趋势之一。
那么在云原生的时代大潮之下,数据库领域未来将面临怎样的技术发展趋势?作为企业用户又应该如何加以应对?
数据库的“四化”趋势
作为数据库领域一年一度的行业盛会,2023数据技术嘉年华于近日在北京召开。阿里巴巴集团副总裁,阿里云数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞在嘉年华上发表了以“一站式、全场景数据管理与服务”为主题的演讲。
李飞飞表示,近年来,云原生数据库领域发生了系列深刻变革。面对云原生的迅猛发展,阿里云数据库率先提出了主导未来数据库发展的核心“四化”趋势:
1、云原生化:基于基础服务构筑服务,使用户从购买资源向购买能力转变,加速数据业务上云,例如资源解耦、Serverless等能力;
2、平台化:基于云平台提供一站式数据管理与服务,提供标准的OpenAPI体系,减少业务烟囱;
3、一体化:聚焦客户业务场景,通过多产品一体化体验,简化开发、管理和运维,避免数据搬迁,具体包括:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;
4、智能化:融合AI能力的数据库自治服务,提升运维效率与体验;数据库内置机器学习 (ML) 功能,无需移动数据即可进行模型训练、生成推理和预测。
李飞飞透露,阿里云数据库未来将全面拥抱并推进数据库“四化”趋势的演进与落地。就在不久前,阿里云还正式发布了自己的数据库品牌——“瑶池”,其在数据库领域的深远布局由此也可见一斑。“在中国古代传说里,瑶池是宝藏汇聚的地方,而在阿里云看来,数据就是最大的宝藏。因此阿里云数据库取名叫瑶池,其实也寓意着这里汇聚了无数的宝藏。我们希望以云原生的一站式数据管理服务,为用户提供更快、更稳、更安全、更好用的企业级数据体验和服务。”
从业人士要注重“四做”
身为数据库领域的从业人士,在面对“四化”趋势时应该如何应对呢?李飞飞认为一定要注重“四做”,也就是应该做好以下四个方面:
1、做深基础:这是为了承载云原生化、平台化的要求,一定要基于云的基础设施进行深度的软硬协同,创新融合,譬如基于智能存储硬件来做压缩,基于智能网卡去做卸载等等。
2、做强核心:聚焦核心产品,在云原生化、一体化这两方面发力,持续聚焦数据库内核引擎、系统架构方面的创新,不断提升引擎的处理性能,具体包括云原生HTAP、All in Serverless等。
3、做精场景:数据库发展到今天,已经不仅仅是传统数据库简单的读和写,客户业务对数据的要求,也随着数据价值的放大而越来越大。因此一定要结合具体场景去做创新和突破,譬如在游戏场景下要做合服、并服,看能否做进内核,而非要复杂应用去开发。
4、做好体验:从源头服务客户,统一标准API,做到体验高度一致,不同版本之间要互相兼容。
正是基于这样的深入洞察,阿里云打造出了云原生关系型数据库PolarDB(包括集中式版本和分布式版本),云原生数据仓库AnalyticDB,以及面向物联网、工业物联网打造的云原生多模超融合数据库Lindorm等一系列核心产品。如今以PolarDB为代表的瑶池数据库,已经拥有了全球领先的产品和技术,不仅获得了电子学会科技进步一等奖、浙江省科技进步一等奖,而且还获得了分布式数据库金融行业标准认证、信创认证等一系列的权威认证,中国市场份额遥遥领先。
像拼乐高一样搭建数据库
对于整个数据库领域而言,阿里云提出的“四化”趋势究竟意味着什么?
李飞飞表示,在“四化”的趋势下,未来的数据库可能就像拼乐高积木一样,每一个组件都可以从架构角度进行解耦、存储、计算,从而像拼乐高一样根据客户的应用需求快速组合起来,构建成为一个最能满足客户需求、应用场景的数据库,这就是阿里云瑶池认为云原生数据库的终级目标。
“对于数据库来说,‘四化’代表着未来的演变趋势。其中对于云原生化,业界都已经形成了共识,包括许多国内厂商也不得不开始发力云原生,因为这是大家公认的大势所趋;平台化是基于云平台做深度创新,基于硬件做压缩,包括提供标准的OpenAPI,以后可能有多达80%-90%的场景数据库交互都会交由机器来完成,实现对复杂应用的端到端处理;一体化以PolarDB为例,把数据库打通实现一体化,可以减少数据搬迁、数据孤岛、业务烟囱;最后在智能化方面,在数据库管理运维上,人工智能和机器学习功能的大量采用,其实都是自动化运维的体现。在数据库中支持模型化推理和数据处理,结合多模数据和数据导入,进行智能化应用,将会是未来的一大趋势。”李飞飞说道。
企业如何推进数据库“四化”
李飞飞指出,对于最终用户来说,数据库“四化”趋势的顺序,其实也就是推进的主次之分。在实现“四化”的过程中也要注意克服常见的痛点和问题:
1、基础设施云原生化:如今即便是金融等特殊行业,也希望能够在私有云上搭建自己的云原生数据库,而不是继续沿用传统数据库。因此企业在搭建基础设施的时候,要么选择云服务商已经做好的公有云,要么做私有化的基础设施也一定要云化,而不是采用老旧的传统IT架构。
2、数据平台化:如今即便是线下部署的企业,也都拥有在云平台上做运维管控的平台化思维,将资源池打通共享。因此企业应该将数据库团队做有机的部署和统一,打破数据孤岛问题,引擎之间要有标准统一的API,来支持数据的无缝流转和切换,最好还要有统一的数据管理平台。
3、业务决策一体化:一定要摒弃传统的软件采购模式,不要为单一产品做决策。在采购之前一定要总体衡量服务商的整体能力,端到端的多场景能力,选择立体作战能力强的服务商,而不是只在某个单点去做业务决策,否则后续带来的数据孤岛、数据封闭、业务烟囱等问题会越来越大。
4、关注人工智能:智能化已经有人脸识别、机器视觉等应用,虽然总体而言目前还处在探索和了解的早期阶段,但一定会是未来的大势所趋。企业一定要保持对人工智能技术快速发展的警觉和判断,思考自己的数据是不是能通过人工智能发挥更大价值。人工智能技术的不断进步,会带来数据处理能力的持续提升,而越来越多的数据又会进一步推动人工智能技术的训练和能力的提升,形成一个良性循环。因此未来数据业务化、业务数据化的趋势会越来越明显,企业一定要高度关注人工智能领域,选择有深入积累和长期投入的服务商作为合作伙伴。