在2024 OceanBase 年度发布会中,OceanBase 的创始人与首席科学家阳振坤进行了《云时代数据库的思考》的主题分享。本文为演讲实录。
亲爱的朋友们,衷心感谢各位莅临今天的发布会现场。今天是一个云的时代,我想与大家分享,我对于云时代数据的一些见解与思考。
1、云上数据库技术助力企业降本增效
当今时代,企业正遭遇着史无前例的挑战与机会,它们主要集中在两大领域:首先是增强业务运作效率,其次是缩减运营成本。对于云技术如何助力提升业务效率,想必大家已有所了解,那么今天我将简要探讨一下云技术如何帮助企业降低成本。
(一)资源池化复用,降低硬件成本
大部分企业的信息技术都依赖计算机,但计算机的利用率很低,CPU的利用率通常只有个位数。而云能把业务、技术汇聚到一起,形成一个大的池子,通过资源充分复用,将计算机的利用率提高1倍,用一份硬件的钱买到两份硬件。无论对云厂商还是用户,利润都非常大。
(二)云上服务,降低人力成本
为了给客户提供更优质的数据库服务,我们往往需要现场进行系统评估、运维开发等,以确保能够更好地满足客户需求。但是现场服务往往将大量时间消耗在路上,假如能够在云端连接网络,将会高效解决这一问题,从而显著节省时间并提高效率。
2、多机、多云、多模是云时代数据库的发展方向
得益于云技术、云业务的快速发展,云数据库也迎来了发展机遇。全球数据库排行榜中,有两家是纯粹云的厂商。伴随着迅猛的增长势头,云数据库的发展也存在着一些问题,我自己把这些问题总结为三个词:单机、单模、单云。
(一)单机部署浪费硬件资源
经过半个多世纪的发展,目前主流数据库还是单机系统。今天,单个物理机很难处理海量数据。以CPU为例,在物理层面,CPU是一台一台的机器,当需要分配使用时,会出现类似内存碎片化的问题。假如我们有5台机器,想在一台机器上申请5核或6核CPU,虽然整个系统的资源还有很大的富余,但却无法申请CPU资源。而分布式可以用5核或6核CPU解决6核或7核CPU的问题,在云上对企业的价值就是降低企业成本,即通过池化和复用,提升资源利用率。
(二)单模处理耗费时间精力
大数据库时代,数据库系统里有太多的数据。做事务处理需要用事务处理数据库,做分析处理需要用分析处理的数据库,做文档需要用文档处理的数据库等。客户需要花费大量的时间、精力和成本,在各个系统之间做数据同步,把数据从交易数据库同步到分析数据库,再同步到下游大数据平台上做进一步处理。就像手机的音乐效果没有音响好、视频效果没有影院好,但是没有人会随身携带专业音响和影院,而是通过一部手机集成这些功能。
(三)单云部署面临面临业务风险
今天很多云厂商为我们提供数据服务,但每个云平台的数据库本质上只能在该云平台内部流转,而客户却需要更多选择。比如需要购买所在地域的云服务,或者出于容灾的考虑需要跨云部署。同一个业务系统部署在两朵云上,会出现 MySQL 兼容性的问题,这将给业务带来巨大的风险。
毫无疑问,云已经成为这个时代的主旋律。而云之所以发展迅猛,是因为它便捷、易用、高效的特性,通过资源池化与复用,降低了企业成本,但是云在数据库领域,发展空间仍然受限。
虽然单机、单模、单云在大多数业务的应用场景下存在很多缺陷,但是就像历史发展中其他工具的变革一样,交通工具最早由马车走到汽车时,马车厂商希望延长马车的生命周期;今天汽车从燃油车走向了新能源时代,同样事情也在正在上演。
数据库领域也是如此。从单机数据库走向分布式数据库,从单模数据库走向多模数据库,从单云数据库走向多云数据库,这是一个不可逆转的历史趋势。