商业化三年,OceanBase在忙什么?

news2025/1/17 6:08:03

文|刘雨琦

2020年,国产数据库厂商OceanBase(以下简称OB)商业化的第一年,只有18个客户。

如何打开局面,让这个从蚂蚁场景中走出来的数据库活下去,并进入到更多的场景里,发挥更大的价值,是OB当时最迫切的问题。

“开局是没那么容易的”,OceanBase  CEO杨冰对光锥智能坦言。对每一个企业而言,都面临着这样的选择:技术是根本,产品是核心,但商业化却关系着生死存亡。

事实上,光锥智能曾探访过多个国产数据库厂商。他们往往都经历着技术、产品、商业化的“不可能三角”:选择开源数据库,产品会很快成型,商业化也能同步落地,但技术没有竞争力,在服务客户的过程中往往会后劲乏力;如果选择自研,则将经历漫长的研发周期和冷板凳,也将面临着后续产品化和商业化的难题。

“在前几年,我们知道做不了太多,核心以金融和运营商这种大型且具备全球性、可复制性的行业为主,做好深耕和攻坚,这是我们在资源上的取舍”,杨冰讲道。

践行“重点突破,规模复制”的策略,让OB在2023年迎来了商业化奇点。11月16日,在OceanBase2023年度发布会上,杨冰公布了OB最新的商业化进展:“三年多前我们成立公司的时候只有十几个客户,三年多后的今天有超过1000个客户,而且这个数字在快速增长之中。”

商业化爆发的背后是13年的纯自研和产品化的成熟。会中,OB围绕“一体化”产品战略,发布一体化数据的首个长期支持版本OceanBase4.2.1LTS,并进一步提升列存性能,同时也从金融行业迈出一只脚,在千行百业中留下脚印。

从集中式到分布式、从边缘系统到核心系统,2023年国产数据库生态在经历着时代的变迁。这背后不只是OB一家企业的成绩单,更代表整个中国企业对分布式数据库从怀疑到尝试,再到信任的发展历程。

从场景中来,到产业中去

每每谈到OB的自研之路,杨冰都会讲到全球数据库发展经历了20年的空窗期。

80年代初期,今天全世界主流的关系型数据库排着队地诞生,到了90年代,又冒出了两个开源的关系数据库,但是在本世纪20多年来,全世界再也没有出现新的关系型数据库。

在“断档”的20年里,互联网兴起、移动互联网爆发,但全世界再也没有出现新的关系型数据库,不是因为没有需求,而是没有新的场景。

杨冰对此解释道:“数据库本身是一个场景驱动的技术,使用场景上没有形成代际跃迁的变化,也就没法对现有数据库的能力和架构产生太大的推动力。”

我们都知道,科技企业的技术往往分为两类:一种是从实验室走出来的技术,不断突破功能和性能的极限,没有最快只有更快;另一种则是从产业中走出来的技术,贴近客户需求,不断打磨,没那么“酷炫”但却非常实用。

显然,想要做好数据库,就必须贴近场景、贴近用户、贴近产业,这是一条几乎不可选择,却少有人能够“活下来”的路。

“开源的产品化简单,自研更难,但我觉得这样的系统很难有长久的竞争力,核心代码不掌握在自己手里,客户的深度需求就没有办法满足。”阳振坤讲到。

从这个角度来看,早在2010年,OB做出全自研决定的那一刻,就埋下了商业化的引线。

纵观OB的技术体系,会发现每一个技术特征都是从客户的需求出发,经过不断打磨,做深做精后的结果。

当OB开始独立面对市场上形形色色的企业级客户,便发现从集中式替换到分布式,客户并不担心分布式数据库本身,而是更在意平滑迁移的过程。

而这个过程是极为精细而复杂的工作,杨冰将这个过程比做“心脏搭桥手术”,首先要确保稳定可靠、可并跑、可回切,同时核心系统往往也是数据的中心枢纽,需要让新的数据库也融入原来的数据库。

为了保证平滑迁移,OB向上适配了5大类的数据库,包括Oracle、MySQL等传统数据库,也包括10+云上云下的数据库,向下通过Canel、Flink、DTS等比较常见的数据同步工具打通了上下游的数据处理软件,让其无缝地跟数据架构进行对接。

另一方面,一旦开始进行核心系统的大规模替换,成本是绕不开的。据杨冰透露,目前已经有大大小小的客户all in OB,或者70%的业务系统都跑在OB上,当数据库承载的业务量变大、规模变大、系数变多后,如何高效利用好每一份资源一定是企业最重要的目标。

比如OB采用了多副本备份的技术来保证数据一致性和稳定性,但多副本往往会对存储成本提出更高的要求。于是,OB采用LSM-Tree的架构把数据分成了基线数据+增量数据的形式,多副本之间共享一分基线数据,最终可以做到只有接近一分数据的存储成本,

当然,包括HTAP引擎、高于通用标准的“五地三中心”、单机一体化的产品架构,也皆是OB这十三年“趟河”摸过的石头。正如杨冰所说,“一个关系型数据库不是开发出来的,更多是用出来的。”

从淘宝中诞生、支付宝中历练再到产业中打磨,技术能力,从场景中来到产业中去。

究竟何为一体化?

金融行业客户有个特点:极为在意效率和极致的性能。高效、简洁是金融级数据库的“魔鬼集训必修课”。红塔银行内部就曾反馈道:“精密不复杂才是常理,架构本该简洁”。

在这样的背景下,产品化繁为简,尽可能做到一体化,是OB的核心思路。

2022年,OB发布了业内首个单机分布式一体化架构的数据库:小鱼,这意味着客户不再需要集中式分布式“二选一”,小鱼可以随意切换,小到个人站点、大到银行核心系统、巨型电商网站,都可以在业务发展的不同阶段选择适配自己的高性价比方案。

据OceanBase CTO杨传辉回忆:“13年前我加入OB团队时,业界很流行开源的MySQL,但MySQL有两个问题,只能处理简单查询,不能处理复杂查询;只能处理小数据量,很难做扩展。我们希望OB的数据库能兼具这两方面的能力”,这可能算得上是OB做一体化初心之一。

当互联网开始极速发展背后产生的数据,需要用EB作为单位计算,截止2022年底我国数据存储量已达724.5EB,这意味着如今数据量的“大”和40年前Oracle诞生时理解的“大”,早已不在一个量级。

同时,随着大量的中小企业涌进数字化大军,数据库不仅要大,更要小,弹性伸缩的能力成为对数据库性能的一项核心考验。OB诞生的第一个大型实战场景,便是支持双11,在10余个双11的历练下,可以进行秒级扩缩容,并提供租户级弹性和集群级弹性的多级弹性扩缩容能力,支持弹性水平或垂直的无中断缩容。

单机分布式一体化架构数据库的出现,也为OB打开了新的商业化思路。分布式数据库是大型企业的核心业务负载过重,集中式数据库性能无法满足时的产物,但小鱼的出现,让中小企业得以在业务早期就可灵活选择,并为后续业务体量爆发做准备,不必经历大规模迁移的过程。

2023年,OB从一体化架构演进成了一体化数据库、一体化产品,“一体化”的思路贯穿始终。

杨传辉介绍到,一体化的思路就像盖房子,单机分布式一体化架构如同地基,主要解决数据规模的问题,不管数据量级如何,都能通过一套系统统一解决。在一体化架构的基础上,是进一步搭建一体化引擎,如同房子的钢筋铁骨支撑起来的架构,包括一体化存储引擎、一体化事务、一体化的SQL引擎,主要解决数据的存储和计算问题。

一体化引擎之后,进一步搭建产品,即房子本身。产品解决如何给客户提供数据服务的问题,包括支持多种工作负载、实现多种数据模型、多种数据接口和兼容模式等等,这样的一体化思路,用一个数据库几乎能解决80%的问题。

但需要注意的是,这里的一体化思路并不是指“一款产品打天下”,而是一个兼具易用性和实用性的解决方案。

杨冰进一步阐释了“一体化”的理念:“一体化本质上一个具备关键业务负载支撑能力的数据库,在特殊的专业场景中我们认为还是需要专业数据库。好比手机解决了大部分问题,但还是会有人买单反、游戏机,还会有人去电影院。”

究其根本,核心仍然是从客户的需求和场景出发,做有选择、有取舍和有价值的一体化。

从18到1000+

从18个用户到1000+用户,杨冰告诉我们,除了内部产品打磨成熟进入新周期后,外部有三个阶段的核心变化。 

一如同导语中所言,OB在商业化的最开始,选择了大型可规模化复制的行业,如金融、运营商、政务等,三年内几乎所有的路都走了一遍,开始出现规模化复制的迹象;二是在2021年将部分内核系统进行了开源,开源生态的培养需要过程,但对客户数量的贡献十分明显,因为客户没有商业成本,而且OB的口碑让客户敢用于生产;三则是对云上资源的投入和倾斜,2023年整年,几乎饱和投入的方式,让客户数量有了明显的增长。

这三个变化代表了三个不同的方向。积累经验,是2B领域绕不开的过程。杨冰在会上也形象的讲到“2B是没有'魔法'的,都是做数据库的,不同的场景之间聊天可能都听不懂。”

在金融行业,全国目前有超过4000家大大小小的银行,大型机构、小型机构的需求、关注点并不同。大型机构的基础设施比较好,在性能要求上会比较高,关注点不仅是分布式架构,更是完整的解决方案和技术风险体系,同时大型机构的数据量大、基础设施也较为多样化和复杂,这要求OB具备更强的兼容性。

而小型金融机构,首先需要的是数据库分布式的能力、平滑迁移的能力,无感使用和低成本更为重要,且更依赖于服务和培训,因此,OB联合了多家主流银行应用ISV,有上百人参与到金融行业的交付运维中。

而通过服务各类客户后积累了较为全面的能力体系,以适配千行百业的各类场景。但杨冰也坦言到:“不是做了金融级数据库,所有行业都能做。”

首先外部商业化环境中,基础设施的情况就千差万别,有些行业是非常传统的集中式用法,升级确实需要一些时间。另外每个行业都有一些特殊场景,大家看重的性能也不同,比如金融客户很在意宕机时间和故障修复,严格控制在8秒以内,但制造业可能不要8秒,30秒也可以,但是特别看重成本,比如游戏特别看重秒级回切、可以回档,不同行业有不同的需求。

“打入一个行业,就要把上上下下的生态都对接一遍,底层能力再好前期也没用,需要一些时间”,杨冰讲道。

但关键核心业务负载需要的几大基本功,在此前的3年、3大行业中得到了严酷的打磨。

过硬的基本功,虽然不代表能够更快,但却决定了能走多远。

从生态建设的层面来看,完善的服务商生态也是爆发的基础之一。2022年,OB发布了“珊瑚计划”,并已和头部最流行的100+ISV打造了340个联合解决方案,其中有20多个已经在其他行业中进行批量复制。OB的技术能力和产品能力通过合作伙伴和开源,正在进行裂变。

正所谓独行快,众行远。十年埋头技术,三年商业化探索之后,1000+客户体量,才刚刚为OB展开第二章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1228792.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【开源】基于Vue和SpringBoot的教学过程管理系统

项目编号: S 054 ,文末获取源码。 \color{red}{项目编号:S054,文末获取源码。} 项目编号:S054,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 教师端2.2 学生端2.3 微信小程序端2…

【Java】线程池源码解析

目录 一、线程池介绍 1.1、什么是线程池 1.2、线程池的工作原理 二、Executor框架接口 2.1、JDK提供的原生线程池 2.2、类关系 三、线程池核心源码分析 3.1、关键属性 3.2、状态控制 3.3、线程池状态的跃迁 3.4、execute方法源码分析 3.5、addWorker方法源码分析 3…

【LeetCode刷题日志】232.用栈实现队列

🎈个人主页:库库的里昂 🎐C/C领域新星创作者 🎉欢迎 👍点赞✍评论⭐收藏✨收录专栏:LeetCode 刷题日志🤝希望作者的文章能对你有所帮助,有不足的地方请在评论区留言指正,…

quinn源码解析:QUIC数据包是如何发送的

quinn源码解析:QUIC数据包是如何发送的 简介QUIC协议中的概念endpoint(端点)connection(连接)Stream(流)Frame (帧) 发包过程解析SendStream::write_allConnectionDriverEndpointDriver 简介 q…

【洛谷算法题】P5713-洛谷团队系统【入门2分支结构】

👨‍💻博客主页:花无缺 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 花无缺 原创 收录于专栏 【洛谷算法题】 文章目录 【洛谷算法题】P5713-洛谷团队系统【入门2分支结构】🌏题目描述🌏输入格…

项目自动化构建工具——make/Makefile

目录 一、概念 二、使用实例 三、原理 四、进度条程序 1、缓冲区问题 1、概念 2、\r和\n 2、代码编写 一、概念 一个工程中的源文件不计数,其按类型、功能、模块分别放在若干个目录中,makefile定义了一系列的规则来指定,哪些文件需要先…

第五篇 《随机点名答题系统》——抽点答题详解(类抽奖系统、在线答题系统、线上答题系统、在线点名系统、线上点名系统、在线考试系统、线上考试系统)

目录 1.功能需求 2.界面设计 3.流程设计 4.关键代码 随机点名答题系统(类抽奖系统、在线答题系统、线上答题系统、在线点名系统、线上点名系统、在线考试系统、线上考试系统),是基于php(8.2.11),Java…

迪克森电荷泵

迪克森电荷泵(Dickson Charge Pump)是一种电压倍增器电路,可以将低电压升高到较高电压,相对于其他电压升压电路,迪克森电荷泵具有较高的效率和较简单的电路结构。该电路的基本原理是通过电容和开关来实现电荷的积累和转…

上海亚商投顾:三大指数小幅上涨 HBM概念股全天强势

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 三大指数早盘窄幅震荡,午后集体拉升翻红,黄白二线走势分化,题材热点快速轮…

计算两个向量的叉积numpy.cross()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 计算两个向量的叉积 numpy.cross() [太阳]选择题 请问代码中最后输出正确的是? import numpy as np a np.array([1, 2, 3]) b np.array([4, 5, 6]) c np.cross(a, b) pri…

C#,数值计算——插值和外推,Laplace_interp的计算方法与源程序

1 文本格式 using System; namespace Legalsoft.Truffer { /// <summary> /// Object for interpolating missing data in a matrix by solving Laplaces /// equation.Call constructor once, then solve one or more times /// </summary> …

初刷leetcode题目(3)——数据结构与算法

&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️Take your time ! &#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️&#x1f636;‍&#x1f32b;️…

Go语言常用命令详解(二)

文章目录 前言常用命令go bug示例参数说明 go doc示例参数说明 go env示例 go fix示例 go fmt示例 go generate示例 总结写在最后 前言 接着上一篇继续介绍Go语言的常用命令 常用命令 以下是一些常用的Go命令&#xff0c;这些命令可以帮助您在Go开发中进行编译、测试、运行和…

《数字图像处理-OpenCV/Python》连载(44)图像的投影变换

《数字图像处理-OpenCV/Python》连载&#xff08;44&#xff09;图像的投影变换 本书京东优惠购书链接&#xff1a;https://item.jd.com/14098452.html 本书CSDN独家连载专栏&#xff1a;https://blog.csdn.net/youcans/category_12418787.html 第 6 章 图像的几何变换 几何变…

应用开发平台集成表单设计器系列之3——整体集成思路及表单设计器功能深度了解

背景 平台需要实现自定义表单功能&#xff0c;作为低代码开发的一部分&#xff0c;通过技术预研和技术选型&#xff0c;选择form-create和form-create-designer这两个组件进行集成作为实现方案。通过深入了解和技术验证&#xff0c;确认了组件的功能能满足需求&#xff0c;具备…

移动机器人路径规划(二)--- 图搜索基础,Dijkstra,A*,JPS

目录 1 图搜索基础 1.1 机器人规划的配置空间 Configuration Space 1.2 图搜索算法的基本概念 1.3 启发式的搜索算法 Heuristic search 2 A* Dijkstra算法 2.1 Dijkstra算法 2.2 A*&&Weighted A*算法 2.3 A* 算法的工程实践中的应用 3 JPS 1 图搜索基础 1.1…

V100 GPU服务器安装GPU驱动教程

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

计算机网络——物理层-信道的极限容量(奈奎斯特公式、香农公式)

目录 介绍 奈氏准则 香农公式 介绍 信号在传输过程中&#xff0c;会受到各种因素的影响。 如图所示&#xff0c;这是一个数字信号。 当它通过实际的信道后&#xff0c;波形会产生失真&#xff1b;当失真不严重时&#xff0c;在输出端还可根据已失真的波形还原出发送的码元…

JVM垃圾回收相关概念

目录 一、System.gc()的理解 二、内存溢出与内存泄露 &#xff08;一&#xff09;OOM &#xff08;二&#xff09;内存泄露 三、StopTheWorld 四、垃圾回收的并行与并发 五、安全点与安全区域 &#xff08;一&#xff09;安全点 &#xff08;二&#xff09;安全区域 …

数据结构【DS】树与二叉树的应用

哈夫曼树 树的带权路径长度最小的二叉树WPL 路径长度【边数】 * 结点权值n个叶结点的哈夫曼树共有 2n-1 个结点 哈夫曼树的任意非叶结点的左右子树交换后仍是哈夫曼树对同一组权值&#xff0c;可能存在不同构的多棵哈夫曼树&#xff0c;但树的带权路径长度最小且唯一哈夫曼树…