云+AI 时代的 OceanBase

news2024/10/24 15:55:16

2024 年 10 月 23 日,OceanBase 年度发布会在北京成功举办。会上,CEO 杨冰表示,OceanBase将继续践行一体化产品战略,不断演进产品能力,从支撑关键业务负载的OLTP能力,到实时分析的AP能力,再到应对海量数据及大规模场景所需的多模能力。OceanBase正在不断打造面向多工作负载、多模及向量融合的一体化产品能力,以助力企业搭建现代数据架构,实现技术栈的简化。

本次发布会上,OceanBase 推出了两个里程碑版本OceanBase 4.2.5 LTS 版本,作为针对关键业务负载的全新长期支持版本,相较 4.2.1 LTS 版本在性能、稳定性和易用性方面都有显著提升,并在多模融合方面迈出了重要的一步。同时,发布面向实时 AP 场景的首个 GA 版本 4.3.3,对分析处理(AP)场景进行了大幅性能优化,特别是在海量数据分析时,显著缩短响应时间并提升吞吐能力。同时,4.3.3 引入了向量检索能力,通过向量多模一体化能力,极大简化 AI 应用的技术栈,帮助企业高效构建 AI 应用。

北京市经信局信息化与软件服务处处长赵祥伟为大会发表致辞,华东师范大学数据学院院长、 CCF 数据库专委会常委钱卫宁在大会伊始分享了中国数据库发展的机遇所在:今天是中国数据库产业发展和数字化转型最好的时代,目前国内数据库正朝着“数据赋能”目标前进,“One Size Fits a Bunch”正在成为趋势。同时,来自银行、保险、证券基金、运营商、零售、制造、互联网等行业的 40 余位客户代表齐聚发布会,先后分享了OceanBase 在攻坚关键业务系统以及简化技术栈降本增效上的落地实践。

1、“专有云”+“公有云”双引擎,驱动 OceanBase 高速发展

在发布会上,杨冰公布了 OceanBase 的最新商业化进展:目前,OceanBase 以专有云、公有云两个业务场景作为发展“双引擎”,2024 年客户数已突破 2000 家,连续 4 年客户数增速超过 100%。

客户数从 2022 年的400+,到 2023 年的1000+,再到现在的2000+,OceanBase 已覆盖金融、政务、能源、运营商、交通、零售、制造、互联网等多个行业场景。在今天的主论坛上,来自交通银行、中国人保财险、中国联合航空和 T3 出行的客户代表分享了各自企业的数据库升级实践。

图片

图片

图片

图片

*图1-3依次为交通银行金融科技部高级专家黄颢、中国联合航空有限公司信息中心总经理冯振宇、T3 出行研发总监高建丰

*图4圆桌从左到右依次为钛媒体集团联合创始人&联席 CEO、ITValue 发起理事刘湘明、中国人保财险科技运营部副总经理张帆、中国联合航空有限公司信息中心总经理冯振宇、T3 出行研发总监高建丰、IDC 中国副总裁兼首席分析师武连峰

(一)专有云:全面构建现代数据架构,持续攻坚关键业务负载

作为“根自研”的原生分布式数据库,OceanBase 诞生于支付核心场景,历经十余年金融场景磨炼,从内部走向外部,在越来越多的金融核心场景中打磨产品核心能力,攻坚关键业务系统。

图片

杨冰介绍,在专有云领域,OceanBase 已实现从头部金融核心系统到中腰部金融机构的规模化复制,目前已服务全部政策性银行、5/6 国有大行,资产规模万亿以上银行客户超 20 家、千亿以上银行客户近 100 家,及 70% 头部保险、75% 头部证券、50% 头部基金公司。(*头部为TOP 20)

在下午的攻坚关键业务系统实践专场,中国太平洋保险数智研究院首席数据库专家林春、北京银行软件开发中心平台架构研发团队主管王子健、北京农商银行运行维护中心总经理王文志、稠州银行数据架构师赵忆痕、国泰君安证券资深数据库专家尚留金、阳光数智科技技术创新孵化产品团队负责人杨清华、河南移动高级专家彭庆军作为专有云客户代表分享了 OceanBase 在各自企业的攻坚关键业务系统的实践。

(二) 公有云:OB Cloud 简化技术栈,助力千行百业

2022 年,OceanBase 推出云数据库 OB Cloud,启动云数据库战略。作为一体化云数据库产品,OB Cloud 大大简化企业技术栈,与此同时,其采用的多云原生架构支持多基础设施,进一步提升了云上资源利用率和云上系统的稳健性与可用性。

目前,公有云业务已成为 OceanBase 的第二条增长曲线,在全球范围内提供一致的云数据库服务,OB Cloud 现已服务超过 700 家客户,客户数年同比增长 130%,尤其受到零售、制造、互金行业的青睐,成为包括小米、理想汽车、vivo、宝洁、海底捞、滴滴出行、携程等高增长公司的共同选择,诸多海外电子钱包如 DANA、GCash、PalmPay 等也都采用了 OB Cloud。2 年来,逐渐沉淀了传统数据库上云、高并发、HTAP 实时分析、多模一体化和多云容灾 5 个场景。

图片

在下午的云和 AI 时代的数据库实践专场,小米集团数据库专家崔春华、伯俊科技 CTO 陈雨陆、万家数科数据库专家马琳、海尔消金高级数据库架构师李兆、携程高级开发经理高帅锋、百词斩 CTO 敬宓六位客户代表围绕 OB Cloud 简化技术栈降本增效应用实践进行了精彩的分享。

(三)持续升级珊瑚计划,构建以合作伙伴为中心的商业生态圈 

过去一年,OceanBase 进一步升级珊瑚计划,让伙伴在前、OceanBase 在后,持续构建以“合作伙伴”为中心的商业生态。2024 年,OceanBase 的行业解决方案伙伴数增长 100%,热门解决方案规模化落地数增加 50%,伙伴签约占比达到 70%,由核心经销商伙伴带来的业绩贡献占比达 60%,由技术服务伙伴独立交付的项目占比超过 30%。

图片

在专有云领域,联合行业 ISV 打磨优秀的联合解决方案,持续攻坚关键业务系统,明年计划将伙伴独立交付项目占比提升至 50%。在公有云领域,构建公有云专家六大技术服务体系,实现每一个客户都有专属服务经理,同时实现全年 7×24 小时 5 分钟极速响应服务,确保服务可用性 SLA 达到 99.99%。

杨冰表示:OceanBase 的生态建设正在进入全新阶段,2025 年将继续深耕国内、共拓海外,坚持“被集成”战略,进一步加大攻坚关键业务系统、传统数据库上云和出海的生态激励,助力伙伴商业与能力双提升,携手业务开拓增长。

(四)开源开放,多维推动数据库内核关键人才体系

自 2021 年开源以来,OceanBase 同样在致力成为一个受开发者认可的开源数据库。2024 年,OceanBase 开放内核运维接口,参与国际开源项目合作,链接上下游 800 多款工具。截止目前已有 1000 多用户将 OceanBase 社区版用于实际生产系统,深入落地高并发、分库分表、实时数仓等核心系统场景,集群数突破 25000。

图片

在晚间的开源交流会上,OceanBase 开源生态技术部总经理封仲淹表达了对每一位用户的感谢,OceanBase 会持续拥抱开源,为开发者带来更好的体验。来自贝壳计算存储方向容器引擎团队负责人王天庆、陌陌 DBA 团队负责人冀浩东、快手数据库研发工程师梁盼作为开源用户代表与会畅谈了自己于开源从上手到进入生产实践的过程,进一步展示了 OceanBase 社区版正在被越来越多用户信任。

此外,在数据库内核关键人才培养方面,目前 OceanBase 已有超 4 万名数据库人才完成认证,累计数据库专家超 1500 名;与此同时,连续举办 4 届面向高校的 OceanBase 数据库大赛,已吸引海内外 3500 多支队伍的 6500 余人参加。

2、一体化产品再升级,打造 AI 时代的数据底座

(一)面向关键业务负载,OceanBase 4.2.5 LTS 发布

OceanBase 最新发布的 4.2.5 LTS 版本是面向关键业务负载的全新长期支持版本,性能、稳定性和易用性方面都有显著提升。相较 4.2.1 LTS 版本,Sysbench 基准测试中读写性能提升 26%,批量写入性能提升 54%,进一步增强了 OceanBase 在关键业务场景下的性能能力。

图片

在性能优化和优化器能力方面,4.2.5 版本引入了自适应链接和基线优先的 SPM 演进,通过分区表的晚期物化功能,优化了复杂查询处理能力。同时,优化器性能大幅提升,特别是在估行系统优化、DAS 路径选择改进、以及 CTE 抽取和 INLINE 代价验证等方面。此外,存储层引入了 Batch DML 批量接口,进一步提升了 DML 操作的效率,适用于多种业务场景。

在兼容性方面,4.2.5 版本针对 MySQL 兼容性,新增了租户对锁函数、非法日期、XA 事务和中间快速加列的支持,进一步确保 MySQL 业务平滑迁移的无缝体验。同时针对 Oracle 兼容性,租户层面新增了DBMS_LOCK 包功能,并支持快速删列和存储过程远程调用的复杂类型,进一步加强关键业务系统对兼容性的能力。

在系统的稳定性和可靠性方面同样获得了增强,4.2.5 版本新增了备份配置项功能,提升了数据备份的灵活性和可控性。通过日志强管归档、Transfer 活跃事务搬迁、以及基于 IO 负载的自适应仲裁升降级功能,提升系统在复杂业务场景下的容错能力和稳定性。、

在资源隔离与升级性能方面,4.2.5 版本优化了资源隔离机制,如将统计信息和Clog日志提交纳入资源隔离,并实现了 DDL 资源隔离,使多租户环境下资源分配更为合理。在多租户升级场景下,表级恢复和升级性能也得到优化,显著缩短了大规模租户的升级耗时,升级过程更加顺畅。

在安全性与易用性提升上,新版本通过 assume role 提升了对象存储访问的安全性,并新增了行锁等待和重试等待事件的诊断功能、响应时间直方图和日志传输链路视图,大幅提升了系统的可观测性和诊断效率。同时,Observer资源规格的动态修改实时生效,以及日志副本并行迁移优化,使DBA的管理操作更加便捷。

此外,OceanBase 4.2.5 扩展了其多模能力,新增了对 OBKV-Redis 模型的支持,进一步丰富了其生态系统。通过优化 ObHbase 的过期删除机制,解决了“热 key”场景下数据版本过多的问题,并新增了 ColumnPaginationFilter 和 Reverse Scan 接口,进一步提升了 HBase 兼容性。

总结来看,OceanBase 4.2.5 LTS 版本通过一系列技术和功能优化,巩固了其在关键业务场景中的稳定性、性能和兼容性,同时大幅提升了用户的管理体验和易用性。

(二)面向实时 AP 场景,OceanBase 4.3.3 正式 GA

在发布会上,OceanBase 推出面向实时 AP 场景的首个 GA 版本 4.3.3 。杨传辉介绍,4.3.3 版本在向量融合查询的关键能力上取得显著突破。针对 AP 场景进行大幅性能优化,推出全新向量检索功能,实现 SQL+AI一体化,深度融合 AI 与数据库处理,进一步满足客户在云+AI 时代的数据管理需求,加速 RAG、智能推荐、多模态搜索等业务场景的落地。

图片

在对多模态数据的支持层面,4.3.3 版本进一步扩展了对复杂数据类型的处理能力,新增 Array 类型,并对 Roaringbitmap 类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。

在向量融合查询能力上,4.3.3 版本新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过 SQL 及 Python SDK 等方式灵活调用 OceanBase 的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化 AI 应用技术栈,助力企业高效构建 AI 应用。

在多工作负载方面,4.3.3 版本对 AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离,确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。

与此同时在发布会上,OceanBase 与蚂蚁集团联合开发的向量库在业内标准的 ANN Benchmarks 基准测试中,针对 GIST-960 数据集表现出色。现场测试结果显示,该向量库性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。

(三)一体化数据库,打造 AI 时代的数据底座

随着 AI 技术发展,越来越多的 AI 应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于 IT 架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

杨冰表示:“伴随着互联网/移动互联网时代向 AI 时代演进,数据库也正从分散走向统一,一体化数据库将成为 AI 时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建 AI 应用,是 OceanBase 一体化产品战略在 AI 时代的核心思考。”

图片

会上,杨冰现场演示了“望小京”AI Agent Demo,请“望小京”推荐两公里内评分4.5以上、人均消费25元以内干净卫生的奶茶店。他介绍,这一Demo以OceanBase为数据底座,管理和处理结构化、半结构化以及非结构化数据,完成空间查询、关系过滤、向量计算等工作,为 AI 实时查询提供支持。

图片

“以往构建一个复杂的 AI 应用,需要依赖多个不同的数据库、管理非常复杂的技术栈,同时还需要一个经验丰富且规模较大的团队。”他介绍,正是因为 OceanBase 具备一体化能力,才得以通过一个数据库高效处理所有查询、并通过极简架构就可以完成数据管理和 AI 应用开发。以 OceanBase 为底座的“望小京”仅依靠几位工程师、用一周时间就开发完成。

未来,OceanBase 将成为蚂蚁集团 AI 数据新底座,支持 AI 生活管家“支小宝”、AI 金融管家“蚂小财”、AI 健康管家三大 AI 应用,及支付宝百宝箱智能体开发平台的数据管理。杨传辉表示:AI 天然拥抱云,OceanBase 作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与 AI 结合,满足客户在云+AI 时代的数据管理需求,期待未来 OceanBase 可以应用在更多云和 AI 场景。

3、感谢大家,明年再见!

正如 OceanBase 创始人&首席科学家阳振坤在年度发布会的思考:“云是这个时代的主旋律,之所以云得到巨大发展,是因为它天生具有的便捷、易用性,可通过资源池化、复用降低企业成本,可以说在今天的数据库领域,云仍然有很大的发展空间”。

图片

目前,OceanBase 的客户数已突破 2000+ ,生态建设正在进入全新阶段,正是每一位客户的攻坚实践,使 OceanBase 在众多真实场景中不断打磨,持续演进一体化产品能力,期待与更多客户携手并肩,共同攻坚关键业务负载,构建现代数据架构!

最后,感谢所有客户的信任,伙伴的支持,感谢今天在线下和线上,参会和关注我们的所有朋友,我们明年再见!后续我们会将发布会的演讲稿和一些精彩瞬间整理发布,敬请OceanBase官网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2222518.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity Apple Vision Pro 保姆级开发教程 - Simulator 模拟器使用

教程视频 Apple VisionPro Simulator 模拟器使用教程 Unity Vision Pro 中文课堂教程地址: Unity3D Vision Pro 开发教程【保姆级】 | Unity 中文课堂 ​ VsionOS Simulator 简介 visionOS Simulator 是一个用于开发和测试 visionOS 应用程序的工具。它模拟 Appl…

Return code 0x40450037 (Not a valid nxos image)

1.问题描述 硬件:C93180YC(Nexus NXOS) 软件版本:Release 9.3.8 需要描述:需要将Nexus93180从Release 9.3.8升级到10.3.6(M),在执行操作的时候,发现如下问题&#xff…

从0到1学习node.js(npm)

文章目录 一、NPM的生产环境与开发环境二、全局安装三、npm安装指定版本的包四、删除包 五、用npm发布一个包六、修改和删除npm包1、修改2、删除 一、NPM的生产环境与开发环境 类型命令补充生产依赖npm i -S uniq-S 等效于 --save -S是默认选项npm i -save uniq包的信息保存在…

[实时计算flink]基于Paimon的数据库实时入湖快速入门

Apache Paimon是一种流批统一的湖存储格式,支持高吞吐的写入和低延迟的查询。本文通过Paimon Catalog和MySQL连接器,将云数据库RDS中的订单数据和表结构变更导入Paimon表中,并使用Flink对Paimon表进行简单分析。 背景信息 Apache Paimon是一…

Elasticsearch如何搜索日志并存储

Elasticsearch 是一个分布式搜索引擎,擅长对大量数据进行实时的搜索、分析和存储。它常被用于处理日志数据,配合工具如 Logstash 或 Filebeat 来收集和存储日志,并提供强大的搜索和分析能力。接下来,我将解释 Elasticsearch 如何处…

8年经验之谈 —— 如何使用自动化工具编写测试用例?

以下为作者观点,仅供参考: 在快速变化的软件开发领域,保证应用程序的可靠性和质量至关重要。随着应用程序复杂性和规模的不断增加,仅手动测试 无法满足行业需求。 这就是测试自动化发挥作用的地方,它使软件测试人员…

NVR小程序接入平台/设备EasyNVR多个NVR同时管理的高效解决方案

在当今的数字化安防时代,视频监控系统的需求日益复杂和多样化。为了满足不同场景下的监控需求,一种高效、灵活且兼容性强的安防视频监控平台——NVR批量管理软件/平台EasyNVR应运而生。本篇探讨这一融合所带来的创新与发展。 一、NVR监测软件/设备EasyNV…

【设计模式】MyBatis 与经典设计模式:从ORM到设计的智慧

作者:后端小肥肠 🍇 我写过的文章中的相关代码放到了gitee,地址:xfc-fdw-cloud: 公共解决方案 🍊 有疑问可私信或评论区联系我。 🥑 创作不易未经允许严禁转载。 姊妹篇: 【设计模式】揭秘Spri…

vue2 el-select赋值无效(无法选中)

背景:点击添加明细时,el-table会新增一条数据,其中,存货原申购用途 会根据 费用承担事业部 下拉框的值改变而改变,所以每次费用承担事业部发生变化时,都需要清空存货原申购用途的值 最开始是直接这样写的&a…

D. Deleting Divisors

传送门:Problem - D - Codeforces 题意: 思路:博弈论 打表找规律( 递推 ) 如果 ans[i] 为 true ,则 Alice 能赢 ans[i] 为 false,则 Bob 会赢 数字 n 的一个因子 为 x , 如果 …

【简历】25届浙江某211大学JAVA简历:明明项目有货,但是长篇大论减分!!

注:为保证用户信息安全,姓名和学校等信息已经进行同层次变更,内容部分细节也进行了部分隐藏 另外:我们出这一系列校招简历指导的原因,就是看很多学生被忽悠,没有先定位大厂、中厂还是小公司,导…

【日志】力扣刷题——买卖股票的最佳时机 // Unity——添加数据表文件、EPPlus插件以及编辑器开发生成Excel转Json代码文件复习

2024.10.17 【力扣刷题】 两题连一起,思路很像 121. 买卖股票的最佳时机 - 力扣(LeetCode) 122. 买卖股票的最佳时机 II - 力扣(LeetCode) 121. 买卖股票的最佳时机 按照顺序查找,找到最大的差值时&#x…

Prompt-Tuning方法学习

文章目录 一、背景1.1 Pre-training1.2 Fine-Tuning1.3 高效微调(SOTA PEFT)1.4 基于强化学习的进阶微调方法(RLHF) 二、Prompt-Tuning技术2.1 发展历程2.2 Prompt模板构建方式 三、基于连续提示的Prompt Tuning四、Q&A 一、背…

【升华】一文从0到1到实际性应用大语言模型(LLM)

一、前言 相信网已经很多LLM大模型 的介绍 ,概念,发展历史,应用场景的很多文章,但是很多文章都是缺少细节的描述,到底怎么用,需要些什么东西怎么层显出来。所以虽然看了很多大模型的介绍,也仅仅…

【Linux篇】初学Linux,如何快速搭建Linux开发环境

文章目录 前言1. Linux背景介绍1.1 UNIX的发展历史1.2 Linux的发展历史 2. 企业应用现状3. 开源3.1 探索Linux源代码3.2 开源 VS 闭源 4. Linux的版本4.1 技术线4.2 商业产品线 5. os概念,定位6. 搭建Linux环境6.1 Linux环境的搭建方式6.2 购买云服务器 7. 使用XShe…

从一个简单的计算问题,看国内几个大语言模型推理逻辑能力

引言 首先,来看问题: 123456*987654等于多少,给出你计算的过程。 从openai推出chatgpt以来,大模型发展的很快,笔者也经常使用免费的大语言模型辅助进行文档编写和编码工作。大模型推出时间也好久了,笔者想…

红队-安全见闻篇(上)

声明 学习视频来自B站UP主 泷羽sec的个人空间-泷羽sec个人主页-哔哩哔哩视频,如涉及侵权马上删除文章 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负 一.编程与开发 1.后端语言学习 C语⾔:⼀种通⽤的…

[解决]在Arduino IDE 打开 ino 类型文件处于read only editor模式

今天打开一个ino类型文件发现这个问题,无法编辑…… 解决方法:右键点击ino类型文件(你打开的那个)进入属性栏 发现只读被勾上,取消打勾并点击最下方的确认 现在就可以编辑啦

Unity目录居然这么写就不会被引入到项目内

只要加一个小符号~ 这是一个约定俗成的符号么~~~~ 当然,代码管理器还是识别的 也,只要稍微加一些规则,去避免代码入库 只要一天不死,还是能在程序员这个座位上看到新的东西 什么时候才到尽头??&#xff1f…

服务器数据恢复—EXT3文件系统下邮件数据被误删的数据恢复案例

服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统EXT3文件系统。 服务器故障: 由于误删除导致文件系统中的邮件数据丢失。 服务器数据恢复过程: 1、将故障服务器中所有硬盘做好标记后取出,硬…