OpenMLDB 作为中国唯一的特征平台产品入选 2023 Gartner 研究报告

news2024/9/25 7:17:40

在国际权威咨询与研究机构 Gartner 发布的重要研究报告《The Logical Feature Store: Data Management for Machine Learning》(《逻辑特征存储:机器学习的数据管理》,下文简称报告)中,OpenMLDB 荣幸作为中国唯一的特征平台代表产品入选该报告。
file
该报告深刻剖析了当前机器学习应用在实际落地过程中面临的三大难题:全流程效率低、可复用性差、训练环境与生产环境不一致,从而解释了数据库特征平台的迫切必要性。考虑到研发特征平台所涉及的高度复杂性和资源占比的挑战, Gartner 坚信相对于企业自主研发,寻求外部采购尤其是购买集成特征平台的 MLOps 全方位数据库解决方案,是一种更具性价比的选择。在这一方面, OpenMLDB 以其卓越表现成功入选 Gartner 推荐的供应商名单,成为中国唯一入选的集成特征平台的 MLOps 数据库解决方案产品。此报告对渴望拓展机器学习业务规模的企业具有专业指导意义。

OpenMLDB:提供线上线下一致的生产级特征平台,实现每单位成本效能提升500%

Gartner 在其报告中强调了机器学习在实际应用中的挑战,即企业的机器学习团队通常不得不投入大量时间在解决数据问题上,而没有精力专注于实际的模型开发和优化,在这一过程中,还存在大量的特征定义不一致以及频繁的重复返工。 OpenMLDB 的研究也揭示了相似的现象:在人工智能工程实践中,企业的数据和工程化团队往往耗费了整体95%的时间和精力用于数据处理、特征校验等相关工作。

在没有 OpenMLDB 的传统方式下,实时特征计算上线通常需要经历以下三个步骤:(1)数据科学家离线使用SparkSQL 或 Python 开发特征脚本;(2)由于开发的离线脚本无法满足生产环境的需求,工程化团队需要将其基于不同的工具栈重新优化;(3)最后,需要对数据科学家开发的离线特征脚本和工程化团队开发的线上服务进行计算逻辑的一致性校验。整个过程涉及两组开发人员、两套工具栈,带来高昂的落地成本。
file
OpenMLDB 的目标是开发即上线,让数据科学家开发的特征脚本能够在生产环境直接上线。平台具备离线和在线两套处理引擎,其中在线引擎经过深度优化,既满足线上生产级需求,也通过一致性执行计划生成器自动保证线上线下一致性。使用 OpenMLDB ,机器学习应用在特征环节的落地仅包含以下两个步骤:(1)数据科学家使用 SQL 开发离线特征脚本;(2)通过一条部署命令,即可将特征脚本部署到线上引擎。这样在保证线上线下一致性的同时,成功实现毫秒级低延迟、高并发、高可用的线上服务。
file
因此, OpenMLDB 的最大价值是显著降低人工智能的工程化落地成本。对一个较大的业务场景, OpenMLDB 可以通过省去工程化团队的在线服务开发和线上线下一致性校验,将传统方式原有的6人月降低到1人月,实现每单位成本效能提升500%。

OpenMLDB X Akulaku:通过场景驱动,对 10 亿条订单进行窗口特征计算,成功实现4 毫秒延迟性能,节约资源保守估计400万以上

OpenMLDB 致力于解决 AI 工程化落地的数据治理难题,并且已经在上百个企业级人工智能场景中得到落地。其中 Akulaku 作为东南亚领先的互联网金融服务商,服务内容涵盖了电商全链路,应用场景包含金融风控、智能客服及电商推荐等。在以上众多场景中, Akulaku 都需要落地相应的 AI 应用。而对于电商金融这一领域,其往往对于特征计算环节有着极高的要求,要求线上部署具有低延时与高时效性,能尽可能反映新数据的实时特征计算,线下需求分析具有高吞吐量,与此同时还要保证线上线下的一致性。而在实际场景中,同时满足这三点并不容易。

对于这个难题, OpenMLDB 协助 Akulaku 针对性地构建了一套智能计算架构,将 OpenMLDB 的在线引擎嵌入模型计算层,离线引擎嵌入特征计算层,并通过场景驱动,在业务调用环节调用实时计算结果,成功对10亿条订单进行窗口特征计算,实现4毫秒延迟性能,节约资源保守估计400万以上。
file
除此之外, OpenMLDB 还帮助更多企业优化了其数据库架构,实现更好的 AI 场景落地。比如帮助唯品会将商品个性化推荐场景的特征开发迭代速度从5人天降低到2人天,带来特征开发迭代速度60%的提升。某头部银行反欺诈系统在离线开发、线上推理、自学习阶段都使用了 OpenMLDB 进行特征计算和管理,解决了困扰其已久的数据穿越、结果不一致问题,省去了昂贵的一致性校验成本。华为将 OpenMLDB 用于实时商品个性化推荐场景后,实现数据分钟级更新,小时级特征上线。未来, OpenMLDB 希望能帮助更多的企业解决数据及特征处理上的真实业务落地问题。

作为中国唯一入选 Gartner《The Logical Feature Store: Data Management for Machine Learning》报告的数据库特征平台代表产品, OpenMLDB 之后将持续打磨产品、优化性能,继续发挥自身在数据库特征平台领域的优势,力求将 AI 工作者们的时间从繁琐低效的数据处理中释放出来,助力企业实现更简单高效的机器学习应用落地。

相关阅读

  • OpenMLDB 官网:https://openmldb.ai/OpenMLDB
  • OpenMLDB GitHub 主页 https://github.com/4paradigm/OpenMLDB
  • OpenMLDB 文档 https://openmldb.ai/docs/zh/
  • 微信交流群
    file

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1439942.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vite项目配置根据不同的打包环境使用不同的请求路径VITE_BASE_URL,包括报错解决

vite环境配置可以看官方文档:环境变量和模式 | Vite 官方中文文档 创建环境配置文件 在项目根目录下面创建.env和.env.production文件,.env是开发环境使用的,.env.production是生产环境使用的。 .env文件: # 基本环境 VITE_APP…

PyTorch 2.2 中文官方教程(一)

PyTorch 秘籍 PyTorch 秘籍 原文:pytorch.org/tutorials/recipes/recipes_index.html 译者:飞龙 协议:CC BY-NC-SA 4.0 秘籍是关于如何使用特定 PyTorch 功能的简短、可操作的示例,与我们的全长教程不同。 PyTorch 原型示例 原文…

7机器人位姿的数学描述与坐标变

由上次刚体的空间转动直接切换为机器人相关术语。 1.机器人位姿的数学描述与坐标变换 1.1位姿描述 {B}相对于{A}的姿态描述用3x3矩阵表示为: 式中为三个单位正交主矢量,分别表示刚体坐标系{B}的三个坐标轴XBYBZB在参考系{A}中的方位,∠XBXA表…

单片机——FLASH(2)

文章目录 flash (stm32f40x 41x的内存映射中区域详解)flash写数据时 flash (stm32f40x 41x的内存映射中区域详解) Main memory 主存储区 放置代码和常数 System memory 系统存储区 方式bootloader代码 OTP区 一次性可编程区 选项…

MYSQL存储过程(含入参、出参)

1、创建库存表语句 -- eladmin.t_stock definitionCREATE TABLE t_stock (id bigint(20) NOT NULL AUTO_INCREMENT,quantity bigint(20) NOT NULL,PRIMARY KEY (id) ) ENGINEInnoDB AUTO_INCREMENT4101 DEFAULT CHARSETutf8mb4 COLLATEutf8mb4_bin; id为主键,便于…

YOLOv7独家原创改进:大核卷积涨点系列| Shift-ConvNets,稀疏/移位操作让小卷积核也能达到大卷积核效果 | 2024年最新论文

💡💡💡本文独家改进:大的卷积核设计成为使卷积神经网络(CNNs)再次强大的理想解决方案,Shift-ConvNets稀疏/移位操作让小卷积核也能达到大卷积核效果,创新十足实现涨点,助力YOLOv8 💡💡💡在多个私有数据集和公开数据集VisDrone2019、PASCAL VOC实现涨点 收录…

Elementplus报错 [ElOnlyChild] no valid child node found

报错描述&#xff1a;ElementPlusError: [ElOnlyChild] no valid child node found 问题复现&#xff08;随机例子&#xff09;&#xff1a; <el-popover placement"right" :width"400" trigger"click"><template #reference><e…

Linux介绍和命令使用

目录 目录 一、Linux简介 1.1 主流操作系统 1.2 Linux 发展历史 1.3 Linux系统版本 二、Linux安装 三、Linux 目录结构 四、Linux常用命令 4.1 基础常用命令说明 4.2 Linux 命令使用技巧 4.3 Linux 命令格式 4.4 进阶重点常用命令 4.4.1 拷贝移动命令 4.4.2 打包…

Linux下库函数、静态库与动态库

库函数 什么是库 库是二进制文件, 是源代码文件的另一种表现形式, 是加了密的源代码; 是一些功能相近或者是相似的函数的集合体. 使用库有什么好处 提高代码的可重用性, 而且还可以提高程序的健壮性;可以减少开发者的代码开发量, 缩短开发周期. 库制作完成后, 如何给用户…

【原创】Qt库open62541 MinGW编译

一、前言 为了统一公司的驱动层开发&#xff0c;准备采用OpcUA的方式转发底层数据&#xff0c;而服务器有Windows Server&#xff0c;也有CentOS&#xff0c;因此想用Qt开发一个基于MinGW的OpcUA Server&#xff0c;这样就能跨平台部署。这里记录一下&#xff0c;希望对你也有用…

【人工智能】人工智能 – 引领未来科技的潮流

写在前面 引言红利挑战结论 引言 人工智能是指使计算机系统表现出类似于人类智能的能力。其目标是实现机器具备感知、理解、学习、推理和决策等智能行为。人工智能的发展可以追溯到上世纪50年代&#xff0c;随着计算机技术和算法的不断进步&#xff0c;人工智能得以实现。 今天…

在C++的union中使用std::string(非POD对象)的陷阱

struct和union的对比 union最开始是C语言中的关键字&#xff0c;在嵌入式中比较常见&#xff0c;由于嵌入式内存比较稀缺&#xff0c;所以常用union用来节约空间&#xff0c;在其他需要节省内存的地方也可以用到这个关键字&#xff0c;写一个简单程序来说明union的用途 struc…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Stepper组件

鸿蒙&#xff08;HarmonyOS&#xff09;项目方舟框架&#xff08;ArkUI&#xff09;之Stepper组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、Stepper组件 鸿蒙&#xff08;HarmonyOS&#xff09;仅能包含子组件StepperIte…

SpringBoot和SpringMVC

目录 一、springboot项目 &#xff08;1&#xff09;创建springboot项目 &#xff08;2&#xff09;目录介绍 &#xff08;3&#xff09;项目启动 &#xff08;4&#xff09;运行一个程序 &#xff08;5&#xff09;通过其他方式创建和运行springboot项目 二、SpringMVC…

java学习06---方法

一 方法 方法&#xff08;method&#xff09;是程序中最小的执行单元 注意&#xff1a; 方法必须先创建才可以使用&#xff0c;该过程成为方法定义 方法创建后并不是直接可以运行的&#xff0c;需要手动使用后&#xff0c;才执行&#xff0c;该过程成为方法调用 二 方法的…

搭建macOS开发环境-1:准备工作

请记住&#xff1a; 最重要的准备工作永远是&#xff1a;备份数据 !!! 通过图形界面检查 Mac 的 CPU 类型&#xff1a; 在搭载 Apple 芯片的 Mac 电脑上&#xff0c;“关于本机”会显示一个标有“芯片”的项目并跟有相应芯片的名称&#xff1a; 通过命令行检查Mac的CPU类型 …

【Linux开发工具】yum命令详解

&#x1f4d9; 作者简介 &#xff1a;RO-BERRY &#x1f4d7; 学习方向&#xff1a;致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 &#x1f4d2; 日后方向 : 偏向于CPP开发以及大数据方向&#xff0c;欢迎各位关注&#xff0c;谢谢各位的支持 目录 1.概念2.yum的配置信…

Spring Cloud使用ZooKeeper作为注册中心的示例

简单的Spring Cloud应用程序使用ZooKeeper作为注册中心的示例&#xff1a; 1.新建模块&#xff1a; 2.勾选依赖&#xff1a; 3.在pom.xml文件中做出部分修改及添加Spring Cloud Zookeeper 依赖版本&#xff1a; 完整pom文件 <?xml version"1.0" encoding&q…

FlinkSql通用调优策略

历史文章迁移&#xff0c;稍后整理 使用DataGenerator 提前进行压测&#xff0c;了解数据的处理瓶颈、性能测试和消费能力 开启minibatch&#xff1a;"table.exec.mini-batch.enabled", "true" 开启LocalGlobal 两阶段聚合&#xff1a;"table.exec.m…

如何修复Mac的“ kernel_task” CPU使用率过高的Bug?

当计算机开始缓慢运行时&#xff0c;这从来都不是一件有趣的事情&#xff0c;但是当您弄不清它为何如此缓慢时&#xff0c;甚至会变得更糟。如果您已经关闭了所有程序&#xff0c;并且Mac上的所有内容仍然感觉像是在糖蜜中移动&#xff0c;这可能是令人讨厌的kernel_task导致高…