奇点云DataSimba R4.9 LTS发布:稳定性加固,架构升级,142项功能上新

news2024/11/26 1:48:32

不久前,奇点云的数据云全系产品如期发布新一季商业化版本更新:

  • 数据云平台DataSimba:R4.9 LTS版发布,稳定性全面加固,功能上新;自R4系列起架构升级,封装底层复杂性,支撑上层快速构建数据模型与应用。
  • 数据存算引擎DataKun:R2.0发布,在安全稳定、智能运维、云原生、自主可控等层面均有优化。
  • 数据安全引擎DataBlack:R2.0发布,支持全域数据安全,内置行业模型,开箱即用。
  • 数据服务工具箱Simba Toolkits:SimbaTag(标签工厂)、SimbaMetric(指标工厂)成为独立版本,可搭载于企业现有数据平台之上,为标签管理、指标管理提效。

本文聚焦DataSimba,解读稳定性加固、功能上新及架构升级。

 

稳定性加固,妥妥“企业级”

LTS,即Long Term Support,长期支持版。数据云DataSimba每个R系的最后一个版本,都作为LTS版发布。相较上一个LTS版(R3.8),DataSimba R4.9及DataKun R2.0进一步加固了稳定性,支持高可用、高并发、高效调度、高效运维

“企业客户使用DataSimba的深度和强度已不同以往。”奇点云合伙人、CTO地雷表示,“数据云必须具备足够的稳定性,方能保障数据全链路日常高效运行,基于业务需求产出结果。即便遇到故障、超负荷、误操作等情况,也能足够皮实不崩溃,及时反馈并定位问题,甚至能提前智能化给出预警,规避对业务的影响。”

在“企业级”标准要求下,本次更新主要围绕以下5项专题,开展稳定性优化:

(1)调度更智能、更可靠

DataSimba R4.9进一步优化了调度策略以及调度通讯框架,让调度更智能,有效减少“塞车”,保障系统稳定运行。

具体而言,我们分离了业务调度和资源调度,让彼此的职责更清晰、策略更易扩展,并结合实际业务场景,深层优化了通讯协议。优化项包括:

· 业务调度:基于任务特点进行了队列的拆分,在同一队列下再结合优先级、项目、租户、任务数、任务配置等进行综合打分,从而判断队列分发的顺序。

· 资源调度:基于节点并发数及负载程度进行即时的精准调度,大大提升任务执行的效率,实现负载均衡。

· 调度通讯框架:对通讯协议以及包的大小、发送、接收策略等多维度进行了深度优化,整体通讯性能提升了30%以上

(2)应用100%支持高可用

DataSimba R4.9内所有业务应用及中间件,均支持自动化的故障恢复与容错实现。在出现故障、失效等问题时,系统将继续正常运行并提供服务。

· 所有的业务应用都基于Kubernetes管理,同时支持多实例集群部署。

· 包括Redis、Kafka、K3s、Nacos等在内的所有中间件均支持高可用部署,业务代码已全部适配完成。针对部分中间件,我们也已完成版本升级,来进一步提升组件的可靠性和安全性。

(3)全方位监控告警

监控告警是稳定性重要的一环,方便事中事后快速发现与定位问题。DataSimba R4.9从业务、应用、中间件、服务器等多个维度,实现了监控告警全覆盖。

· 针对业务异常,依托自研的实时告警系统,基于业务指标采集和规则配置,可通过邮件、短信、钉钉等多渠道监控告警。

· 针对运维异常,采用现有成熟的告警平台,对Java虚拟机、线程池、内存、CPU、磁盘、网络等多维度实现全方位的监控与告警。

(4)引擎核心组件全量压测

在DataSimba底层,数据存算引擎DataKun也要足够稳定。

在本轮更新,数据存算引擎DataKun的核心组件完成全量压测,包括YARN、HDFS、Hive、Spark等在内的所有核心组件稳定性及性能均得到了充分验证。

压测基于DataSimba标准版的配置进行(专业版、旗舰版性能比标准版更高)。我们采用单压、混压的方式对DataSimba做假设性压测与功能验证。并结合压测结果数据,对组件进行配置调优,进一步提升集群的整体吞吐能力。

(5)系统破坏性测试

为了保障系统在极端场景下的可用性,DataSimba R4.9做了比R3时期更为严格的破坏性测试。

所谓破坏性测试,简单来说就是当面对异常、组件不可用等情况时,系统能否“稳住”,给出正确反馈——事实上,破坏性测试不仅会考察系统的监控告警能力,更考察系统自愈的能力及数据状态的一致性。

在完成应用破坏、中间件破坏、DataKun组件破坏等等多个场景的破坏性测试后,我们在本轮更新做了如下优化:

· 优化监控告警机制,出现组件异常时立即触发通知;

· 优化前端提示,出现故障时直观展现报错,便于用户定位问题;

· 增加重试策略,当组件恢复后系统可以自愈运行,减少人工干预;

· 迭代任务巡检机制,在极端情况下也能保障任务状态的一致性。

功能上新,从容应对复杂场景

相较于上一个LTS版本(R3.8),DataSimba R4.9 LTS共上新142项新功能,优化了113项功能,提供了32项问题的修复补丁,并基于用户研究进一步迭代了交互设计。

篇幅所限,本文仅简单介绍其中3项亮点功能,更详尽的Release Notes可以向您的客户成功经理、产品技术顾问了解。

  • 支持多租户,既安全又集约

DataSimba R4.9支持多租户,用户可以在DataSimba的一个工作空间(Workspace)里,为多个团队开设租户(Account),提供相互独立的空间,实现资源隔离。

基于多租户体系,企业的数据团队将以“平台”身份服务更多部门,合理优化资源利用,而不再出现多团队互抢资源的情况,也免去了各团队自行运管数据基础设施的烦恼。

为匹配多租户体系,我们采用了双层身份认证、双层权限校验、双层存储加密,来保证租户资源的强逻辑隔离与数据安全。同时,通过动态的权限管控,DataSimba R4.9支持租户间数据安全共享,而无需数据迁移成本。

 

  • Task/Job双层混合调度,提高执行效率及资源利用率

DataSimba R4.9采用Task/Job双层混合调度,任务(Task)与作业(Job)级别调度互相配合,以完成任务调度及资源分配。

其中,任务(Task)负责决定任务在可用资源上的调度顺序,控制任务的调度周期;作业(Job)则通过与Quota(空间域里的其中一个对象)配合,完成底层资源的调度与优化。

在双层混合调度体系中,我们加入了“潮汐车道”等调度策略,可由企业用户按需选择。例如,可以周期性调整资源,来平衡高峰期、低峰期资源的分配利用,也可以预留一定资源,确保高优先级任务完成。

  • 配置图引擎,支持图数据处理与图算法优化

DataSimba R4.9配置了图引擎(Graph Engine),支持用户通过DataSimba存储、管理、分析大规模的图数据,开发交互式的图计算作业,以及处理复杂的图算法。

以OneID场景为例,基于奇点云自研的“大规模多引擎混合调度技术”,我们采用了“流批图一体”架构——结合实时计算、离线计算、图计算三种引擎的能力,批处理的图计算结果对流计算的结果进行修正,再以API的方式对外(例如对分析云产品)提供服务。

业内独家的技术架构让奇点云全域OneID方案在计算性能、复杂场景计算及可解释性上均具优势。其中,图计算的高效图遍历和关联操作能力有效提高了海量多端用户融合分析的准确性。

架构升级,让数据模型与应用构建更简单

DataSimba R4与R3系列在架构上有极大不同。DataSimba R4.9(包括自R4.0以来的所有产品版本)在架构上分为3层,自上而下分别为:

- Simba Toolkits(数据服务工具箱):包含SimbaMetric(指标工厂)、SimbaTag(标签工厂)等多种效率工具,内置科学的数据工程方法论,帮助数据工程师提升数据资产研发效率。

- Simba IDE(数据云集成开发环境):提供离线同步、实时同步、监控告警、资产地图等功能,满足从数据集成到开发、运维及服务等全链路场景。

- Simba OS(云数仓内核):根据“资源抽象,接口统一”的原则,将一系列复杂的业务对象抽象为7个域、32个对象,向上支持数据业务。例如,“分级多域”、“多租户”业务数据逻辑隔离能力的实现,就得益于空间域中的工作空间对象、项目对象和项目成员对象;又如,要实现一个去中心化的DAG任务调度中间层及调度实例化,则需要利用任务域中的作业对象、任务对象和实例对象。

基于全新的架构,DataSimba以Simba OS为核心向下封装多引擎、多依赖、多云、海量多源异构数据等带来的复杂性,并基于统一的平台,向上(应用层)以API的方式提供标准能力,帮助用户简化数据模型/应用的研发过程。

伴随架构升级,整体后端服务资源消耗更少、分配更合理,一套新环境所需的最低服务资源也进一步得到削减。

 

为什么要升级架构?

越来越多企业客户正在走向数字化深水区,数据模型、数据应用建设的需求也越来越高频。DT部门需要从原本“接需求”的角色向“平台”角色转型,向各个组织单元提供数据能力,适应不同业务对数据使用的要求。

如果不解耦底层建设与数据业务、抽象底层能力,不仅难以快速响应高频的需求,重复造轮子,出现烟囱式建设,数据系统也会伴随企业使用而不断“加重”,扩展能力和技术升级受限。

因此奇点云基于对数据全链路各环节的理解,及过去多年实践的几百个项目,抽象出了7个域共32个对象。详尽准确的对象加上对象之间的关联关系,构成了Simba OS。Simba OS以简单、标准的RESTful API对外提供能力,从而解耦复杂的底层体系与多变的上层业务,来应对不同环境、不同数据业务场景的需求。

地雷介绍,对象的属性和行为可以被继承、更新、扩展及复用。每当需要支持一种新的数据业务场景,DataSimba的用户都可以像拼乐高积木一样,基于Simba OS快速搭建数据模型/应用,而规避底层重复建设、定义不一致、大数据引擎及IaaS对接难度高等问题。

“其实,我们的指标工厂SimbaMetric、标签工厂SimbaTag、数据安全引擎DataBlack就是基于Simba OS‘搭建’出来的,与DataSimba体系天然打通,且能同步享受DataSimba底层所有的能力升级。”

目前,DataSimba R4系列已在数十家企业级客户得到使用,其中不乏客户数据团队基于Simba OS自建数据应用的案例。

期待成为您的理想选择!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/716032.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

git代码合并merge与rebase

一、概述 1.区别 Merge具有更高的可追溯性 保留真实的历史,而Rebase则更整洁且易于审核。 rebase:不会有单独的commit合并记录,直接将分支中的所有commit排到master的记录之后。 merge:将在子分支的所有提交记录成一次commit,作为单独的一…

机器学习实战:Python基于LR线性回归进行预测(十)

文章目录 1 前言1.1 LR的介绍1.2 LR的应用 2. weather数据集实战演示2.1 导入函数2.2 导入数据2.3 数据整体可视化2.4 训练模型2.5 预测模型2.6 评估模型 3.讨论 1 前言 注意这里的LR指的是Linear Regression,线性回归。而非逻辑回归Logistic Regression&#xff0c…

【QT】——TCP套接字通信

目录 1.基本概念 2.QTcpServer 2.1 常用接口 2.2信号 3 QTcpSocket 3.1构造函数 3.2 连接函数 3.3 接收数据 3.4 发送数据 3.5 信号 4.通信的过程 4.1服务器端 4.2 客户端 通信流程: 1.基本概念 QT是 C 的一个框架,并且里边提供了用于套接…

让你不再好奇ai绘画免费网站有哪些

你有没有想过成为一名画家,但是缺乏绘画技巧?现在有了 ai作画生成器,让你可以轻松地创作出绝美的艺术品!现在有很多ai作画的免费网站,但是这些网站大多数操作繁琐,不易上手。这时我们可以寻求一款趁手的ai绘…

【算法与数据结构】剑指 Offer 58 - II. LeetCode左旋转字符串

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:以例一为例,例一的字符串可以分为"ab" "cdefg"两个子串,首…

element Plus Select选择器实现查询搜索 下拉选择

这Select选择器用于哪里 怎么用? Select 选择器可以用于许多不同的场景,包括但不限于以下几个方面: 表单:Select 选择器常用于表单中的下拉选择字段,例如选择国家、城市、性别、职位等。用户可以从预定义的选项中选择…

软考:中级软件设计师:计算机体系结构,CISC和RISC,Flynn分类,指令流水线,吞吐率,效率

软考:中级软件设计师:计算机体系结构 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的…

Win10任务栏的天气怎么关闭?Win10任务栏的天气关闭方法

Win10任务栏的天气怎么关闭?Win10任务栏的天气功能可以提供即时的天气信息,方便用户随时获取当前和未来的天气预报。然而,对于一些用户来说,这个天气小部件可能并不是必需的,并且想要关闭它以腾出任务栏的空间。无论是…

工程师抓秃头总结卡尔曼滤波简单原理及收敛原因

1、关于矩阵的一些想法 有小伙伴看到矩阵就脑瓜壳疼,那是没有了解数学家为啥闲的没事要用矩阵呢,从来没有人说不用矩阵就算不了,矩阵最初我认为是数学家偷懒,因为写一堆方程字太多太长,所以用了简写的形式,…

【SAP-MDG】售前常见问题

在与甲方的交流过程中,常常会有以下几个问题 一、“为什么要上主数据管理系统?” 见:主数据管理的意义 二、“有了主数据管理机制,还要不要上主数据管理平台?” 主数据的管理机制是通用性的,我们在任何系…

【算法与数据结构】28、LeetCode实现strStr函数

文章目录 一、题目二、暴力穷解法三、KMP算法四、Sunday算法五、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、暴力穷解法 思路分析:首先判断字符串是否合法,然后利用for循环&#xff…

:hover悬浮在元素上方时,不出现黑边

给element plus的下拉菜单设置悬浮样式 .el-dropdown :hover{border: none;outline: none; } border:node 表示元素本身的边框没有了 outline:none 表示元素的轮廓线没有了

K8S集群管理

集群管理 1 集群管理1.1 节点管理1.1.1 令牌管理1.1.2 集群扩缩容1.1.3 集群升级1.1.4 证书管理 1.2 数据管理1.2.1 ETCD基础1.2.2 ETCD实践1.2.3 备份还原1.2.4 ETCD集群 1 集群管理 1.1 节点管理 1.1.1 令牌管理 学习目标 这一节,我们从 令牌基础、令牌实践、…

【Part 2】博物馆防刷票小程序接入无感验证--跳转式接入

前文在这里: 【Part 1】现在去博物馆都预约不上了,黑产多少有点疯狂了 前面这篇文章讲到目前博物馆的门票基本被黄牛薅没了,我们普通人只能通过黄牛去买票,并且讲到了预约小程序如何通过插件式接入无感验证。 这篇文章我们继续讲…

数据结构之 时间复杂度与空间复杂度

目录 1:什么是时间复杂度和空间复杂度 2:时间复杂度与空间复杂度求法 3:几个典型时间复杂度与空间复杂度的分析 1:什么是时间复杂度与空间复杂度 首先对于我们所写的程序来说,为了评估一个算法的好与坏我们需要通过…

用*打印一个空心三角形

通过找规律发现,有*的位置坐标是(0,3)(1,2)(1,4)(2,1)(2,5),三角形左边坐标…

Python爬虫使用代理IP的实现

使用爬虫时,如果目标网站对访问的速度或次数要求较高,那么你的 IP 就很容易被封掉,也就意味着在一段时间内无法再进行下一步的工作。这时候代理 IP 能够给我们带来很大的便利,不管网站怎么封,只要能找到一个新的代理 I…

软考:中级软件设计师:计算机存储结构,cache,局部性原理,RAM和ROM,磁盘结构和计算

软考:中级软件设计师:计算机存储结构 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的…

2023年铁矿石行业研究报告

第一章 行业概况 铁矿石行业是指从地壳中开采铁矿石,经过破碎、筛选、洗选等步骤,使其达到工业上可用的标准的一整套产业。这个行业涵盖了从开采到运输,再到冶炼和销售的全过程。它是全球制造业,尤其是钢铁工业的基础。 铁矿石的…

org.apache.commons(commons-csv)下载CSV增加BOM头

网络说明 代码说明 依赖 <!--https://mvnrepository.com/artifact/org.apache.commons/commons-csv--><dependency><groupId>org.apache.commons</groupId><artifactId>commons-csv</artifactId><version>1.8</version><…