深耕文档型数据库12载,SequoiaDB再开源

news2024/11/25 2:35:18

1月15日,巨杉数据库举行SequoiaDB新特性及开源项目发布活动。本次活动回顾了巨杉数据库深耕JSON文档型数据库12年的发展历程与技术演进,全面解读了SequoiaDB包括在高可用、安全、实时、易用性四个方向的技术特性,宣布了2024年面向技术社区的开源计划。此次发布活动不仅是对SequoiaDB性能的全面介绍,更是对十余年来始终坚守以JSON文档型数据库内核为技术底座的发展历程的深刻回顾。不忘来时路,方知向何行,巨杉数据库也将在2024年新年伊始,迎来新的篇章,开启新的征程!

稳健发展,行业影响力不断提升

回顾过去,巨杉数据库自2011年研发内核、2012年公司成立,至2013年推出SequoiaDB v1.0版本,再到如今已走过十二个春秋。历经12年的洗礼,巨杉数据库也取得了令人瞩目的成就。目前,巨杉数据库已经在超过100家大型银行及金融机构的核心生产业务规模应用,覆盖各行业的企业用户总数超过1000家。在金融行业,其客户群体涵盖国有银行、股份制银行、省级农信、城商行、保险、证券等

金融机构,同时还积极扩展政府、汽车、新能源等多个行业客户,赢得了广泛的市场认可。其中超过50家企业的应用时间已超过6年,最长的系统运行时间甚至达9年。 自成立以来,公司实现稳健发展,行业影响力不断提升,数据量及业务接入保持持续增长态势。

守正创新,发展JSON文档型内核

巨杉数据库SequoiaDB以 JSON 文档型数据库内核为技术底座,通过分布式架构为众多客户提供了多元化的业务和全方位的支持。 正是因为对技术创新的坚持以及对市场需求的洞察,巨杉数据库始终坚守JSON文档型内核,在持续迭代中实现创新发展。

在JSON基础能力方面 ,从最初 v1版本,实现 CURD 原子性的操作以及基础的ACID支持,到 v2 版本逐步提升对LOB大对象的存储能力,标志着巨杉数据库具备“多模数据”处理能力,同时支持存储过程、聚集计算等特性。在 v3.0 版本中,进一步提供自增序列全文检索、基于时间点的数据恢复和兼容部分 Mongo 语法。跨越4.0版本,到v5.0 版本,SequoiaDB 着力提升稳定性能,对于统计信息、访问计划、存储等进行了大量优化,提供死锁检测等功能,并进一步地兼容 Mongo 3、 Mongo 4 的语法。

在分布式管理方面, 从基础的多分区原生分布式架构,逐步提供读写分离、主子表、策略访问、多中心容灾、精细化容灾等特性,持续增强分布式能力。 在安全性方面, 涵盖从基础的鉴权、加密到信创的各类能力。此外,推出了SCM内容管理引擎,专注于非结构化数据和多模数据处理的统一数据生命周期管理。 在易用性方面, 通过SAC运营的管理平台,全面提升DBA运维的便捷性。

十二年来,巨杉数据库基于JSON文档型数据底座和分布式架构的不断更新与迭代,为企业提供可靠的数据处理和存储解决方案,帮助企业优化业务效率,提升客户满意度。

广泛拓展,基于文档型技术的应用场景

在中国乃至全球范围内,“CM场景”是文档型技术应用中重要且突出的场景。基于处理多变的数据结构和庞大的数据量的迫切需求,催生了“CM内容管理平台”,同时极大地推动了SequoiaDB技术的创新。巨杉数据库持续跟进客户需求,进行技术迭代,实现从1.0 到 5.0 的跨越式发展。 巨杉数据库为金融银行客户提供,稳定、可靠、可持续扩展的「CM内容平台」成为「银行影像平台」及「非结构化管理平台」的数据基础设施,目前已吸纳超过100家客户使用该场景。可以说,基于文档型技术并应用于“CM内容管理平台”场景是巨杉数据库取得的最为显著的成果之一,这一场景也持续为巨杉数据库贡献了超过85%的客户及营收,成为业务的主打业务场景。

此外, 文档型数据库在在线业务系统、实时数据湖、IoT领域以及AGI人工智能等领域也得到广泛应用。JSON灵活的格式适合各种在线业务系统,尤其是面向需要快速迭代开发的各类APP的业务应用,基于文档型数据库的开发,可以显著提升团队的研发效率。在实时数据湖方面,巨杉数据库借助JSON灵活的数据处理能力,已助力多家客户构建全量历史数据平台,支持跨系统、跨业务的实时高并发数据查询。

Vector Search基于文档型技术,探索AGI数据应用新边界

AGI 通用人工智能的发展,将进一步推动JSON文档型数据类型的应用(实际上,本次发布活动中,Vector Searche部分的讲解也是通过AI技术合成的)。

传统AI应用中,需要存取及处理的是,海量的半结构化「 CM 内容管理」数据、「动态标签」数据,以及各类非结构化对象数据。这些都正是 SequoiaDB 过去12年聚焦及取得显著成果的领域技术,而 AGI 全新的爆发性发展,必将对 JSON 文档型技术,带来全新的机遇及技术挑战。当前,业界领先的 Open AI、文心一言等大模型平台中,JSON 已经被指定为对内,及对外,函数调用的,标准数据传输格式。

另外,我们可以看到 “向量数据” 在 AGI 通用人工智能发展中得到了关键的应用,需要更有效的数据库处理能力。

向量数据的存放格式天然就可以用 JSON 结构表示,非常适合通过文档型数据库处理。然而,单独使用向量数据,并不能解决业务的全景问题。在业务过程中,向量数据还必须与其他业务数据进行组合使用,才能发挥其价值。因此 SequoiaDB 也正在探索, 为文档型数据库提供 「Vector Search 向量搜索」能力,为保存到 SequoiaDB 的向量数据,提供高效的查询能力,这一特性将在2024年与大家见面。

要注意的是,我们并不需要发展独立的向量数据库产品,而是基于深耕了12年的 JSON 文档型数据库底座技术为基础,进行向量查询能力的扩展,这将可以帮助企业,驱动实体世界的更多数据,和 AGI 通用人工智能进行有效链接,释放全量数据价值。

四大特性,释放全量数据价值

巨杉数据库基于JSON文档型底座对SequoiaDB 进行了全面升级,此次发布活动全面解读了SequoiaDB 的四大特性——高可用、安全、实时和易用。

 高可用: 文档型数据库处理的数据,包括了结构化的元数据、半结构化的标签数据,以及非结构化的对象数据。对于PB级大数据或上百节点规模的大集群,在面对重大灾难时的数据可靠性、数据一致性和系统可用性时都面临着巨大挑战。精细化容灾能有效地帮助客户实现针对这些数据的多中心容灾,从而提升整体系统的高可用和数据高可靠能力。

安全: 巨杉数据库不仅在技术上通过国密算法和硬件加速来平衡安全与性能,还提供了跨国内外不同芯片、不同操作系统的混合部署能力。这意味着巨杉数据库可以实现集群的异构部署,平滑地进行硬件资源的替换,对上层业务系统做到完全透明,保障业务连续性。

实时: 巨杉数据库凭借JSON文档型数据结构的Schema灵活性,为企业提供了全量数据底座。DDL的实时变更、横向扩展能力,以及高性能的并发点查能力等都颠覆了传统ODS数据贴源层的界限,使得ODS能够服务于实时业务,满足对客实时数据查询和企业内部跨业务数据实时汇总的需求。

易用: 巨杉数据库进一步增强了SAC的监控、告警和管理等功能。一站式的数据管理工具,极大地方便了DBA的管理工作,提高了问题排查的效率并简化了对系统的监控管理,从而为业务带来更高的稳定性和效率。

开 放、开源共赴新篇章

新年伊始,巨杉数据库也将谱写崭新篇章。发布会介绍,巨杉数据库决定将在2024年Q1再次发布开源版本,不仅希望获得社区同仁的参与和监督,让产品未来发展更透明;同时也承担历史责任,希望通过开源的方式吸引更多合作伙伴,共同发展中国的分布式文档型数据库生态链,促进业务的快速迭代和开发效率的提升。近期,SequoiaDB新版本的源代码将通过Gitee、GitCode及GitHub再次开源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1400421.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

toolz,一个无敌的 Python 库!

更多Python学习内容:ipengtao.com 大家好,今天为大家分享一个无敌的 Python 库 - toolz。 Github地址:https://github.com/pytoolz/toolz Python是一种多用途的编程语言,具备广泛的库和框架,以支持各种编程范式&#x…

SSD硬盘数据恢复工具哪个强?分享五款好用的SSD硬盘数据恢复软件

固态硬盘 (SSD) 是数据存储领域真正的奇迹。SSD 没有机械部件,具有类似激光的读写速度,在笔记本电脑、游戏机和超级计算机中非常受欢迎。 然而,数据删除问题仍然很突出。如果您不小心删除了 SSD 中的关键数据怎么办? 5 款最佳 SS…

Python 类变量和实例变量详解

更多资料获取 📚 个人网站:ipengtao.com 在Python中,变量分为类变量和实例变量两种类型,它们有着不同的作用范围和生命周期。理解这两种变量类型的区别对于面向对象编程非常重要。本文将详细介绍Python中的类变量和实例变量&…

SATA驱动中FIS命令处理(详细)流程附代码和协议解析

目录 一、简介二、命令处理详细流程2.1 总体过程总结2.2 内存布局2.2.1 具体内存分配规则2.2.2 具体命令填充2.2.3 命令触发流程2.2.4 其他注意事项 三、其他相关链接1、SATA模块之HBA卡开发总结(一)2、SATA信息传输FIS结构总结3、PCIe物理层总结-PCIE专…

Vue2移动端项目使用$router.go(-1)不生效问题记录

目录 1、this.$router.go(-1) 改成 this.$router.back() 2、存储 from.path,使用 this.$router.push 3、hash模式中使用h5新增的onhashchange事件做hack处理 4、this.$router.go(-1) 之前添加一个 replace 方法 问题背景 : 在 Vue2 的一个移动端开发…

快速入门:使用 Gemini Embeddings 和 Elasticsearch 进行向量搜索

Gemini 是 Google DeepMind 开发的多模态大语言模型家族,作为 LaMDA 和 PaLM 2 的后继者。由 Gemini Ultra、Gemini Pro 和 Gemini Nano 组成,于 2023 年 12 月 6 日发布,定位为 OpenAI 的竞争者 GPT-4。 本教程演示如何使用 Gemini API 创建…

万界星空科技免费MES/开源MES/功能齐全,支持低代码大屏

目前国内智能制造如火如荼,工厂信息化、数字化是大趋势。如果找到一个工厂,搞定一个老板,搞软件的朋友就能吃几年。 开源软件不失为一条路子,大量的服务商选择开源MES做出了低成本的项目,收入也还可以。 今天介绍Git…

Linux 驱动开发基础知识——认识LED驱动程序 (二)

个人名片: 🦁作者简介:一名喜欢分享和记录学习的在校大学生 🐯个人主页:妄北y 🐧个人QQ:2061314755 🐻个人邮箱:2061314755qq.com 🦉个人WeChat:V…

文件处理的重定义,dup2函数

目录 1.了解dup2函数的参数意义 2.举例子了解dup2函数 3.在模拟shell中加入> , >> , < 的指令 4.stdout和stderr的区别 1.了解dup2函数的参数意义 C中系统调用接口中的open-CSDN博客 可以在我上面的博客中了解到&#xff0c;文件其实是被进程以数组的形式存储…

空间解析几何在激光雷达的定位和测距中的应用

空间解析几何是一种数学工具&#xff0c;用于描述和分析空间中的几何关系。空间解析几何在激光雷达的定位和测距中起着重要的作用&#xff0c;在激光雷达的定位和测距中&#xff0c;空间解析几何可以帮助我们理解和计算激光雷达与目标物体之间的几何关系&#xff0c;通过描述和…

k8s的包管理工具helm

Helm是什么? 之前的这篇文章介绍了一开始接触k8s的时候接触到的几个命令工具 kubectl&kubelet&rancher&helm&kubeadm这几个命令行工具是什么关系&#xff1f;-CSDN博客 Helm 是一个用于管理和部署 Kubernetes 应用程序的包管理工具。它允许用户定义、安装和…

protobuf-Java使用.md

protobuf 环境配置 1、安装编译器 下载地址 直接解压缩。 2、配置环境变量 环境变量Path 中增加安装目录的路径 3、检查是否配置成功 protoc Usage: protoc [OPTION] PROTO_FILES Parse PROTO_FILES and generate output based on the options given:-IPATH, --proto_pa…

关于程序员的未来的这件事情,我是这么看的!

关于程序员的未来在哪里&#xff1f;很多想做程序员以及已经入坑的程序员都想知道&#xff0c;我作为一名工龄超过12年的资深大龄程序员&#xff0c;我其实也想知道&#xff0c;我也没办法确定程序员的未来在哪里。 或者我也不知道&#xff0c;为什么互联网当初招聘那么多的程…

10 Hadoop的安全模式及权限介绍

1、HDFS工作流程 启动NameNode&#xff0c;NameNode加载fsimage到内存&#xff0c;对内存数据执行edits log日志中的事务操作。文件系统元数据内存镜像加载完毕&#xff0c;进行fsimage和edits log日志的合并&#xff0c;并创建新的fsimage文件和一个空的edits log日志文件。N…

跟着cherno手搓游戏引擎【8】按键和鼠标的KeyCode

自定义KeyCode 先把glfw3.h里的KeyCode的定义抄到咱这里来。 在YOTO下创建KeyCode.h: #pragma once#ifdef YT_PLATFORM_WINDOWS///从glfw3中拿的 #define YT_KEY_SPACE 32 #define YT_KEY_APOSTROPHE 39 /* */ #define YT_KEY_COMMA 44…

node.js项目express的初始化

目录 1.初始化项目2.配置跨域3.开始编写API3.1准备3.2路由处理函数router_make下的user.js3.3路由模块router下的user.js3.4入口文件app.js里面去新增这段代码3.5启动项目进行测试 &#x1f44d; 点赞&#xff0c;你的认可是我创作的动力&#xff01; ⭐️ 收藏&#xff0c;你…

如何在浏览器上设置 VPN 网络虚拟专用网络

如何在DT浏览器上设置 VPN 网络 虚拟专用网络&#xff08;VPN&#xff09;是一种用公用网络架设专用网络的技术。如何在DT浏览器上设置 VPN 呢&#xff0c;先下载DT浏览器&#xff0c;建议在官方网站下载最新版&#xff0c;安装&#xff0c;在DT浏览器首页点更多&#xff0c;网…

Excel·VBA合并工作簿2

其他合并工作簿的方法&#xff0c;见之前的文章《ExcelVBA合并工作簿》 目录 8&#xff0c;合并文件夹下所有工作簿中所有工作表&#xff0c;按表头汇总举例 8&#xff0c;合并文件夹下所有工作簿中所有工作表&#xff0c;按表头汇总 与之前的文章《ExcelVBA合并工作簿&#x…

3.postman动态参数、文件上传及断言

一、postman内置动态参数以及自定义的动态参数 postman内置动态参数&#xff1a; {{$timestamp}} 生成当前时间的时间戳 {{$randomint}} 生成0-1000之间的随机数 {{$guid}} 生成随机guid字符串 自定义动态参数&#xff1a; 在请求中pre-req页面下 //手动的获得时间戳 var…

Java - 深入四大限流算法:原理、实现与应用

文章目录 Pre概述简单计数器原理实现测试优缺点 滑动窗口算法原理实现测试优缺点 漏桶算法原理实现测试优缺点 令牌桶算法原理实现测试优缺点 小结 Pre 深入理解分布式技术 - 限流 并发编程-25 高并发处理手段之消息队列思路 应用拆分思路 应用限流思路 SpringBoot - 优雅…