GraphBase基础原理

news2024/9/24 18:22:03

一、GraphBase简介

互联网时代,随着网络技术的发展,企业积累的数据越来越多。伴随着数据集的不断增加,传统的关系型数据库查询性能会随之变差,特别是针对一些特殊的业务场景,所以迫切的需要一种新的解决方案去应对这种危机。为了解决复杂的关系问题,图数据库应运而生。
图数据库,是指以“图”这种数据结构存储和查询数据,图包含节点和关系,节点和关系可以存在标签和属性,且边可以有方向。GraphBase是分布式图数据库,基于HBase的分布式存储机制,能够支持百亿节点,千亿关系的海量数据,提供基于Spark的数据导入和基于Elasticsearch的索引机制,在推荐、关系分析和金融反欺诈等领域有广泛应用。系统具有如下特点:

  • 全分布式,Hadoop生态无缝集成。
  • 百亿点千亿边,秒级查询。
  • 提供易用的Rest接口,方便数据的查询分析。
  • 提供强大的Gremlin图遍历功能,可实现复杂的业务逻辑。
  • 支持离线批量导入和实时流导入,对导入性能进行深度优化。

二、GraphBase架构

GraphBase包含GraphServer和LoadBalancer角色。

  • GraphServer:包含GremlinServer和StandardServer服务,GremlinServer负责gremlin图查询服务,StandardServer负责REST服务等;系统启动时,meta_graph图先启动,meta_graph图负责存储多图元数据、异步任务等;ZooKeeper负责监控服务中活着的实例,并提供分布式锁服务。
  • LoadBalancer:提供图服务的负荷分担能力。

GraphBase架构如图下所示。
在这里插入图片描述

  • 接入层

    • Gremlin API:引入开源的Apache TinkerPop Gremlin组件,提供开源标准图交互式查询语言接口;
    • REST API:提供包含图查询、图修改、图管理的在线分析图算法在内的全套接口;
    • 通过Load Balancer提供多实例GraphServer的负荷分担。
  • 计算层

    • 提供图数据库核心引擎,包括数据管理、元数据管理等;
    • 后端存储和索引接口适配层。
  • 存储层

    • 分布式KV存储:提供海量图数据存储能力;
    • 搜索引擎提供二级索引,全文检索、模糊检索等能力。

GraphBase典型应用场景:

  • 金融反欺诈
  • 知识图谱
  • 关系分析

三、GraphBase关键特性:支持多图

场景描述

  • 不同业务部门开发不同的应用,可以共用同一套图数据库
  • 不同的应用,采用不同的数据,数据无关联,方便业务隔离

多图方案设计图

在这里插入图片描述

  • GraphServer:包含GremlinServer和StandardServer服务,GremlinServer负责gremlin图查询服务,StandardServer负责REST服务等;系统启动时,meta_graph图先启动,meta_graph图负责存储多图元数据、异步任务等;ZooKeeper负责监控服务中活着的实例,并提供分布式锁服务。
  • LoadBalancer:提供图服务的负荷分担能力。
  • GraphWriter:数据批量导入模块。
  • GraphStreaming:数据实时导入模块。

四、GraphBase关键特性:数据导入

支持批量导入和实时导入

GraphBase支持批量导入和实时导入两种形式,批量导入利用Spark将存储在HDFS上的历史数据全量导入到图数据库,实时导入利用Kafka和SparkStreaming将数据实时的导入到图数据库。
支持灵活的数据映射规则,将原始数据方便的映射成图模型。
在这里插入图片描述

批量导入支持BulkLoad

新增预计BulkLoad模式的导入能力,支持更快速的数据导入。
数据导入时,可以在一次MapReduce任务中同步生成Graph HFiles和Inner Secondary Index HFiles。
在这里插入图片描述

五、与其他技术组件联系

GraphBase将业务数据和元数据存储在HBase,实现海量数据的支持。将外部索引数据存储在Elasticsearch,实现全文检索、模糊匹配等查询能力。GraphBase利用Spark实现数据的批量、实时导入,利用Mapreduce实现索引重建和批量删除能力,利用ZooKeeper实现计算引擎多实例的分布式协调能力。

GraphBase与其他组件的关系如下图所示。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1013952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[腾讯云 Cloud Studio 实战训练营] 云上编程的革命:我的 Cloud Studio 体验之旅

文章目录 1. 无缝的云端体验1.1 云端工作站的魅力1.2 真正的在线编程1.3 强大的协作能力1.4 多平台兼容性1.5 安全和数据备份1.6 持续更新和维护1.7 灵活的资源扩展 2. 功能强大的在线 IDE2.1 基础功能全覆盖2.2 高级功能支持2.3 多语言支持2.4 自定义工作流程2.5 版本控制和协…

单元格法近似求解多边形最大内接矩形问题【思路讲解+java实现】

文章目录 问题描述问题解决方案多边形网格化区分每个单元格是在多边形内部还是外部根据已标记单元格寻找最大内接矩形剪枝优化多角度旋转 案例测试代码实现说明 问题描述 给定一个多边形的点集,希望找出多边形内部面积最大的矩形。该问题可能出现在,从一…

Linux命令200例:cu是用于设置与终端设备通信的工具

🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌。CSDN专家博主,阿里云社区专家博主,2023年6月csdn上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师&#xff0…

Netsh命令修复DNS无法上网问题

关注【潇湘信安】、【Hack分享吧】公众号,一起学网络安全知识! 0x01 问题描述 今早打开电脑后突然发现上不了网了,TIM可以正常登录,浏览器打不开网页,出现这样情况一般都是DNS的问题,用ipconfig /all命令查…

Kotlin文件遍历FileTreeWalk filter

Kotlin文件遍历FileTreeWalk filter import java.io.Filefun main(args: Array<String>) {val filePath "."val file File(filePath)val fileTree: FileTreeWalk file.walk()fileTree//.maxDepth(1) //遍历层级1&#xff0c;不检查子目录.filter {it.isFile…

【Java 基础篇】深入理解Java集合嵌套:构建和管理复杂数据结构的终极指南

当我们谈论集合嵌套时&#xff0c;我们指的是在一个集合中存储另一个集合&#xff0c;或者说集合中的元素本身也是集合。这是一个非常有用的概念&#xff0c;可以在处理复杂数据结构时提供更灵活的选项。在本文中&#xff0c;我们将深入探讨Java中集合嵌套的概念、用法以及一些…

Jenkins 编译 Maven 项目提示错误 version 17

在最近使用集成工具的时候&#xff0c;对项目进行编译提示下面的错误信息&#xff1a; maven-compiler-plugin:3.11.0:compile (default-compile) on project mq-service: Fatal error compiling: error: release version 17 not supported 问题和解决 上面提示的错误信息原…

Llama.cpp工具main使用手册

Llama.cpp提供的 main工具允许你以简单有效的方式使用各种 LLaMA 语言模型。 它专门设计用于与 llama.cpp 项目配合使用。 推荐&#xff1a;用 NSDT编辑器 快速搭建可编程3D场景 Llama.cpp的工具 main提供简单的 C/C 实现&#xff0c;具有可选的 4 位量化支持&#xff0c;可实现…

C++之默认与自定义构造函数问题(二百一十七)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

linux学习实操计划0201-安装zotero的种种问题

本系列内容全部给予Ubuntu操作系统。 系统版本&#xff1a;#32~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Fri Aug 18 10:40:13 UTC 2 1 如何安装linux版本的zotero zotero是非常强大的开源文献管理和阅读软件。在各个平台均有版本。然而在linux版本下&#xff0c;并不是我们希望的d…

灵活学习平台满足不同学习风格的需求

灵活学习平台是现代教育的一项重要工具&#xff0c;它提供了满足不同学习风格的需求的服务。不同的学生有着不同的学习习惯和风格&#xff0c;有些学生喜欢通过阅读大量的文本来学习&#xff0c;而另一些学生则更喜欢通过视听材料来吸收知识。灵活学习平台的设计目的就是要满足…

[npm]脚手架本地全局安装1

[npm]脚手架本地全局安装1 npm link 全局安装npm install 全局安装卸载全局安装的脚手架 该文章是你的脚手架已经开发完成的前提下&#xff0c;你想要本地全局安装该脚手架&#xff0c;便于本地使用脚手架的命令的情况 npm link 全局安装 如果本地开发的项目是个脚手架&#…

JVM——1.JVM概述

从这篇文章开始&#xff0c;我们来学习一下jvm 目录 1.JVM的定义 2.JVM的好处 3.与JVM相关概念的解释 4.常见的JVM 5.JVM的主要内容 6.总结 1.JVM的定义 JVM&#xff0c;全称&#xff1a;Java Virtual Machine &#xff0c;即Java虚拟机&#xff0c;是Java程序的运行环…

Docker从认识到实践再到底层原理(五)|Docker镜像

前言 那么这里博主先安利一些干货满满的专栏了&#xff01; 首先是博主的高质量博客的汇总&#xff0c;这个专栏里面的博客&#xff0c;都是博主最最用心写的一部分&#xff0c;干货满满&#xff0c;希望对大家有帮助。 高质量博客汇总 然后就是博主最近最花时间的一个专栏…

OpenCV(四十四):亚像素级别角点位置优化

1.角点位置亚像素位置优化原理介绍 亚像素优化的原理在于通过对初始角点位置的微小调整&#xff0c;利用更精确的灰度信息&#xff0c;来获取更准确的角点位置。传统的角点检测算法基于像素级别的灰度变化来定位角点&#xff0c;而亚像素优化则进一步利用图像灰度的局部变化进行…

DataInputStream数据读取 Vs ByteBuffer数据读取的巨大性能差距

背景&#xff1a; 今天在查找一个序列化和反序列化相关的问题时&#xff0c;意外发现使用DataInputStream读取和ByteBuffer读取之间性能相差巨大&#xff0c;本文就来记录下这两者在读取整数类型时的性能差异&#xff0c;以便在平时使用的过程中引起注意 DataInputStream数据…

#循循渐进学5单片机#中断与数码管动态显示#not.5

1、掌握C语言数组的概念、定义和应用。 1&#xff09;数组是一组变量&#xff0c;这组变量需要满足三个条件&#xff1a; 具有相同的数组类型 具有相同的名字 在存储器中是连续的 2&#xff09;声明和初始化 数组类型 数组名【数组长度】 数组类型 数组名【数组长度】 …

批量多字段唯一性校验

批量多字段唯一性校验 思路&#xff1a; 查询列表本身是否含有重复数据新增修改分开考虑&#xff0c;新增只考虑数据库中是否有相同数据&#xff0c;修改不仅要考虑数据库中是否有相同数据&#xff0c;还要排除自身。由于是批量校验&#xff0c;排除自身只需考虑所有修改操作…

LeetCode【3. 无重复字符的最长子串】

工欲善其事必先利其器 题目&#xff1a;给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的 最长子串 的长度。 public int lengthOfLongestSubstring(String s) {int n s.length();int[] charIndex new int[128]; // 用于存储字符的索引&#xff0c;ASCII字符集共有…

docker 操作redis

1查看容器 2进入容器 exec表示在运行的容器中执行命令it表示以终端交互的方式执行命令/bin/bash表示需要指定的命令 3进入容器后可通过redis-cli命令连接容器内的redis服务器&#xff0c;可通过set创建变量&#xff0c;get获取变量的值 4key * 查看所有key 通过ping 查看redi…