#gStore-weekly | gBuilder功能详解之项目管理

news2024/7/6 19:51:04

1. gBuilder介绍

我们知道知识图谱整个生命周期分为构建、存储管理与应用三个阶段。其中我们之前介绍的图数据库gStore对应解决的是知识图谱的存储与管理这个阶段问题。实际上知识图谱项目中大部分时间都花在知识图谱构建阶段,虽然知识图谱构建不直接体现价值,但是构建一个质量上层的知识图谱对于应用和价值的发挥至关重要作用,知识图谱构建部分是整个知识图谱项目的重难点工作。

因此,北京大学王选计算机研究所数据管理实验室联合北京大学重庆大数据研究院图数据库和知识图谱实验室历时三年研发了知识图谱自动化构建平台gBuilder。通过结合机器学习、知识图谱、图数据库等技术打造的一个针对结构化数据和非结构化数据的知识图谱自动化构建平台,实现数据向知识的转化,降低知识图谱构建门槛,促进知识图谱项目快速落地。

因为gBuilder为闭源产品,但是为了方便大家了解其相关功能,我们接下来将编写一些列gBuilder的功能介绍短文。本期介绍gBuilder的项目管理功能。

2 项目管理

2.1 简介

我们以项目的方式进行知识图谱的构建进行管理,每个知识图谱的构建任务都是一个项目,因此项目管理功能是使用gBuilder进行知识图谱构建的开端。

2.2 新增项目

针对每个知识图谱的构建需要通过新增项目来开始,当前我们项目类型根据当前的数据类型有结构化知识图谱构建和非结构化知识图谱构建两种。我们通过以下步骤新增项目,首先点击【新增】按钮新增项目。

填入要创建项目的名称和简介,其中项目类型可根据实际情况选择【结构化】、【非结构化】项目,结构化和非结构化具体是指当前用来构建知识图谱项目的数据类型,并可输入项目简介信息。

对于结构化和非结构化项目其构建流程是有所出入的,具体的将会在后面在结构化和非结构化的功能介绍中详细描述。但是从【项目管理】界面显示出新增的项目也能看出大致的不同,如下图所示:

对于结构化项目在项目管理卡片下面有schema、映射、mapping生成、mapping编辑、nt生成、nt任务6个功能按钮进行对应操作。而非结构化项目在项目管理卡片下面只有schema、构建、下载nt文件3个功能按钮。在构建知识图谱项目时,项目名称需要保证唯一性,在项目名称重复时系统会提示该项目名称已存在的消息。同时项目管理卡片有进度展示,可以展示当前知识图谱构建的整体进度情况,以百分比的形式进行展示。

我们也可在项目管理页面输入具体的项目名称进行搜索,同时可以刷新当前页面具有的项目:

为了便于操作在每个项目卡片右上角还有预览映射、导入、导出、编辑和删除操作按钮。

2.3 预览映射

gBuilder在构建时采用自顶向下构建的方式,无论结构化的项目还是非结构化的项目在做知识图谱构建之前都要进行本体概念的设计及schema的设计,同时我们可在项目管理卡片的-预览映射功能查看当前构建的知识图谱与schema的映射关系。

若还没设计schema的项目将会进行提示,若已经做好映射的schema将会展示实体、关系、属性的映射情况,如下图所示:

2.4 导入项目

用户若之前已经有构建好的知识图谱项目,包括schema、数据库连接信息、实体映射信息、属性关系映射信息等文件。用户可以从服务器和本地导入文件,导入的文件需要为一个压缩包,并且每个文件的命名要符合规范。

其中结构化和非结构化项目需要导入的文件不同,非结构化数据的知识图谱构建更多是采用机器学习算法和模型进行信息抽取,因此主要是导入schema设计文件,而结构化数据需要数据库连接等信息,具体的可根据gBuilder平台提示来导入。 

我们以结构化项目为例讲解导入项目功能,点击【导入】功能按钮,用户可以选择从服务器和本地导入文件。 

服务器导入:通过输入文件路径进行导入

本地导入:通过选择具体的本地文件夹即可导入

2.5 导出项目

类似的,用户也可导出已设计好的Schema文件、数据库连接文件、数据库表文件、实体映射信息、实体属性关系映射信息、跨表映射信息、Mapping文件的项目,以便后续使用,导出的文件也是一个压缩包,用户可以自行定义导出哪些文件。

点击导出按钮后还需要选择需要导出的哪些文件,在弹框中点击【导出文件】后面的具体文件名称,当具体的文件为选中状态时(蓝色)即可导出,默认状态为灰色状态,即未选中转态;若用户不选择的话导出的压缩包为空文件:

2.6 编辑项目

对于项目的名称和、项目类型简介用户可以自行编辑修改。

2.7 删除项目

我们可以删除不需要的项目,通过点击每个项目右上角的删除按钮删除。

若大家在实际项目中需要使用gBuilder可联系运营同学或者发送邮件进行项目层面合作沟通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/391426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Hermite插值及其Julia实现

文章目录基本原理算法实现无论是Newton插值还是Lagrange插值,都只能在数值本身上满足插值函数与数据节点的重合,Hermite插值则要求其导数值相等。 基本原理 设在节点a⩽x0⩽x1⩽…⩽xn⩽ba\leqslant x_0\leqslant x_1 \leqslant\ldots\leqslant x_n\le…

ESP32使用TCP HTTP访问API接口JSON解析获取数据

ESP32使用TCP HTTP访问API接口JSON解析获取数据API接口代码解析获取时间代码烧录效果总结API接口 单片机常用的API接口基本都是返回的一串JSON格式的数据,这里以ESP32联网获取时间信息作为获取API数据的示例,以便后续移植使用。 很多功能性的API接…

UML-活动图以及PlantUML绘制

介绍 活动图(英语:activity diagram)是工作流的图形化表示。活动图主要由活动和动作构成,也可以支持分支选择、迭代、并行。在 UML 中,活动图主要用于为计算性和组织性过程(即工作流)建模&…

PaddlePaddle本地环境安装(windows11系统)

写在前面: 这里是关于win11安装PaddlePaddle的步骤和方法,建议参考官方的方法。截止2023年3月份,PaddlePaddle的版本是2.4.2。 官方参考:飞桨PaddlePaddle快速安装使用方法 建议使用Anaconda安装 ,关于Anaconda创建环境的可以借鉴:深度学习Anaconda环境搭建(比较全面)…

Exposure X7胶片滤镜调色插件免费版下载

ps是我们为图片进行调色的一种必要手法,我们可以通过添加滤镜、使用曲线、调整色相、饱和度等ps手法来对图片加以修饰。下面这篇文章就来为大家介绍一下ps调色方法主要有,ps调色插件怎么用的相关知识。 Exposure X7是一款特别好用的胶片滤镜模拟软件&am…

ESP32设备驱动-MicroSD Card驱动

MicroSD Card驱动 1、SDCard介绍 SD卡是Secure Digital Card卡的简称,直译成汉语就是“安全数字卡”,是由日本松下公司、东芝公司和美国SANDISK公司共同开发研制的全新的存储卡产品。SD存储卡是一个完全开放的标准(系统),多用于MP3、数码摄像机、数码相机、电子图书、AV器…

代码看不懂?ChatGPT 帮你解释,详细到爆!

偷个懒,用ChatGPT 帮我写段生物信息代码如果 ChatGPT 给出的的代码不太完善,如何请他一步步改好?网上看到一段代码,不知道是什么含义?输入 ChatGPT 帮我们解释下。生信宝典 1: 下面是一段 Linux 代码,请帮…

开学季平价好用电容笔有哪些?ipadpro触控笔推荐

众所周知,苹果原装的Pencil的售价由于比较高,所以很多用户都无法入手。那么,市场上会不会有一款价格上只有苹果Pencil五分之一左右、但功能几乎相同的电容笔?事实上,确实存在。国内的平替电容笔,不管是压感…

二点回调测买 源码

如图所示,两点回调测买点的效果图,这是我们常见的一种预测买点计算方法。 现将源码公布如下: DRAWKLINE(H,O,L,C); N:13; A1:REF(HIGH,N)HHV(HIGH,2*N1); B1:FILTER(A1,N); C1:BACKSET(B1,N1); D1:FILTER(C1,N); A2:REF(LOW,N)LLV(LOW,2*N1…

正交采样

文章目录【 1、欧拉公式的频谱 】【 2、模拟正交采样 】【 3、数字正交采样 】【 1、欧拉公式的频谱 】 对于余弦信号 cos(2πf0t)12ej2πf0t12e−j2πf0tcos(2\pi f_0 t)\frac{1}{2}e^{j2\pi f_0 t}\frac{1}{2}e^{-j2\pi f_0 t}cos(2πf0​t)21​ej2πf0​t21​e−j2πf0​t&a…

Shell基础 (一)

目录 一、关于shell 1、什么是shell? 2、shell入门 二、shell进阶(重点) 1、变量 2、条件判读语句 3、运算符 一、关于shell 1、什么是shell? Shell(外壳)是一个用C语言编写的程序,它是用…

《程序员面试金典(第6版)》面试题 02.08. 环路检测

题目描述 给定一个链表,如果它是有环链表,实现一个算法返回环路的开头节点。若环不存在,请返回 null。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环&#xf…

如果想了解营销的最高境界,请看如何开创新品类?

如果想了解营销的最高境界,请看 如何开创新品类? 中国奶粉第一品牌飞鹤奶粉~ 品牌策划人王博总结的方法 趣讲大白话:看看高手怎么想 【安志强趣讲信息科技95期】 ******************************* 不懂品牌营销的程序员不是好厨师…

第一次使用Python for Qt中的问题

在创建带有form的python for qt的时候,使用的库是pySide6,而不是pyqt。 因此,需要安装pyside6。 Running "/usr/bin/python3 -m pip install PySide6 --user" to install PySide6. ERROR: Could not find a version that satisfi…

hivesql实现不同的求和需求【分组求和、帕累托累计求和、滑动求和】

hivesql求和,分组求和,帕累托累计求和,滑动求和 实现功能如下示例: 列s1:分组求和,这里以sku_id分组求和,E5单元格对应sku_ida01时的C列求和; 列s2:帕累托求和&#x…

X264简介-Android使用(一)

X264 简介及使用 1、简介 2、环境搭建 3、使用 4、小结 简介 官网连接:https://www.videolan.org/developers/x264.html 官方文档:https://wiki.videolan.org/Category:X264/ x264是用于编码H.264/MPEG-4 AVC视频流的免费软件库。它世界上最流行的…

每天一个linux命令:性能监控和优化命令之top

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。下面详细介绍它的使用方法。top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止…

将fluentMeshing网格转换为openFoam网格

简介 fluentMeshing是一个绘制源生多面体网格的强大工具,其生成的网格可以进一步导出,转换为OpenFoam格式,供OpenFoam计算。 本文将介绍如何把fluentMeshing网格转换为openFoam网格,以及其注意事项 步骤 (1&#x…

【QML】锚布局

文章目录1、锚(Anchors)2、一些示例Qt Quick中有两套与布局管理相关的类库,一种是Item Positioner(定位器),一种是Item Layout(布局) 定位器:Row(行定位器&am…

【NLP经典论文阅读】Efficient Estimation of Word Representations in Vector Space(附代码)

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…