最近在了解构建知识图谱的相关知识,收集了一些数据,对数据进行标注时尝试了下Label-Studio这个工具,它是开源的数据标注工具,个人觉得还是挺好用的。
Label-studio的安装
我是直接在服务器上用pip安装的,命令如下:
pip install -U label-studio
启动label-studio:
label-studio start
注:用服务器启动Label-Studio可能会报错,提示需要Xmanager软件来处理X11转发请求,如下图所示。
解决方法:
选择当前会话 -> 右键选择属性 -> 点击SSH下的隧道设置 -> 取消“转发X11连接到(X)” -> 取消后点击“确定” -> 用命令重启Label-Studio就会跳转到注册账户界面了。
启动Label-Studion之后正常跳转页面:
注册账户,登录即可。
后边的操作就是根据自己需要探索了,挺容易上手的。
① 创建项目
② 导入需要标注的文件
③ 选择标注的模板,设计标签
④ 数据的具体标注
⑤ 提交标注结果
⑥ 导出标注的文件,可以选择json格式等。
这里随便试了一下,但是标注的具体内容请忽略。。。
希望可以帮助到大家~