AI数据标注工具Doccano

news2025/1/11 12:55:36

Doccano是一款开源的标注工具,用于自然语言处理和机器学习任务。它提供了用户友好的界面,使用户能够轻松地标注文本、序列标注、文本分类和文本配对等任务。doccano支持多种标注格式,并且可以方便地与其他机器学习工具集成。它的简单性和灵活性使得它成为研究人员和开发者的理想选择。下面我们来看下如何使用工具~

Github-doccano

1. 拉取镜像

我们可以通过拉取docker镜像快速完成部署

docker pull doccano/doccano

2. 创建容器

docker container create --name doccano \
  -e "ADMIN_USERNAME=admin" \
  -e "ADMIN_EMAIL=admin@example.com" \
  -e "ADMIN_PASSWORD=password" \
  -v doccano-db:/data \
  -p 8090:8000 doccano/doccano

3. 启动容器

docker container start doccano

可以看到后台已经正常运行起来

docker ps

4. 打开页面

http://xx.xx.xx.xx:8090

5. 登录Doccano

使用上文中设置的账号密码就行登录

6. 创建标注任务

7. 导入待标数据

如果没有数据可以下载CLUE Fine-Grain NER的数据集 。这个数据集是在清华大学开源的文本分类数据集THUCTC基础上,选出部分数据进行细粒度命名实体标注,原数据来源于Sina News RSS.下载链接如下👇🏻

样例数据下载

导入json数据

查看待标注数据

8. 创建标签

因为我需要做用户个人信息的识别,所以生成了银行卡身份证QQ号等信息

9.开始标注

滑动文本标注内容,接下来就是漫长的达标工作。

参考:

  1. CLUE Fine-Grain NER
  2. doccano-github

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/634962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于 MySQL 事务、隔离级别及 MVCC 机制详细剖析

前言事务特性事务并发引发的问题脏读不可重复读幻读 隔离级别如何更改事务隔离级别 事务基本操作MVCC版本链ReadViewREAD COMMITTED脏读问题不可重复读问题 REPEATABLE READ不可重复读问题幻读问题 小结 总结 前言 MySQL 事务是比较重要且核心的一部分,在操作数据库…

碳排放预测模型 | Python实现基于Prophet网络的碳排放预测模型(预测未来发展趋势)

文章目录 效果一览文章概述研究内容环境准备源码设计学习总结参考资料效果一览 文章概述 碳排放预测模型 | Python实现基于Prophet网络的碳排放预测模型(预测未来发展趋势) 研究内容 这是数据集的链接:https://github.com/owid/co2-data/blob/master/owid-co2-data.csv 使用…

读书:《指数型组织》

《指数型组织》是Salim Ismail在2015年发表的一本著作,它探讨了在今天这个信息时代,一些组织为何能够在极短的时间内取得显著的成绩。他发现这些成功的组织都有一些共享的属性,这些属性使得他们能够比传统组织更快、更有效地扩展业务。他把这…

LiangGaRy-学习笔记-Day21

1、LVM介绍 1.1、LVM是什么 对于生产环境下的服务器来说,如果存储数据的分区磁盘空间不足,应该如何处理? 添加一块硬盘–>可以满足需要再添加一块硬盘也可以满足需求;问题就是拷贝的速度慢; 这里就引入一个技术…

Kubernetes小感

从容器到容器云,谈谈 Kubernetes 的本质: 一个“容器”,实际上是一个由 Linux Namespace、Linux Cgroups 和 rootfs 三种技术构建出来的进程的隔离环境。 作为一名开发者,我并不关心容器运行时的差异。因为,在整个“…

【深入浅出Docker原理及实战】「原理实战体系」零基础+全方位带你学习探索Docker容器开发实战指南(核心组件说明)

零基础全方位带你学习探索Docker容器开发实战指南(核心组件说明) 核心组件镜像定义概念与容器的关联文件系统root文件系统 bootfs启动文件系统分层存储分层覆盖处理模式镜像的写时复制机制 容器容器进程隔离性容器进程隔离性容器存储层数据卷绑定镜像和容…

Spring6-01

Spring6启示录 OCP开闭原则 什么是开闭原则? 在软件开发过程中应当对扩展开放,对修改关闭。也就是说如果在进行功能扩展的时候,添加额外的类是没有问题的,但因为功能扩展而修改之前运行正常的程序,这是不被允许的。因…

Elasticsearch:二进制数据类型 - binary field

二进制(binary)类型接受二进制值作为 Base64 编码字符串。 该字段默认不存储且不可搜索。Base64 编码的二进制值不得嵌入换行符 \n。 这听起来像是,将二进制对象存储在 Elasticsearch 中的单个字段中 PUT my-index-000001 {"mappings&…

Jupyter Notebook 插件和其他小技巧

好用的插件 安装插件代码自动补全变量查看高亮代码折叠显示行号执行时间多行打印规范化代码模块快速获取jupyter notebook中安装包快捷键 安装插件 1.pip直接安装 pip install jupyter_contrib_nbextensions jupyter contrib nbextension install --user2.方法1不成功就用ano…

STM32踩坑:UCOSIII下串口中断服务中使用OSIntEnter函数使程序卡死解决方案

UCOSIII下串口中断服务中使用OSIntEnter函数使程序卡死解决方案 本文侧重于 STM32 标准库,HAL 库可以借鉴,因为该项目是基于标准库做的(因为涉及到保密,这里我就张贴源码进行描述了)。 因项目需求,需要使用…

广域网技术——ppp,pppoe

目录 PPP协议概述 PPP协议原理 PPP协议三大组件: PPP链路建立流程 PPP连接建立接口状态: LCP协议报文格式 PPP协议报文格式: 1,链路层建立连接过程 LCP协商过程-正常协商 LCP协商-参数不一致 LCP协商-参数不识别 2&#xf…

JVM调优工具及其相关配置

1.查看JVM配置及其应用使用情况 1.1在启动应用中进行测试 1jsp命令的使用 1.jsp查看当前启动的程序 2.查看相关堆中对象的使用情况 jmap -histo 16700>./log.txtnum:序号instances:实例数量bytes:占用空间大小class name:类…

记录 | 将Word生成的静态网页部署到Github Page

任务描述 使用Word, 可以直接获得 一个静态的网页XXX.html和对应的文件夹XXX.files问题:如何将它托管在github上? 步骤 使用github pages进行托管和发布 步骤1:创建仓库 创建一个新的GitHub仓库:访问 https://github.com 并使用…

matplotlib模块

目录 ❤ 条形图 ❤ 直方图 ❤ 折线图 ❤ 散点图直线图 ❤ 饼图 ❤ 箱型图 ❤ plot函数参数 ❤ 图像标注参数 ❤ Matplolib应用 python从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129328397?spm1001.2014.3001.5502 …

物联网Lora模块从入门到精通(九)Flash的读取与存储--结题

一、前言 这将是"物联网Lora模块从入门到精通"系列的最后一篇文章,相信各位同僚通过前面八篇文章的分享已经极好的掌握了Lora模块的编程,本文的Flash的读取与存储将是Lora模块开发的最后一块,感谢大家的陪伴与支持! 希望…

SpringCloud(五)

文章目录 负载均衡策略自定义负载均衡策略饥饿加载 负载均衡策略 负载均衡的规则都定义在IRule接口中,而IRule有很多不同的实现类: 不同规则的含义如下: 内置负载均衡规则类规则描述RoundRobinRule简单轮询服务列表来选择服务器。它是Ribb…

Redis高级特性之慢查询的基本概念

慢查询概念 作为存储系统,Mysql等等,提供慢查询日志帮助开发和运维人员定位系统存在的满操作。慢查询日志就是系统在命令执行前后计算每条命令的执行时间,当超过预期阈值,便会将这条命令的相关信息。例如发生的时间,耗…

【零基础学JS - 10 】javaScript 中的比较和逻辑运算符

👨‍💻 作者简介:程序员半夏 , 一名全栈程序员,擅长使用各种编程语言和框架,如JavaScript、React、Node.js、Java、Python、Django、MySQL等.专注于大前端与后端的硬核干货分享,同时是一个随缘更新的UP主. 你可以在各个…

mysql8安装【含mysql安装包】

mysql8安装【含mysql安装包】 安装包等资源安装流程 安装包等资源 安装包下载地址【CSDN免费】:https://download.csdn.net/download/qq_47168235/87881866 如果上面的个下载不了,就通过百度网盘吧 百度网盘连接:https://pan.baidu.com/s/1G…

pycharm使用之torch_sparse安装

正式安装之前要先查看一下torch的版本 一、查看torch版本 1、winR ,输入cmd 2、输入python 3、 输入import torch,然后输入torch.__version__,最后回车 可以看到我的torch版本是1.10.0 二、下载合适的torch_sparse版本 1、打开链接 https…