基于深度学习的中文标点预测模型-中文标点重建(Transformer模型)【已开源】

news2024/11/17 2:39:37

基于深度学习的中文标点预测模型-中文标点重建(Transformer模型)提供模型代码和训练好的模型

前言

  目前以深度学习对文本自动添加标点符号研究很少,已知的开源项目并不多,详细的介绍就更少了,但对文本自动添加标点符号又在古文识别语音识别上有重大应用。
  基于此,本文提供一种解基于Transformer的的深度学习模型,用来对文本自动添加标点符号。
文末提供模型代码和训练好的模型文件可供下载

✨ 测试Demo:

  • 无标点的长中文文本(模型输入不限制文本长度)
1   在一个遥远的地方有一个美丽的小镇小镇上的人们过着宁静而幸福的生活他们每天日出而作日落而息生活虽然平凡却充满了温馨和乐趣在这个小镇上有一位名叫小明的少年小明是一个聪明好学的孩子他对所有的新事物都充满了好奇每天放学后他都会跑到图书馆去看书汲取各种知识有一天小明在图书馆里发现了一本非常古老的书书的封面已经破旧不堪但书里的内容却深深地吸引了他这本书讲述的是一个关于魔法的故事在故事里描述了一个神秘的魔法世界在那里有会飞的马会说话的树还有能够实现任何愿望的魔法师小明被这个神奇的世界深深地吸引了他开始幻想自己有一天也能进入这个魔法世界亲眼目睹那些神奇的景象小明每天都会拿出那本书仔细阅读书里的每一个字他希望自己能够通过学习书中的知识掌握一些魔法的技巧有一天他发现书的最后一页上写着一段奇怪的文字看上去像是某种咒语小明好奇地读出了那些文字突然之间一阵强烈的光芒包围了他当光芒消失后小明发现自己已经不在图书馆里而是来到了一个完全陌生的地方这个地方看起来就像书中描述的那个魔法世界小明感到既兴奋又紧张他不知道接下来会发生什么但他决定勇敢地探索这个神秘的世界在这个魔法世界里小明遇到了很多奇异的生物和神秘的现象他遇到了一只会说话的猫这只猫告诉他这里是魔法世界而他是被书中的咒语召唤到这里的猫还告诉他如果他想回到原来的世界必须找到一位名叫白胡子的老魔法师只有白胡子老魔法师才能帮助他回去于是小明开始了寻找白胡子老魔法师的旅程在旅途中他遇到了许多困难和挑战但他始终没有放弃他用自己的智慧和勇气克服了一个又一个的障碍终于有一天他在一片神秘的森林里找到了白胡子老魔法师白胡子老魔法师听了小明的故事后非常赞赏他的勇气和智慧他告诉小明要想回到原来的世界他必须完成一个特殊的任务这个任务就是找到三件宝物分别是勇气之剑智慧之石和真诚之心只有集齐这三件宝物才能打开通往原来世界的大门小明听了老魔法师的话后决定不顾一切去完成这个任务他开始了一段新的冒险旅程在旅途中他遇到了许多志同道合的朋友他们一起经历了许多困难和危险但最终他们成功地找到了那三件宝物当小明集齐了勇气之剑智慧之石和真诚之心后他回到了白胡子老魔法师那里老魔法师使用魔法将三件宝物融合在一起打开了通往原来世界的大门小明终于能够回到他熟悉的小镇回到他深爱的家人和朋友身边这段奇幻的冒险经历让小明成长了许多他学会了勇敢面对困难学会了珍惜朋友的帮助也懂得了真诚的重要性从那以后小明变得更加坚强和自信他知道无论遇到什么样的挑战只要勇敢面对就一定能找到解决的办法

测试结果

在这里插入图片描述

开始

一、基于Transformer的标点符号预测模型使用介绍

  • 要求
python >= 3.8
# 安装pytorch且满足👇(pytorch下载官网https://pytorch.org/)
torch >= 1.13
  • 执行测试
  • 使用conda配置环境(推荐)
# 创建conda环境并激活
conda create -n punc python=3.10 -y
conda activate punc
# cd到算法模型根目录
cd punc
# 使用pip安装依赖环境
pip3 install -U funasr
pip3 install -U modelscope huggingface_hub
  • 测试
# 进行标点预测(带预测文本放在example下的txt文件内)
python test.py

代码&模型下载

  • 基于深度学习的中文标点预测模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1788589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AVL树的介绍与实现

前言 我们上一期介绍了二叉搜索树并做了实现,本期我们来继续学习另一个更优的树即AVL树! 本期内容介绍 什么是AVL树? AVL树的实现 AVL树的性能分析 在正式的介绍AVL树之前,我们先来回忆一下二叉搜索树的特点:左子树的…

专业好用的屏幕捕获工具

一、简介 1、一款功能全面、操作简便的屏幕捕获工具,它不仅支持常规的截屏功能,还包括了录屏、OCR文字识别、翻译、GIF制作等多项实用功能。该软件适用于Windows操作系统,旨在为用户提供一站式的屏幕捕捉解决方案 二、下载 1、下载地址: 官网链接:https://verycapture.com…

第二十七章HTML.CSS综合案例

1.产品介绍 效果图如下&#xff1a; 代码部分如下&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">…

【UnityShader入门精要学习笔记】第十七章 表面着色器

本系列为作者学习UnityShader入门精要而作的笔记&#xff0c;内容将包括&#xff1a; 书本中句子照抄 个人批注项目源码一堆新手会犯的错误潜在的太监断更&#xff0c;有始无终 我的GitHub仓库 总之适用于同样开始学习Shader的同学们进行有取舍的参考。 文章目录 表面着色器…

274 基于matlab的随机粗糙表面对微气体轴承内气体压强分布的影响

基于matlab的随机粗糙表面对微气体轴承内气体压强分布的影响。采用差分法求解气体轴承的雷诺方程&#xff0c;通过尺寸参数、分形维数对粗糙度表面设置&#xff0c;滑流参数设置&#xff0c;实现气压分布可视化结果显示。程序已调通&#xff0c;可直接运行。 274 气体轴承 随机…

SpringCloud-面试篇(二十三)

&#xff08;1&#xff09;SpringCloud常见组件有那些 有无数微服务需要相互调用&#xff1a;可以用远程调用组件OpenFeign组件&#xff0c;也可以用Dobble 这么多微服务相互调用怎么管理&#xff1a;就用到注册中心组件Nacos&#xff0c;Eureka 所有的服务去找注册中心做注…

【Vue3-Element-Admin 动态路由】涉及到的配置

Vue3-Element-Admin 动态路由 涉及到的配置 0. Vue3-Element-Admin 项目地址1. router/index.ts2. Mock接口模拟数据3. store/permission4. api/menu5. plugins/permission 这篇文章讲的主要是 Vue3-Element-Admin 差不多内置的动态路由配置 (根据后端接口渲染) 先把开发环境&a…

vue3+three.js给glb模型设置视频贴图

1.在网上下载一个显示屏或者自己画一个,在blender中设置好显示屏的Mesh,UV设置好,这样方便代码中添加纹理贴图。可以让美术在建模软件中,先随机设置一张图片作为纹理,验证UV是否设置好 关于如何 在blender中给模型设置UV贴图百度很多的 // 视频 import * as THREE from…

直播回顾丨GQL 与新版本悦数图数据库亮点解析

5 月 23 日&#xff0c;悦数图数据库产品总监方扬亲临直播间&#xff0c;为我们深入剖析了 GQL 的技术内核&#xff0c;以及它如何引领图数据库技术的全新变革。同时&#xff0c;还揭秘了新版悦数图数据库的众多技术特点&#xff0c;让人眼前一亮。 添加图片注释&#xff0c;不…

python的模块

什么是模块&#xff08;Module&#xff09; 在计算机程序的开发过程中&#xff0c;随着程序代码越写越多&#xff0c;写在一个文件里的代码就会越来越长&#xff0c;越来越不容易维护。 为了让代码方便维护&#xff0c;我们将代码进行分类&#xff0c;分别放到不同的文件里。…

Xcode中给UIView在xib中添加可视化的属性

给UIView在xib中添加可视化的属性 效果如下图&#xff1a; 可以直接设置view 的 borderColor 、borderWidth、cornerRadius&#xff0c;也可以单独指定view的某个角是圆角。减少了代码中的属性。 完整代码&#xff1a; UIViewBorder.h #import <UIKit/UIKit.h>inter…

Python - 深度学习系列38 重塑实体识别5-预测并行化改造

说明 在重塑实体识别4中梳理了数据流&#xff0c;然后我发现pipeline的串行效率太低了&#xff0c;所以做了并行化改造。里面还是有不少坑的&#xff0c;记录一下。 内容 1 pipeline 官方的pipeline看起来的确是比较好用的&#xff0c;主要是实现了比较好的数据预处理。因为…

【全网唯一】触摸精灵iOS版纯离线本地文字识别插件

目的 触摸精灵iOS是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务&#xff0c;节省大量人工操作的时间。但触摸精灵的图色功能比较单一&#xff0c;无法识别屏幕上的图像&#xff0c;根据图像的变化自动执行相应的操作。本篇文章主要…

电脑没电关机,wsl和docker又挂了,附解决过程

如题&#xff0c;开了个会没带笔记本电源&#xff0c;点啊弄关机后docker打不开&#xff0c;我以为是docker坏了&#xff0c;结果docker报错&#xff1a; An unexpected error occurred while executing a WSL command. Either shut down WSL down with wsl --shutdown, and/or…

day32--Spring(一)

一、Spring简介 1 Spring课程介绍 问题导入 我们为什么要学习Spring框架&#xff1f; 1.1 为什么要学 Spring技术是JavaEE开发必备技能&#xff0c;企业开发技术选型命中率>90% 专业角度 简化开发&#xff0c;降低企业级开发的复杂性框架整合&#xff0c;高效整合其他技…

概率分布、回归分析、假设检验……用 DolphinDB 函数库快速实现概率统计分析

在金融和物联网等领域&#xff0c;概率统计与分析扮演着至关重要的角色。DolphinDB 作为一款强大的时序数据库&#xff0c;提供了一系列内置的概率统计与分析函数&#xff0c;能够满足用户的各种需求。 金融领域 风险管理&#xff1a;通过概率统计分析&#xff0c;金融机构可…

python数据分析——逻辑回归

参考资料&#xff1a;活用pandas库 逻辑回归 当响应变量为二值响应变量时&#xff0c;经常使用逻辑回归对数据建模。 # 导入pandas库 import pandas as pd # 导入数据集 acspd.read_csv(r"...\data\acs_ny.csv") # 展示数据列 print(acs.columns) # 展示数据集 pri…

进程间通信(27000字超详解)

&#x1f30e;进程间通信 文章目录&#xff1a; 进程间通信 进程间通信简介       进程间通信目的       初识进程间通信       进程间通信的分类 匿名管道通信       认识管道       匿名管道       匿名管道测试       管道的四种…

免费,Scratch蓝桥杯比赛历年真题--第15届蓝桥杯STEMA真题-2024年3月份(含答案解析和代码)

第15届蓝桥杯STEMA真题-2024年3月份 一、单选题 答案&#xff1a;D 解析&#xff1a;y坐标正值表示上&#xff0c;负值表示下&#xff0c;故答案为D。 答案&#xff1a;C 解析&#xff1a;18<25为真&#xff0c;或关系表示一真即为真&#xff0c;故答案为C。 答案&#xff…

2024蓝桥杯初赛决赛pwn题全解

蓝桥杯初赛决赛pwn题解 初赛第一题第二题 决赛getting_startedbabyheap 初赛 第一题 有system函数&#xff0c;并且能在bss上读入字符 而且存在栈溢出&#xff0c;只要过掉check函数即可 check函数中&#xff0c;主要是对system常规获取权限的参数&#xff0c;进行了过滤&…