使用sherpa-onnx给文字添加标点符号

news2025/1/9 14:29:28

上篇文章https://blog.csdn.net/AWNUXCVBN/article/details/138372795 识别出的文字都是没有标点符号的,虽然可以添加整句断行,但总觉得怪怪的…… 于是看了一下,ncnn没有添加标点符号的功能,翻了一下onnx有示例,但没有C#的,于是照着搞了一番

using System.Runtime.InteropServices;

namespace SherpaOnnx
{
    public class OfflinePunctuation : IDisposable
    {
        private HandleRef _handle;

        public OfflinePunctuation(SherpaOnnxOfflinePunctuationConfig config)
        {
            IntPtr intPtr = OfflinePunctuation.SherpaOnnxCreateOfflinePunctuation(config);
            this._handle = new HandleRef(this, intPtr);
        }

        public string AddPunctuation(string text)
        {
           return SherpaOfflinePunctuationAddPunct(this._handle.Handle,text);
        }

        public void Dispose()
        {
            this.Cleanup();
            GC.SuppressFinalize(this);
        }

        ~OfflinePunctuation()
        {
            this.Cleanup();
        }

        private void Cleanup()
        {
            OfflinePunctuation.DestroyOfflinePunctuation(this._handle.Handle);
            this._handle = new HandleRef(this, IntPtr.Zero);
        }

        [DllImport("sherpa-onnx-c-api", EntryPoint = "SherpaOnnxDestroyOfflinePunctuation")]
        private static extern IntPtr DestroyOfflinePunctuation(IntPtr handle);

        [DllImport("sherpa-onnx-c-api", EntryPoint = "SherpaOnnxCreateOfflinePunctuation")]
        private static extern IntPtr SherpaOnnxCreateOfflinePunctuation(SherpaOnnxOfflinePunctuationConfig config);

        [DllImport("sherpa-onnx-c-api", EntryPoint = "SherpaOfflinePunctuationAddPunct")]
        private static extern string SherpaOfflinePunctuationAddPunct(IntPtr ptr, string text);
    }
}
namespace SherpaOnnx
{
    public struct SherpaOnnxOfflinePunctuationConfig
    {
        public SherpaOnnxOfflinePunctuationModelConfig model;
    }
}

namespace SherpaOnnx
{
    public struct SherpaOnnxOfflinePunctuationModelConfig 
    {
        public string ctTransformer = "";
        public int numThreads = 1;
        public bool debug = true;
        public string provider = "cpu";

        public SherpaOnnxOfflinePunctuationModelConfig (string ctTransformer, int numThreads, bool debug, string provider)
        {
            this.ctTransformer = ctTransformer;
            this.numThreads = numThreads;
            this.debug = debug;
            this.provider = provider;
        }
    }
}
SherpaOnnx.SherpaOnnxOfflinePunctuationConfig soopc = new SherpaOnnx.SherpaOnnxOfflinePunctuationConfig();
SherpaOnnx.SherpaOnnxOfflinePunctuationModelConfig soopmc =
    new SherpaOnnx.SherpaOnnxOfflinePunctuationModelConfig
    (Environment.CurrentDirectory + "/sherpa-onnx-punct-ct-transformer-zh-en-vocab272727-2024-04-12/model.onnx", 1, false, "cpu");
soopc.model = soopmc;
offlinePunctuation = new SherpaOnnx.OfflinePunctuation(soopc);
Console.writeLine(offlinePunctuation.AddPunctuation("When you only have one life that's what makes it special"));

看起来一切顺利,运行一下,不出意外的出意外了
在这里插入图片描述
微信群里@fangjun大佬指点了一番,说是要设置系统使用utf8编码
在这里插入图片描述
设置重启之后,正常了!

在这里插入图片描述
另外,大佬说,这个加标点模型,支持中英文。默认所有的标点,都是中文标点,即使你输入的都是英文。

最后,案发现场在https://github.com/xue-fei/uSherpaServer.git

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1643840.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【测试报告】网页聊天室

⭐ 作者:Jwenen 🌱 作者主页:Jwenen的个人主页 💖 持续更文,关注博主少走弯路,谢谢大家支持 💖 测试报告 1. 编写目的2. 项目介绍3. 功能测试用例4. 自动化测试源码 1. 编写目的 本报告为网页聊…

【华为】AC直连二层组网隧道转发实验配置

【华为】AC直连二层组网隧道转发实验配置 实验需求拓扑配置AC数据规划表 AC的配置顺序AC1基本配置(二层通信)AP上线VAP组关联--WLAN业务流量 LSW1AR1STA获取AP的业务流量 配置文档 实验需求 AC组网方式:直连二层组网。 业务数据转发方式:隧道转发。 DHC…

Odoo14修改登录界面,实现炫酷粒子效果

目录 原登录界面 最终效果 实现步骤 插件下载 原登录界面 最终效果 实现步骤 1 odoo创建插件web_login 2 在static目录下编写css和js文件 login.css代码 html, body {position:fixed;top:0px;left:0px;height:100%;width:100%;/*Fallback if gradeints dont work */b…

ASP.NET网上车辆档案管理系统

摘 要 本文采用基于Web的Asp.net技术,并与sql server 2000数据库相结合,研发了一套车辆档案管理系统。该系统扩展性好,易于维护。简化了车辆档案设计流程,去除了冗余信息。汽车销售企业可以通过本系统完成整个销售及售后所有档案…

python数据分析——数据分析概念定义和发展前景

数据分析概念定义和发展前景 前言一、数据分析概念二、数据的定义2.1数据的定义2.2数据的分类 三、数据的价值数据为什么具有价值 四、数据分析的目的对于企业来说 五、数据分析类型的划分5.1描述性统计分析5.2 探索性数据分析5.3 传统的统计分析方法5.4验证性数据分析 六、 数…

[答疑]系统需求并不会修改领域事实(警惕伪创新)

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 jeri 2024-4-17 12:59 潘老师,在整理领域模型时,这个申请是有多次的,直到申请成功,多重性是* ,但分析模型时,需…

【题解】NowCoder Fibonacci数列

题目来源:牛客 题目链接:Fibonacci数列 Fibonacci数列 题目描述: Fibonacci 数列是这样定义的: F[0] 0 F[1] 1 for each i ≥ 2 : F[i] F[i-1] F[i-2] 因此,Fibonacci 数列就形如:0, 1, 1, 2, 3, 5…

STM32 PWM波定时溢出中断

打开定时器和中断 主函数初始化开启PWM和中断 HAL_TIM_PWM_Start(&htim2,TIM_CHANNEL_1); __HAL_TIM_SET_COMPARE(&htim2, TIM_CHANNEL_1, Pwm_data); HAL_TIM_Base_Start_IT(&htim2); 回调函数中判断是否为tim2 void HAL_TIM_PeriodElapsedCallback(TIM_Han…

Vue阶段练习:初始化渲染、获取焦点、记账清单

阶段练习主要承接Vue 生命周期-CSDN博客 ,学习完该部分内容后,进行自我检测,每个练习主要分为效果显示、需求分析、静态代码、完整代码、总结 四个部分,效果显示和准备代码已给出,我们需要完成“完整代码”部分。 练习…

Redis-五大数据类型-List(列表)

五大数据类型-List(列表) 简介 List是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)。 底层是一个双向链表,对两段操作性能极高&#…

【Linux系统】冯•诺依曼体系结构与操作系统

本篇博客整理了操作系统相关的基础知识,先从硬件之冯•诺依曼体系结构,再结合软件之操作系统,旨在帮助读者理解计算机的软硬件资源,和操作系统的管理软硬件资源的手段。 目录 一、冯•诺依曼体系结构 1.计算机硬件设备 2.体系…

mac自定义快捷键打开系统应用

最终效果是达成altg直接打开浏览器,解放双手、再也不需要移动鼠标双击打开应用啦!!!~ 1.commandspace输入自动操作 2.选择快速操作 3.选择使用工具、运行appleScrpit 4.输入打开浏览器代码 tell application "G…

Delta lake with Java--分区表

今天尝试一下将昨天的数据操作建立的表换成分区表,参考Delta Lake Up and Running做法用分区表的方式来更新数据。还要比较一下分区表的查询与非分区表的查询,结果显示分区表的查询速度要比非分区表要快。直接上代码: import io.delta.table…

使用memcache 和 redis 、 实现session 会话复制和保持

一、NoSQL介绍 NoSQL是对Not Only SQL、非传统关系型数据库的统称 NoSQL一词诞生于1998年,2009年这个词汇再次提出指非关系型、分布式、不提供ACID的数据库设计模式 随着互联网时代的数据爆发时增长、数据库技术发展的日新月异,要适应新的业务需求&am…

JavaWeb_请求响应_简单参数实体参数

一、SpringBoot方式接收携带简单参数的请求 简单参数:参数名与形参变量名相同,定义形参即可接收参数。并且在接收过程中,会进行自动的类型转换。 启动应用程序后,在postman中进行测试: 请求成功,响应回了O…

eve 导入linux

mkdir /opt/unetlab/addons/qemu/linux-centos7 cd /opt/unetlab/addons/qemu/linux-centos7 上传hda.qcow2 /opt/unetlab/wrappers/unl_wrapper -a fixpermissions Linux images - (eve-ng.net) Due to very high demand of this section and problems with how to crea…

# 在 Windows 命令提示符(cmd)中,可以通过以下方法设置长命令自动换行

在 Windows 命令提示符(cmd)中,可以通过以下方法设置长命令自动换行 1、点击 cmd 窗口左上角标题栏,选择【属性】。 2、在【属性】菜单中,依次点击【选项】,找到【编辑选项】下面的【自动换行】&#xff…

Vue CLI脚手架项目目录和运行流程介绍

目录 一、项目目录介绍 二、运行流程介绍 一、项目目录介绍 二、运行流程介绍 项目在启动时会先运行main.js main.js的核心代码如下 1.导入Vue import Vue from vue 2.导入App.vue import App from ./App.vue 3.实例化Vue,将App.vue渲染到index.html容器中 new Vue({r…

为什么说虚拟化技术是现代网络安全的重要组成部分?

虚拟化技术是一种对计算机资源的抽象和资源管理技术,将电脑的各种实体资源(CPU、内存、磁盘空间、网络适配器等)予以抽象、转换后呈现出来,并可供分割、组合为一个或多个电脑配置环境。今天德迅云安全带您了解为什么虚拟化技术能成…

dp 动态规划 力扣

64. 最小路径和 给定一个包含非负整数的 m x n 网格 grid ,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。 说明:每次只能向下或者向右移动一步。 示例 1: 输入:grid [[1,3,1],[1,5,1],[4,2,1]] 输…