敏感词检测库ToolGood.Words中 WordsHelper类使用简介

news2025/1/13 6:17:23

  C#开源敏感词检测库ToolGood.Words中的类WordsHelper为文本辅助操作类,支持繁体简体互换、全角半角互换、数字转成中文大写、拼音操作等功能,本文对照参考文献1,对该类的用法进行简要介绍。
  WordsHelper类中主要的辅助函数如下表所示:

序号名称说明
1GetAllPinyin获取单个字符的所有拼音,本函数主要针对多音字,能够返回字符所有的拼音集合,如“好”返回Hao,“查”返回cha和zha。本函数还支持带声调返回,更利于生僻字拼读。
2GetFirstPinyin获取字符串中每个字符的首字母集合,如“我是中国人”返回WSZGR
3GetPinyin函数形式为string GetPinyin(string text, bool tone = false),获取字符串中每个字符的拼音全拼集合,如“我是中国人”返回WoShiZhongGuoRen,支持带声调返回,如WǒShìZhōngGuóRén
4GetPinyin函数形式为string GetPinyin(string text, string splitSpan, bool tone = false),该函数与上一函数为重载函数,唯一区别是支持以指定字符分割每个字符的拼音全拼,如“我是中国人”返回Wo,Shi,Zhong,Guo,Ren
5GetPinyinList获取字符串中每个字符的拼音全拼,以数组形式返回
6GetPinyinForName获取字符串中每个字符的拼音全拼,优先选用姓氏的拼音,如“查文斌“,本函数返回ZhaWenBin,而GetPinyin 返回ChaWenBin
7GetPinyinForName上一函数的重载函数,唯一区别是支持以指定字符分割每个字符的拼音全拼
8GetPinyinListForName获取字符串中每个字符的拼音全拼,优先选用姓氏的拼音,以数组形式返回
9HasChinese判断字符串中是否包含中文
10IsAllChinese判断字符串中是否全中文
11HasEnglish判断字符串中是否包含英文
12IsAllEnglish判断字符串中是否全英文
13ToSBC半角转全角
14ToDBC文字转半角
15ToTraditionalChinese函数形式为string ToTraditionalChinese(string text, int type = 0), 简体转繁体,支持转为多种类型的繁体,包括0、繁体中文,1、港澳繁体,2、台湾正体
16ToSimplifiedChinese函数形式为string ToSimplifiedChinese(string text, int srcType = 0),繁体转简体,支持将多种类型的繁体转为简体,包括0、繁体中文,1、港澳繁体,2、台湾正体
17ToChineseRMB将阿拉伯数字转为中文人民币的形式
18ToNumber将中文人民币形式的文本转为阿拉伯数字

  根据上述函数定义,设计并开发了WordsHelper类的使用测试程序,同时结合之前学习的.net文字转语音模块System.Speech,在文字转拼音时能自动朗读文字,测试程序比较简单,就不再这里列出来了,程序的运行效果如下:
在这里插入图片描述

  测试代码放在了GitHub上,地址为https://github.com/guochao2299/TestToolGoodWords,后续还会继续学习该库的用法(不过该开源项目已经停更了,已经在GitHub的代码注释中说明)。

参考文献:
[1]https://github.com/toolgood/ToolGood.Words

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/24572.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SVM的航空发动机故障诊断系统设计

目录 第1关:准备实验数据 任务描述: 相关知识: 一、获取数据: 二、读取数据集: 三、如何找出对应的数据列: 编程要求: 测试说明: 第二关:数据预处理 任务描述&…

python习题002--字符串处理

目录 一,题目展示: 二,题目解答 a)判断两个字符串是否相等 b)忽略大小写判断两个字符串是否相等 c,d)判断字符串是否以指定的字符串开始或者是结尾 e) 获取字符串的长度 f) 字符串切片&#xff0c…

认定省级专精特新的条件

之前报省级专精特新的一个条件是先认定市级专精特新,但是打算2023年申报省级专精特新的企业就不需要先申请市级的专精特新了,那是可以直接申请省级专精特新吗?并不是! 接下来打算申请2023年省级专精特新的企业需要先认定山东省创…

18.5.4 分布式恢复

文章目录18.5.4 分布式恢复18.5.4.1 分布式恢复的连接18.5.4.1.1 为分布式恢复端点选择地址18.5.4.1.2 分布式恢复的压缩18.5.4.1.3 用于分布式恢复的复制用户18.5.4.1.4 分布式恢复的 SSL 和身份验证18.5.4.2 分布式恢复的克隆18.5.4.2.1 克隆的先决条件18.5.4.2.2 克隆的阈值…

VsCode配置Kotlin运行环境

目录 需求 前置条件 步骤 问题 一 二 结果 需求 设备上有一个 Android Studio 但是太大了, 于是就想着用 VS Code 配置一个轻量级的,而且 VS Code里面好多插件我用着也比较舒服. 前置条件 Java JDK1.8 或者 11 别的版本没试过 有基于Android Studio 的 Kotlinc的环…

c++ - 第12节 - 模板进阶

1.非类型模板参数 模板参数分为类型形参与非类型形参类型形参(可以认为是虚拟类型):出现在模板参数列表中,跟在class或者typename之类的参数类型名称。非类型形参(可以认为是常量):用一个常量作…

带命名空间的arxml读取

一、前言 读取带命名空间的arxml,最好的方式是创建一个字典来存放你自己的前缀并在搜索函数中使用它们: 二、解读如下ns.xml文件: <?xml version"1.0" encoding"UTF-8"?> <AUTOSAR xmlns"http://autosar.org/schema/r4.0" xmlns:xsi…

365天深度学习训练营-第7周:咖啡豆识别

目录 一、前言 二、我的环境 三、代码实现 四、VGG-16框架 五、LeNet5模型 六、模型改进 一、前言 >- **&#x1f368; 本文为[&#x1f517;365天深度学习训练营](https://mp.weixin.qq.com/s/xLjALoOD8HPZcH563En8bQ) 中的学习记录博客** >- **&#x1f366; 参考…

基于STM32G431嵌入式学习笔记——四、LED+KEY+LCD综合练习(基于第12届蓝桥杯显示部分题目)

在学习了前三节LED、LCD、KEY基本操作后&#xff0c;我们就已经成功掌握蓝桥杯必考的三大样内容了&#xff0c;本节以第12届蓝桥杯显示部分内容进行综合练习&#xff1a; 一、真题引入 1.功能概述 2.LCD显示界面 &#xff08;1&#xff09;车位显示界面 &#xff08;2&#…

PostgreSQL数据库缓冲区管理器——本地缓冲区管理

本地缓冲区管理器(local buffer manager)为temporary表&#xff08;无需WAL-logged或checkpointed&#xff09;进行快速缓冲区管理&#xff0c;API定义在src/backend/storage/buffer/localbuf.c中。 获取LocalBuffer 初始化 首先解释temp_buffers GUC参数&#xff0c;其用于…

Servlet学习日志

Hello Web Web World Wide Web 全球广域网->也称为万维网 是一种基于超文本和HTTP协议的分布式应用架构 HTML&#xff08;HyperText Mark-up Language&#xff09;:用于链接网络上的信息 HTTP协议&#xff08;HyperText Transfer Protocol&#xff09;:规定了服务端与客户…

国际海运流程有哪些,国际海运物流哪家比较好

国际海运的优点是运输费划算&#xff0c;并且可以走的货物类目多&#xff0c;合适大物件、大批的长距离运送。进出境运输工具的负责人、进出境物品的所有人或者他们的代理人向海关办理货物、物品或运输工具进出境手续及相关海关事务的过程&#xff0c;包括向海关申报、交验单据…

分析 SpringBoot 底层机制【Tomcat 启动分析 +Spring 容器初始化 +Tomcat 如何关联 Spring 容器 】

目录 一.搭建 SpringBoot 底层机制开发环境 1.pom.xml文件配置 2.springboot主程序MainApp.java 3.启动项目&#xff0c;然后我们准备开始思考 4.开始思考 底层机制分析: 仍然是 我们实现 Spring 容器那一套机制 IO/文件扫描注解反射 集合映射集合映射 二.源码分析: Spri…

DeepLab V2学习笔记

DeepLab V2遇到的相关问题以及解决方法对于DeepLab V1的优化模型总结补充的一个小知识点ASPPLearning rate policy实验结果消融实验实验结果遇到的相关问题以及解决方法 和DeepLab V1中遇到的问题几乎没有什么太大的差别&#xff0c;在文章的引言部分作者提出了在语义分割中遇…

小程序商城拓展中小商户“线上时间”,系统化思维

在数字经济时代初期&#xff0c;新一代信息基础设施建设仍有待完善&#xff0c;在拓展“互联网”应用场景中应不断缩小“数字鸿沟”&#xff0c;逐渐向产业和行业下沉&#xff0c;让互联网巨头和中小微商户共享数字技术的红利&#xff0c;也因此将推动包括传统商户在内的数字化…

政务系统信息网络安全的风险评估

在当今信息时代的大形势下&#xff0c;互联网从普及到飞速发展&#xff0c;政务系统信息网络安全的问题也日益被重视起来。一方面&#xff0c;人们应该了解到政务系统信息网络安全的重要性&#xff1b;另一方面&#xff0c;人们对政务系统信息网络安全风险评估工作有所了解。有…

公厕智能感应皂液盒,无液手机信息提醒

传统式的洗手液一按一压。有时候经常控制不住量&#xff0c;一不小心就容易按多&#xff0c;弄得洗手台乱七八糟&#xff0c;满身也是黏哒哒的&#xff0c;特别让人糟心。刚做完饭&#xff0c;满手油腻&#xff0c;或是刚上完厕所&#xff0c;去按洗手液泵势必会弄脏它。 所以智…

【Python+Appium】开展自动化测试(一)

目录 前言 一&#xff0c;安装JDK&#xff0c;配置JDK环境变量 1&#xff0c;下载jdk 2&#xff0c;安装jdk 3&#xff0c;配置jdk环境变量 二&#xff0c;安装Android SDK&#xff0c;配置Android SDK环境 1&#xff0c;下载Android SDK 2&#xff0c;双击SDK Manager…

【日常记录】解决‘GLIBC_2.34‘ not found,并且gcc制定glibc版本编译

小荣的日常记录 &#x1f525;系列专栏&#xff1a;日常记录 &#x1f389;欢迎关注&#x1f50e;点赞&#x1f44d;收藏⭐️留言&#x1f4dd; &#x1f4c6;首发时间&#xff1a;&#x1f334;2022年11月21日&#x1f334; &#x1f36d;作者水平很有限&#xff0c;如果发现错…

DETR训练自己数据集心得

对QKV的理解&#xff0c;先废一下话... 计算流程参考&#xff1a;https://zhuanlan.zhihu.com/p/82312421 给定一组query&#xff0c;和当前输入样本input&#xff08;每个样本都有各自的key&#xff09;&#xff0c;经过空间变化后input→query。 计算query和key之间的相关…