“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

news2024/9/28 6:30:10

“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

    • 1. 背景介绍
      • 1.1 场景痛点
      • 1.2 方案选型
    • 2. 准备开发环境
    • 3. PaddleSpeech 语音识别快速使用
    • 4. PaddleNLP 信息抽取快速使用
    • 5. 语音工单信息抽取核心功能实现
    • 6. 语音工单信息抽取网页应用
      • 6.1 网页前端
      • 6.2 网页后端
      • 6.3 aistudio服务演示
      • 6.4 启动服务
      • 6.5 构造Post请求测试
    • 服务

本文将介绍如何利用 PaddleSpeech 的语音识别技术与 PaddleNLP 的通用信息抽取技术,实现基于智能语音指令解析的关键工单信息提取。我们将通过语音交互的方式,在交通报销场景下实现智能信息抽取,以提高工作效率与质量。

1. 背景介绍

智能语音指令解析集成了语音识别(ASR)与信息抽取(IE)等技术,广泛应用于智能语音填单、语音交互、手机APP语音唤醒等场景,提高人机交互效率。其中,智能语音填单可通过口述记录信息,并利用算法解析口述内容中的关键信息,完成自动信息录入。

1.1 场景痛点

  • 电话分析:边询问边记录,容易遗漏关键信息,例如社区疫情防控信息记录。
  • 工单生成:特定场景下无法完成文字录入,如电力路线巡检工作人员在高空巡检高压电线路。
  • 信息登记:重复性工作效率低易出错,例如汽车售后客服话务员每天接听大量电话。

针对以上场景,利用PaddleSpeech的语音识别技术和PaddleNLP的信息抽取技术,可以自动识别和抽取语音中的关键信息,帮助简化记录流程,提高工作效率和质量。

1.2 方案选型

  • PaddleSpeech语音识别模型:包含多种领先国际水平的语音算法与预训练模型,提供简单易用的语音识别功能。
  • PaddleNLP通用信息抽取模型(UIE):支持实体识别、关系和事件抽取、情感分析等多种信息抽取任务,具有良好的泛化效果。

2. 准备开发环境

安装PaddleSpeech与PaddleNLP:

!pip install paddlespeech
!pip install paddlenlp

下载必要数据包与示例音频,并进行初始化设置。

3. PaddleSpeech 语音识别快速使用

通过PaddleSpeech调用语音识别方法简单易行:

from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="ie.wav", force_yes=True)
print(result)

4. PaddleNLP 信息抽取快速使用

利用PaddleNLP提供的信息抽取能力,直接调用Taskflow API进行预测:

from paddlenlp import Taskflow

schema = ["时间", "出发地", "目的地", "费用"]
ie = Taskflow("information_extraction", schema=schema, task_path="/home/aistudio/work")

ie_result = ie(result)
print(ie_result)

5. 语音工单信息抽取核心功能实现

将语音识别与信息抽取功能进行串联,实现语音工单信息抽取的核心功能模块:

def audio_ie(audio_path):
    asr_result = asr(audio_file=audio_path, force_yes=True)
    ie_result = ie(asr_result)
    return ie_result

audio_ie("ie.wav")

6. 语音工单信息抽取网页应用

构建网页应用,通过前后端交互实现语音工单信息抽取的服务。

6.1 网页前端

利用Vue框架,结合js-audio-recorder库实现网页前端的录音功能。

6.2 网页后端

利用FastAPI框架搭建后端服务,核心功能为语音信息抽取函数。

6.3 aistudio服务演示

在aistudio中,通过FastAPI搭建网页应用,模拟网页调用语音工单信息提取的后端服务。
在这里插入图片描述

6.4 启动服务

启动FastAPI服务,提供后端服务支持。

6.5 构造Post请求测试

通过requests库构造Post请求,模拟调用语音工单信息提取的后端服务。

通过以上步骤,你可以快速上手使用PaddleSpeech与PaddleNLP实现语音工单信息提取的应用,提高工作效率与质量。

服务

🛠 博主提供一站式解决方案,让您的工作变得更加轻松、高效!以下是我们提供的服务:

  1. 代部署

    🚀 为您提供快速、稳定的部署方案。无论是您的应用程序、网站还是其他软件项目,我们都可以帮助您将其部署到适当的平台上。

  2. 课程设计选题

    📚 为您量身定制符合课程要求和学生需求的选题方案。无论是基础课程还是高级课程,我们都能够为您提供专业的建议和支持。

  3. 线上辅导

    💻 提供线上辅导服务,为您提供个性化的指导和支持,帮助您解决在学习、工作或研究中遇到的各种问题和困难。
    如有需求,请随时私信

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1473261.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3. Java中的锁

文章目录 乐观锁与悲观锁乐观锁(无锁编程,版本号机制)悲观锁两种锁的伪代码比较 通过 8 种锁运行案例,了解锁锁相关的 8 种案例演示场景一场景二场景三场景四场景五场景六场景七场景八 synchronized 有三种应用方式8 种锁的案例实际体现在 3 个地方 从字节码角度分析 synchroni…

ARM 版银河麒麟桌面系统下 Qt 开发环境搭建指南

目录 前言安装Linux ARM 版 QtCreator配置 Qt Creator配置构建套件 第一个麒麟 Qt 应用程序小结 前言 在上一篇文章信创ARM架构QT应用开发环境搭建中建议大家使用 Ubuntu X86 系统作为信创 ARM 架构 QT 应用的开发环境,里面使用了交叉编译的方式。这对于自己的 Qt …

AI与大数据:智慧城市安全的护航者与变革引擎

一、引言 在数字化浪潮的席卷下,智慧城市正成为现代城市发展的新方向。作为城市的神经系统,AI与大数据的融合与应用为城市的安全与应急响应带来了革命性的变革。它们如同城市的“智慧之眼”和“聪明之脑”,不仅为城市管理者提供了强大的决策…

【算法与数据结构】684、685、LeetCode冗余连接I II

文章目录 一、684、冗余连接 I二、685、冗余连接 II三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、684、冗余连接 I 思路分析:题目给出一个无向有环图,要求去掉一个边以后构成一个树&#xf…

PyQt6的开发流程(密码生成小程序为例)

PyQt6的开发流程(密码生成小程序为例) 文章目录 PyQt6的开发流程(密码生成小程序为例)一、流程介绍与概览1. 界面与逻辑分离的开发流程2. PyQt6的开发流程 二、打开 designer.exe 创建文件三、用QT设计师绘制界面保存成ui1. QT常用…

急中生智:献血200cc没事,为啥出血200cc就可能噶?

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 卷圈 运营 / SandLiu 卷圈 监制 / 姝琦 封面 / 姝琦Midjourney 产品统筹 / bobo 场地支持 / 声湃轩北京录音间 外伤出血更常见,但同样可能危及生命。 众所周知,出血是一种常见的外伤和急症&…

家装服务管理:Java技术的创新应用

✍✍计算机毕业编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java、…

ONLYOFFICE 桌面编辑器 v8.0 更新内容详细攻略

文章目录 引言PDF 表单RTL 支持电子表格中的新增功能Moodle 集成用密码保护 PDF 文件从“开始”菜单快速创建文档本地界面主题下载安装桌面编辑工具总结 引言 官网链接: ONLYOFFICE 官方网址 ONLYOFFICE 桌面编辑器是一款免费的文档处理软件,适用于 Li…

APP被针对攻击了,要怎么解决

随着APP行业的兴起,游戏公司异军突起,不管是在控证还是攻击方面都是属于最复杂的一个场面,游戏APP逐渐成为DDOS流量攻击的“重灾区”。没有提前做好了解就盲目进军游戏APP行业,一旦被攻击就会让公司束手无策。那么,刚上…

基于springboot实现的海鲜销售系统

一、系统架构 前端:html | bootstrap | vue | js | css 后端:springboot | springdata-jpa 环境:jdk1.8 | mysql | maven | redis 二、代码及数据库 三、功能介绍 01. web端-注册 02. web端-登录 03. web端-首页 04. web端-…

k8s节点负载使用情况分析命令kubectl describe node [node-name]

1.到任意安装了kubectl节点命令的节点上执行kubectl describe node [node-name] 上面的Requests最小分配 Limits最大分配是所有pod之和,最小分配之和不能超过服务器实际参数,否则新的pod会因为资源不够起不来,最大分配是预设之和&#xff0…

移动端学习:如何把exe转换成apk

exe转换成apk是怎么实现的呢?-电脑端-一门科技将exe文件转换成apk文件是一个比较常见的需求,尤其是对于一些开发者和用户来说。但是,这个过程并不是简单的复制和粘贴。在本文中,我们将介绍exe转换成apk的原理和详细介绍。首先,我们需要了解什么https://www.yimenapp.net/k…

数据安全-动态加密(不同敏感字段使用不同的加密算法-MySQL、Oracle版本)

动态数据加密 动态加密(也称实时加密,透明加密等,其英文名为encrypt on-the-fly),是指数据在使用过程中自动对数据进行加密或解密操作,无需用户的干预,合法用户在使用加密的文件前,…

服务器权限:Error: EACCES: permission denied, open‘/Cardiac/uniquC.csv

背景: 我想在服务器上传一个文件uniquC.csv,但是服务器说我没有权限 解决方案: 1. 查看目前是否存在对文件夹的权限 ls -ld /Cardiac/ # your fold path 此时,我发现 这也意味着root也没有赋予写的权限。 2. 拿到root权限 …

Python爬虫-模拟Github登录并获取个人信息

爬虫系列:http://t.csdnimg.cn/WfCSx 前言 很多情况下,页面的某些信息需要登录才可以查看。对于爬虫来说,需要爬取的信息如果需要登录才可以看到的话,那么我们就需要做一些模拟登录的事情。 在前面我们了解了会话和 Cookies 的…

人脸2D和3D道具SDK解决方案提供商

人脸识别和增强现实技术成为了许多企业和开发者关注的焦点,为了满足市场对高质量、易于集成的人脸识别SDK的需求,美摄科技推出了一系列领先的人脸2D/3D道具SDK解决方案。 一、产品特点 高精度识别:美摄科技的人脸识别技术采用深度学习算法&…

【博士每天一篇文献-综述】A Modified Echo State Network Model Using Non-Random Topology

阅读时间:2023-11-23 1 介绍 年份:2023 作者: Arroyo, Diana Carolina Roca,数学与计算机科学研究所(ICMC)圣保罗大学 (USP) 期刊: 博士论文 引用量:0 这篇论文是一篇博士论文&am…

PostgreSQL 与MySQL 对比使用

一、前言 博主的系统既有 用到MySQL 也有用到PostgreSQL ,之所以用到这两种数据库,主要是现在都是国产替代,虽然说这两款数据库也不是国产的,但是相对开源,oracle是不让用了。所以现在使用比较多的就是这两个关系型数据…

geotools解析shp 提示 opengis.*.SimpleFeatureType‘ 不在其界限内

问题:( geotools.version:31-SNAPSHOT) 解析shp文件时提示类型SimpleFeatureType不在其界限内 解决: 在引用处将org.opengis.feature.simple.SimpleFeatureType 改为 org.geotools.api.feature.simple.SimpleFeatureType

Web JavaScript

目录 1 前言2 原生js常见用法2.1 弹窗操作2.2 for循环操作2.3 打印日志操作2.4 获取页面值操作2.5 判空操作2.6 修改页面内容操作2.7 网页版计算器制作 3 外部js常见用法4 总结 1 前言 JavaScript 是一种脚本,一门编程语言,它可以在网页上实现复杂的功能…