安卓手机搭建智能语音客服/通话播音/聊天播音乐技术实现

news2025/1/16 8:21:41

声明,此项技术需要root支持,如果因为刷机导致手机变砖或其他不可预料的后果请自行解决。

场景

我有一个朋友他是做业务的,主要还是做电销,其实电销相对于以前纪念没那么好做了(我自己觉得主要是互联网冲击,各个细分领域把对应的流量分走了,于是电销的转化效果就打了折扣,不过电销由于使用的真人发音,在在建立信任度方面,会比文字聊天或者机器人更加有优势)。

但是电销的成本确实也在不断提高,为了节约成本,大家都在想办法,比如我这个朋友他就准备用语音识别+真人录制的方式做客服,因为他的业务本来就很单一,客户问到的问题基本在他们的培训资料上都有标准回答,他们只需要按照这个标准回答回复即可,一方面他觉得枯燥乏味,另一方面,她希望能提高效率,摆脱这种困境。

针对这种场景,我觉得确实可以用自动化来做,而且能大大节约成本,他们希望能把原来的硬件设备能用上,比如手机,sim卡等。在经过认真思考后,我给出了我的低成本的技术架构。

通话替换语音技术

业务分析​

首先,他们的手机是小米6的手机,对于他们业务员来说,其实并没有要求用多好的手机,只要不卡,打电话够用就行。二米6在二手市场上大量的存货,价格基本也就是3,4百一台的样子。加上电话卡每个业务员的硬件成本并不高。主要的投入还是在庞大的业务人员薪资上。如果能够实现自动化,在一定程度上能节省至少一半的业务员的支出。

他问我,最近不是出了个ChatGpt吗,是不是可以用他来做人工客服,然后利用语音合成来做智能机器人。我给比较难,然后出了三点原因:

  1. ChatGpt投入比较大,目前垂直领域的公司用ChatGpt接入到现有系统的公司基本都是大公司,他们利用自己的语料库在原本的大模型上进行训练。而训练大模型需要大量的算例,头部公司的硬件投入就在几十上百万张v100。这对于一般小公司来讲不切实际。而如果仅仅是对于原有模型进行微调,需要用到的硬件成本也不会很低,包括训练工程师以及一个完整的团队。通常来讲,这样去做的都是本着做平台去做的。
  2. ChatGpt的大模型里面包含了众多的语料数据,试想一下,你的智能客服本来是推广产品的,但是和客户聊着聊着变成了瞎聊,完全和业务不沾边,这种情况肯定需要去规避,但是客户可不是经过专门训练的,他不知道应该问那些问题,如果要分割这个大模型,这里面需要做的微调可就多了,不是一时半会能搞定的事情。
  3. 前面说的是成本,在接入后,使用效果也未必能达到想要的效果。可能花了比业务员或者客服更多的钱,但是收效甚微,这就有点不划算。综合考虑,还是先用更容易施行的方案,等Gpt的服务成本下来后在考虑介入进去。

解决方案

那怎么做呢?我是这样架构的:客户通讯录放在后台,应用端请求通讯录数据到手机上,手机开始拨号,拨号出去后电话接通,通过检测接通的信号开始播放预先录制好的音频流。当客户说话的时候停止播放音频流,并将客户过来的额音频流推送到后台服务器进行识别处理,这种音频识别技术在国内已经相当成熟了,有配套的解决方案。转化成文字后,对文字进行关键词检索和匹配,匹配后利用关键词去匹配预先录制好的语料数据,将预料数据推送到客户的电话端。

这种情况下我们并不需要太多的语料,基本上只要将培训时用到的语料都覆盖,就可以解决7成以上的问题,但是由于我们并不是真人,因为也会遇到一些处理不了的情况,比如说客户的发言并没有识别到准确的关键词,或者触发了特定关键词:如人工客服,人工服务等。这个时候就需要业务员或者客服主动介入处理。

在这里插入图片描述

即是说,相对于全人工的情况,上面只有在触发需要人工的时候才会介入。但却又在一开始让客户认为是真人在听他们讲话而且不会对他们的发言做出消极回应。

实际上,我给他算了一下这套方案的成本,主要是这套程序的开发,而这里面最大的技术难点在于手机在接通电话时候接入音频并输送到对方,同时录制对方传过来的声音,以流的方式推送出去。而这套技术我们已经实现了。剩下来的就是做关键词的提取和匹配,以及语音识别等等。有一些系统甚至已经介入了人工合成语音的机器人,但是效果不太理想,我觉得介入这个结束后,转化率和效果会大大提高。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/491365.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[EIS 2019]EzPOP

[EIS 2019]EzPOP 考点&#xff1a; base64加密&#xff0c;解密的时候按4个的倍数 然后数组里面含有 php代码也可以执行 然后学到了解题思路&#xff0c;逆推然后找各个变量的初始值 <?php error_reporting(0);class A {protected $store;protected $key;protected $expire…

JAVA原生语言开发多学校Saas模式校园管理系统

开发语言&#xff1a;JAVA数据库&#xff1a;MySQL后端框架&#xff1a;Spring boot前端框架&#xff1a;VUE2电子班牌&#xff1a; Android 7.1小程序&#xff1a;原生开发多学校Saas 模式 详细技术栈 前后端分离 1、使用springboot框架Javavue2 2、数据库MySQL5.7 3、移动端…

1.数据库的管理(实验报告)

目录 一﹑实验目的 二﹑实验平台 三﹑实验内容和步骤 四﹑命令(代码)清单 五﹑命令(代码)运行结果 一﹑实验目的 了解SQL Server数据库的逻辑结构和物理结构的特点&#xff1b;掌握使用SQL Server管理平台对数据库进行管理的方法&#xff1b;掌握使用Transact-SQL语句对数…

云原生时代崛起的编程语言Go并发编程实战

文章目录 概述基础理论并发原语协程-Goroutine通道-Channel多路复用-Select通道使用超时-Timeout非阻塞通道操作关闭通道通道迭代 定时器-TimerAndTicker工作池-Worker Pools等待组-WaitGroup原子操作-Atomic互斥锁-Mutex读写互斥锁-RWMutex有状态协程单执行-Once条件-Cond上下…

交通拥堵、安全隐患、能源浪费…数字孪生技术助力城市管理现代化

随着智能城市的不断发展&#xff0c;数字孪生技术也开始在智慧城市的建设中得到了广泛应用。数字孪生作为一种数字化的复制技术&#xff0c;它可以模拟真实世界中的实体和过程。 在城市规划方面&#xff0c;数字孪生可以帮助城市规划师更加直观地了解城市的整体规划和发展趋势&…

Python爬虫常用框架

大家都知道python是一门多岗位编程语言&#xff0c;学习python之后可以从事的岗位有很多&#xff0c;python爬虫便在其中&#xff0c;不过很多人对python不是很了解&#xff0c;所以也不知道python爬虫是什么&#xff0c;接下来小编为大家介绍一下。 Python是一门非常适合开发…

Eureka注册中心及Ribbon的源码跟踪

搭建的思路: 一个Eureka注册中心, 两个微服务, 一个为order-service(订单服务), 一个为user-service(用户服务), 在order-service中需要使用user-service中的方法. 步骤: 搭建 Eureka-server服务, 用于服务的消费者和提供者注册服务向注册中心注册user-service服务向注册中心注…

即时通讯开发商如何选择?

随着即时通讯开发技术进步&#xff0c;人与人之间沟通互动更加便利。同时在企业的营销过程中&#xff0c;即时聊天手机APP为企业与消费者提供了即时互动平台&#xff0c;有效增强营销效果。 企业内部沟通、电商客服沟通都是需要用到即时通讯功能。而现在开发即时通讯功能并不是…

Yolov1 源码讲解 detect.py

讲完了训练部分 接下来是检测部分 惯例看看结构 VOC_CLASS_BGR是不同类别应该用什么颜色画框容易区分&#xff0c;比如A用红色&#xff0c;B用绿色&#xff0c;不容易在途中颜色混在一起 画框框 def visualize_boxes(image_bgr, boxes, class_names, probs, name_bgr_dictNon…

这一篇LiveData掉不掉价(使用+粘性事件解决)

1. 简介 LiveData 是一种可观察的数据存储器类。与常规的可观察类不同&#xff0c;LiveData 具有生命周期感知能力&#xff0c;意指它遵循其他应用组件&#xff08;如 activity、fragment 或 service&#xff09;的生命周期。这种感知能力可确保 LiveData 仅更新处于活跃生命周…

要创建富文本内容?Kendo UI Angular组件有专门的编辑器应对!

您的Angular应用程序可能需要允许用户添加带有格式化选项的文本、图像、表格、外观样式和/或链接&#xff0c;使用Kendo UI for Angular的编辑器&#xff0c;可以轻松搞定这些&#xff01; Kendo UI for Angular是专业级的Angular UI组件库&#xff0c;不仅是将其他供应商提供…

Final关键字的使用技巧及其性能优势

文章目录 概念Final关键字的基本用法Final关键字的使用技巧Final关键字的性能优势总结 概念 Java中的final关键字用于修饰变量、方法和类&#xff0c;可以让它们在定义后不可更改&#xff0c;从而提高程序的稳定性和可靠性。此外&#xff0c;final关键字还有一些使用技巧和性能…

YAPI--撰写接口文档的平台

1 YAPI 1.1 YAPI介绍 在前后台分离开发中&#xff0c;我们前后台开发人员都需要遵循接口文档&#xff0c;所以接下来我们介绍一款撰写接口文档的平台。 YApi 是高效、易用、功能强大的 api 管理平台&#xff0c;旨在为开发、产品、测试人员提供更优雅的接口管理服务。 其官…

opencv实践之图像拼接

目录 1.简介2. 步骤2.1 特征检测与提取2.2 关键点检测2.3 关键点和描述符2.4 特征匹配2.5 比率测试2.6 估计单应性 3. 完整代码 1.简介 图像拼接是计算机视觉中最成功的应用之一。如今&#xff0c;很难找到不包含此功能的手机或图像处理API。在本 文中&#xff0c;我们将讨论如…

Ubuntu在线安装及卸载MySQL

目录 1 安装 1.1 更新包管理工具apt-get 1.2 安装MySQL服务器端 1.3 安装MySQL客户端 1.4 初始化配置 1.5 检查MySQL服务状态 2 卸载 2.1 查看MySQL依赖项 2.2 卸载mysql-common 2.3 再卸载 mysql-server-8.0 2.4 再用dpkg --list|grep mysql查看&#xff0c;还剩什么…

MySQL -- 基础

目录 1. 数据库的操作 1.1 显示当前数据库 1.2 创建数据库 1.3 使用数据库 1.4 删除数据库 2. 常用的数据类型 2.1 数值类型 2.2 字符串类型 2.3 日期类型 3. 表的操作 3.1 查看表的结构 3.2 创建表 3.4 删除表 1. 数据库的操作 1.1 显示当前数据库 show databases; 1.2…

网络安全合规-Tisax(三)

一、什么是TISAX? TISAX 可信信息安全评估与交换标准是基于ISO 27001信息安全管理体系标准和VDA-ISA信息安全评价检查表而建立的汽车行业专用信息安全标准。TISAX 为汽车行业内不同服务商提供了信息安全评估结果互认的模式&#xff0c;供应商通过了该评估&#xff0c;即意味着…

如何访问chatGPT-国内上chatGPT的方法

如何在国内使用GPT 在国内使用 GPT&#xff08;Generative Pre-trained Transformer&#xff09;技术&#xff0c;可以实现多种自然语言处理和语义分析的任务&#xff0c;如机器翻译、聊天机器人、文本生成、问答系统等。但对于许多人来说&#xff0c;如何在国内使用 GPT 技术…

Java每日一练(20230505) 递增路径、编辑距离、数据流

目录 1. 矩阵中的最长递增路径 &#x1f31f;&#x1f31f;&#x1f31f; 2. 编辑距离 &#x1f31f;&#x1f31f;&#x1f31f; 3. 数据流的中位数 &#x1f31f;&#x1f31f;&#x1f31f; &#x1f31f; 每日一练刷题专栏 &#x1f31f; Golang每日一练 专栏 Pyt…

解决修改es默认host时的问题

微信公众号也不定期更新&#xff0c; leetcode_algos_life 背景 es默认只能是在非root场景下进行启动&#xff0c;且默认host是本地地址&#xff0c;即localhost或者是127.0.0.1。 当线上部署restful服务时&#xff0c;此时如果其他服务与es服务不在同一台机器上&#xff0c;会…