【抢先体验】开通使用 ChatGPT 语音版功能保姆级教程

news2024/9/19 11:15:45

image.png
大家好,我是苍何,一个土木转码的非典型程序员,也是一名技术管理者,同时也是 AI 应用的探索者。今天在视频号上看到和 ChatGPT 语音对话的视频,其声音的真实感太让人震撼了,于是也想去抢先体验一下 ChatGPT 语音版功能

网上搜索了许久,没找到相关实用教程,且很难找到语音版的入口。据 OpenAI 官方消息,在接下来的两周内,将向 Plus 和企业用户推出语音功能。那我们如何抢先体验该功能呢?

OpenAI官方对语音版的说明

本文将分享如何抢先体验 ChatGPT 语音版,并详细讲解使用指南。

一、什么是 ChatGPT 语音版

2023年9月25日 OpenAI 推出多模态功能,即 ChatGPT 将支持语音和图像。新的语音功能由新的文本到语音模型提供支持,该模型能够仅通过文本和几秒钟的示例语音生成类似人类的音频。OpenAI 与专业配音演员合作创作了每个声音。还使用开源语音识别系统 Whisper 将口语转录为文本。

**ChatGPT 语音版说白了就是能直接通过语音和 ChatGPT 进行对话,**让人震惊的是其声音的真实感和回答的逻辑性一度逼近贾维斯的感觉。

OpenAI 关于语音版公告

二、如何开通使用 ChatGPT 语音版

由于此功能现在还属于内侧阶段,仅部分用户能体验到,我这里说的是我亲测有效的方法(前提需要安卓手机)。大体流程是:安卓手机安装 Google Play,申请加入 Beta 测试,下载 ChatGPT Beta 版本,开通 plus 账号,打开语音入口。
以下是流程图。

2.1、申请加入 Beta 测试

这是最关键的一步,就是目前从应用商店下载的都是稳定版,很多未受邀请用户暂时无法体验,那我们需要申请加入 Beta 测试才可抢先体验该功能。这里以安卓的 Google Play 为例,演示如何加入 Beta 测试。

申请加入 Beta 测试

账号申请 Beta 测试需要几分钟,加入成功后我们就可以看到如上图提示,这个时候我们直接下载测试版本。一般而言,测试版本非稳定版本,但确是最新版本,也是我们抢先体验功能的基础。

2.2、开通 plus 账号

目前仅有 plus 账号才可抢先体验,所以需要开通。如何开通 plus 相信大家都已经会了,这里不赘述,但值得注意的是,由于 OpenAI 的封控策略,一定要注意尽量不要在 web 端开通以及尽量保证网络的「清洁」。

2.3、开通语音入口

打开设置
设置页面
点击 Beta Features

点击 Beta Features

开启 Voice conversations

开启 Voice conversations

注意:这里的 Browse with Bing 是 ChatGPT 的联网功能,我们以前需要通过插件联网,现在直接打开这个开关即可联网了。

点击主页图标

点击主页图标

开启语音对话

开启语音对话

查看对话历史

查看对话历史
我们每进行的一轮语音对话,均会以文本的形式进行对话展示,方便随时进行查看。

三、ChatGPT 语音版使用指南

3.1、哪些用户可以进行语音对话?

Plus 和 ChatGPT 企业计划的所有用户。其中 ChatGPT 企业计划管理员可以在管理工作区设置中为其用户切换可用性。预计一周之后会慢慢开放。

3.2、哪些应用程序可以进行语音对话?

语音对话可在适用于 iOS 和 Android 的 ChatGPT 移动应用程序上进行。

3.3、有多少个语音选项?

ChatGPT 从五种逼真的输出声音中进行选择,每种声音都有自己独特的音调和字符。可以通过 Setttings-Speech-Voice 进行声音选择。个人试验看 Breeze 对中文支持性更好。

语音设置

五种声音类型

3.4、我可以在语音对话中使用哪些模型?

GPT 3.5 和GPT 4 可用于语音对话。
请记住,对于Plus用户,GPT-4 每 3 小时有50条消息的上限。对于企业计划上的用户,没有消息上限。

3.5、我可以为语音对话设置音量限制吗?

在 ChatGPT 中,语音对话没有音量限制。音量将在设备本身上设置。

3.6、我可以在同一对话中使用ChatGPT视觉功能和语音对话吗?

可以使用视觉功能在聊天中启动语音对话,就像可以使用 GPT 3.5 或 GPT 4 在对话中启动语音对话一样。

3.7、为什么需要打开聊天记录和培训才能使用语音对话?

聊天记录和来自数据控件的培训必须切换,以便能够进行语音对话,以便可以查看对话的笔录。

主要是使用数据来提高模型性能,以何使用内容 (包括语音聊天的转录) 来改善服务和选择。

3.8、语音对话会不会保存音频

在测试版期间,来自语音对话的音频片段不会保存。ChatGPT 将音频片段发送到 Whisper API 以转录它们,但处理后不会保留它们。

要找到历史对话,可以在 ChatGPT 对话历史中找到语音对话中的文本转录。

3.9、语音对话是免提的吗?

一旦你进入语音对话,它是免提的,直到你退出语音对话。(相信以后会慢慢开放更多功能)
有手动控件,可暂停,继续和退出语音对话。

3.10、语音对话使用

开始对话:
要开始语音对话,需要点击耳机图标。建立连接后,ChatGPT 将听你讲话。
开启对话

暂停语音对话:
暂停语音对话
中断语音对话:
当ChatGPT正在说话时,您可以点击以中断:
中断

或者你可以点击停止图标:
停止图标
恢复语音对话:
点击恢复图标,然后重新开始
恢复语音对话
取消语音对话的静音:
点击取消静音。
点击取消静音
退出语音对话:
要退出语音模式,请点击 X 图标以结束语音对话,并返回到使用 ChatGPT 的基于文本的对话。
退出语音对话

3.11、可以让语音对话暂停多久?

没有限制,理论上可以无限时间暂停。

3.12、 收到 “对不起,我不能帮忙” 的回复是什么原因?

这是由于 ChatGPT 的安全措施造成的。如果提示符合,可以通过聊天中的“竖起大拇指/竖起大拇指” 选项向 ChatGPT 发送反馈。

四、总结

想象一下,当语音对话支持 API,我们可以把他集成到手机(虽然现在的 sari 也能如此,但还不够智能),放到人型机器人上,那不就是现实版的贾维斯吗?相信这一天不远了。拥抱 AI 才是普通人的破局之道。

全文完,你的点赞是对苍何创作最大鼓励\(^ ^)/


苍何个人介绍.png

创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。
文章最下方关注图片.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1061636.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

学习记忆——宫殿篇——记忆宫殿——记忆桩——卧室——莫兰勋爵在地铁走失的案子

《神探夏洛克》第三季第一集中提到“思维殿堂”,其实指的就是记忆宫殿。讲述了一个名叫莫兰勋爵在地铁走失的案子,这里简单给大家罗列以下破案信息: 订阅报纸的男人、伦敦养狗的女人、穿着黑色运动的非裔女人、松木、云杉、雪松、新樟脑球、碳…

js——深拷贝和浅拷贝

深拷贝和浅拷贝是只针对Object和Array这样的引用数据类型的。对于基本数据类型,例如字符串、数字、布尔值等,由于它们是按值传递的,所以不存在深拷贝和浅拷贝的问题。 深拷贝 将对象从内存中完整拷贝出来,从堆内存中开辟一个新的…

mac电脑任务管理器 Things3 for Mac中文

Things 3是一款效率软件,可以帮助用户规划一天行程、管理项目,并使使用者按部就班地朝目标迈进。以下是Things 3的主要特点和功能: 待办事项:以“待办事项”为基本组成部分,每一则待办事项都是迈向大成就的一小步。用…

【每日一题】买卖股票的最佳时机含冷冻期

文章目录 Tag题目来源题目解读解题思路方法一:动态规划空间优化 写在最后 Tag 【动态规划】【数组】【2023-10-05】 题目来源 309. 买卖股票的最佳时机含冷冻期 题目解读 这是股票系列问题的第五篇了,要求求出买卖股票的最佳时期以获得最大的利润&…

基于spirngboot人事考勤管理信息系统

一:功能介绍 本系统前端采用vue框架以及Elemnt-UI,后端采用springboot、mysql、redis、mybatis等技术栈。 主要功能有登录、员工考勤、数据统计、薪资管理、权限管理、打卡管理、考勤审核、请假审批、薪资发放、报表统计、文件上传、文件下载、考勤设置、请假设置。…

Spring Boot注册Web组件

文章目录 什么是Web组件?注册Servlet注册Filter注册Listener总结 🎉欢迎来到架构设计专栏~Spring Boot注册Web组件 ☆* o(≧▽≦)o *☆嗨~我是IT陈寒🍹✨博客主页:IT陈寒的博客🎈该系列文章专栏:架构设计&a…

安装matplotlib__pygame,以pycharm调入模块

安装pip 安装matplotlib 安装完毕,终端输入pip list检查 导入模块出现bug,发现不是matplotlib包的问题,pycharm版本貌似不兼容,用python编辑器可正常绘图,pygame也可正常导入。 ​​​​​​​ pycharm版本问题解决 终…

k8s集群-7 service

工作负载的应用是如何暴露出去的 解决访问问题 Service可以看作是一组提供相同服务的Pod对外的访问接口。借助Service,应用可以方便地实现服务发现和负载均衡。 service默认只支持4层负载均衡能力,没有7层功能。(可以通过Ingress实现) service的类型: C…

【每日一题】买卖股票的最佳时机含手续费

文章目录 Tag题目来源题目解读解题思路方法一:动态规划空间优化 写在最后 Tag 【动态规划】【数组】【2023-10-06】 题目来源 714. 买卖股票的最佳时机含手续费 题目解读 本题与 122. 买卖股票的最佳时机 II 如出一辙,仅仅是增加了交易的手续费用。 解…

人工智能:定义未来,揭开历史神秘面纱,展望无限可能!

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是尘缘,一个在CSDN分享笔记的博主。📚📚 👉点击这里,就可以查看我的主页啦!👇&#x…

python读取vivo手机截图,将满屏图片文件移动别的路径

问题之初 python读取vivo手机截图, 将满屏图片文件移动别的路径好多这样的图片,占用手机大量的内存,食之无味弃之可惜!那么会复制粘贴👀代码的我们我们今天就把这些图片筛选清理掉。 这段代码 原有逻辑的基础上&…

MySQL中的 增 删 查 改(CRUD)

目录 新增 insert into 表名 value(数据,数据),.......; insert into 表名(列1,列2.....) value(数据,数据),.......; datatime 类型的数据如何插入? 查询 select * from 表名…

太阳 IT

太阳是我们太阳系的中心星体,也是地球上最重要的能源来源之一。太阳的直径约为109倍地球,质量也大约是地球的33万倍。它以极高的温度和压力维持着核聚变反应,将氢气转化为氦气,释放出巨大的能量和光辐射。 太阳对地球的影响非常广…

【Linux】进程探秘

文章目录 一、什么是进程?1.1写一个进程 二、操作系统是如何管理的进程的呢?2.1描述进程-PCB2.2组织进程 三、Linux下是怎么做的?3.1task_struct-PCB的一种3.2task_ struct内容分类3.3linux中组织进程3.4查看进程的相关属性 🍀小结…

【物联网】STM32的中断机制不清楚?看这篇文章就足够了

在嵌入式系统中,中断是一种重要的机制,用于处理来自外部设备的异步事件。STM32系列微控制器提供了强大的中断控制器,可以方便地处理各种外部中断和内部中断。本文将详细介绍STM32中断的结构和使用方法。 文章目录 1. 什么叫中断2. 中断优先级…

Spring Cloud Gateway:打造可扩展的微服务网关

文章目录 什么是微服务网关?Spring Cloud Gateway的优势使用Spring Cloud Gateway构建微服务网关步骤1:添加依赖步骤2:创建路由配置步骤3:创建过滤器步骤4:运行应用程序 进一步探索结论 🎉欢迎来到架构设计…

Ubuntu Server CLI专业提示

基础 网络 获取所有接口的IP地址 networkctl status 显示主机的所有IP地址 hostname -I 启用/禁用接口 ip link set <interface> up ip link set <interface> down 显示路线 ip route 将使用哪条路线到达主机 ip route get <IP> 安全 显示已登录的用户 w…

一看就懂系列:阿里云服务器ECS和轻量云服务器对比

阿里云服务器ECS和轻量应用服务器有什么区别&#xff1f;轻量和ECS优缺点对比&#xff0c;云服务器ECS是明星级云产品&#xff0c;适合企业专业级的使用场景&#xff0c;轻量应用服务器是在ECS的基础上推出的轻量级云服务器&#xff0c;适合个人开发者单机应用访问量不高的网站…

【小沐学前端】Windows下搭建WordPress(nginx1.25、PHP8.2、WordPress6.3、MySQL5.7)

文章目录 1、简介1.1 Nginx1.2 PHP1.3 WordPress1.4 MySQL 2、下载2.1 Nginx2.2 PHP2.3 WordPress2.4 MySQL 3、搭建环境3.1 Nginx3.2 PHP3.3 WordPress3.4 MySQL 4、配置WordPress4.1 选择语言4.2 配置数据库4.3 登录界面4.4 常规设置4.5 写作操作 结语 1、简介 WordPress是基…