ChatGPT已进化到会看图和说话了,上教程

news2025/2/23 17:04:04

HI,同学们,我是赤辰,本期是第14篇AI工具类教程,文章底部准备了粉丝福利,看完后可领取!


ChatGPT又又又升级!这次是支持语音聊天和图像问答。


这意味着用户现在除了键盘文本输入外,还可以选择通过语音或图片与ChatGPT互动。这为用户带来了更广泛的交流方式和更高的便捷性,丰富了与ChatGPT的互动体验。


根据官网介绍,在未来两周,将为 Plus 和 Enterprise 用户在 ChatGPT 中引入语音和图像功能。语音功能将在 IOS 和 Android 平台上推出(可以在设置中选择使用),而图像功能将适用于所有平台。


接下来详细演示一遍操作流程


1.语音功能

目前语音功能仅限于手机端使用,在手机上打开ChatGPT后,选择“设置”。


be332bdb40ce7b8a31a89eca0b714f04.jpeg


接着点击“新功能”选项,再选择启用语音交互功能。


acaf7c903e63e1183e71f5f790bbbbf3.jpeg


之后,打开语音交互选项。


62eb594fe21679175740f32140eadc98.jpeg


接下来,点击主界面右上角的耳机图标,从五个可选的声音中挑选你心仪的一个声音。


2144d30bce04df7dbfc67c72aa5ef75f.jpeg


经亲测,SKY 的中文发音较为流利。其他的普通话发音都有点像马来西亚华人口音!


8408462a905438eed87078819fc50b66.jpeg


备注:新的语音功能使用的是先进的文本到语音模型。这个模型能够基于纯文本和短暂的语音样本产生近似人声的音频。OpenAI与资深配音演员合作,为这每一种声音赋予独特的音色。此外,还采用了Whisper,这是一个开放源代码的语音识别系统,用以将用户的语音转化为文字。


点击右上角的耳机符号,启动语音互动功能。


a213b327dc5cbb4c36cc588c76986002.jpeg


这个页面显示系统正在连接


46a938f945c2e3772f20b42a18c44d4e.jpeg


进入这个界面代表GPT正在听你讲话


fa2933c21b169e5171712f43f63a79b9.jpeg


GPT 回复时,屏幕上会显示 4 个跳动的圆圈


d89a0254c75410be8e92dcfce80a9839.jpeg


让我震惊的是ChatGPT居然能理解中国各个地方的方言!用方言跟GPT 聊天,它会用普通话回答你,所有的对话都会同时以文字形式记录,不过目前语音交互模式暂时不支持实时联网。


ChatGPT的语音功能,基本可以实现需要语音输入和输出的应用场景。例如,可以用它来讲述入睡前的故事、进行口语练习(支持多种语言)、答疑、导航指示等等,大家可以发挥脑洞创意,探索更多潜在的有趣应用。


2.图像识别功能


ChatGPT的最新图像识别功能允许用户上传一张或多张图像,然后与GPT-4模型进行对话,目前电脑端或手机端均可使用图像识别功能。


网页端具体操作:进入主页后,选择GPT-4,接着点击Default模型,可以看到对话框有个小图标,就是图片上传的端口,上传图片提问即可。


65ee6252f1c6615d9ac60aef43fda48e.jpeg


不过亲测网页端的图片识别上传后,系统容易出现卡顿的情况,手机端操作会更顺滑一些,不仅支持在线拍摄发送,也支持图库上传。这里我发送了一张图片让GPT识别,居然回答得完全正确,确实厉害。


379bfe2ce309838e4a5a80ea05c968cd.jpeg


663326fc87771577ba543417f82a9c95.jpeg


当然啦,你可以拍摄冰箱中当前存放的食物照片。将这些照片上传ChatGPT后,让它基于所拥有的食材为晚餐提供烹饪做法的建议及说明。


还可以拍摄孩子的数学问题照片,然后让它给出向孩子解释如何解决这个问题的建议等等,宝妈宝爸感叹辅导费又能省一大笔钱啦,实在太好玩了,大家赶紧去试试吧!


OK,本期内容就到这,最后,我也给粉丝们准备了福利,我们内部开发的完整【GPT/Midjourney/SD】使用教程,私信我即可领取,备注:教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1064131.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JavaEE】多线程进阶(一)饿汉模式和懒汉模式

多线程进阶(一) 文章目录 多线程进阶(一)单例模式饿汉模式懒汉模式 本篇主要引入多线程进阶的单例模式,为后面的大冰山做铺垫 代码案例介绍 单例模式 非常经典的设计模式 啥是设计模式 设计模式好比象棋中的 “棋谱”…

三一充填泵:煤矿矸石无害化充填,煤炭绿色高效开采的破局利器

富煤贫油少气是我国的能源禀赋特征,决定了我国以煤炭为主的能源结构,煤炭为国民经济发展提供了重要的基础。煤炭开采过程会对土地、地下水、空气等环境造成较大的污染,但大宗固废煤矸石无害化充填的技术手段可以有效改善这样的情况&#xff0…

LabVIEW使用机器学习分类模型探索基于技能课程的学习

LabVIEW使用机器学习分类模型探索基于技能课程的学习 教育中的学习评估对教育工作者来说是一项繁琐的工作,但评估的好处是显着的。由于其开放性和复杂性,使用传统的评估方法为学生提供及时的支持一直具有挑战性。在Covid-19大流行期间突然转向在线学习&…

总结二:linux面经

文章目录 1、 Linux中查看进程运行状态的指令、查看内存使用情况的指令、tar解压文件的参数。2、文件权限怎么修改?3、说说常用的Linux命令?4、说说如何以root权限运行某个程序?5、 说说软链接和硬链接的区别?6、说说静态库和动态…

QT聊天室阶段性记录(完善中:注册功能,数据库存储)

server.h #ifndef SERVERDEMO_H #define SERVERDEMO_H#include <QObject> #include <QTcpServer> #include <QMap> #include <QSqlDatabase> //数据库管理类 #include <QSqlQuery> //执行sql语句的类 #include <QSqlRecord> //数据库…

最全MacBook选购指南 | 看完你就知道怎么买

最全MacBook选购指南 | 看完你就知道怎么买 作为MacBook的老用户大大小小的型号也都用了不少 那这么多台MacBook到底怎么选呢&#x1f4a1; . ☑️M1和Intel的MacBook有什么差别呢&#xff1f; 下半年苹果发布的两款MacBook都是苹果自研的芯片M1。在此之前苹果一直用的都是Inte…

解决报错:模块“react-redux“没有导出的成员“TypedUseSelectorHook”

在react整合typescript,redux时&#xff0c;写hook.ts时报这个错&#xff1a;模块"react-redux"没有导出的成员“TypedUseSelectorHook” 现象如下&#xff1a; 原因&#xff1a;react-redux版本太低&#xff0c;至少要升级到7.2.3以后才能包含TypedUseSelectorHook…

Clion中使用C/C++开发stm32程序

前言 从刚开始学习阶段&#xff0c;一直是用的keil5开发stm32程序&#xff0c;自从看到稚晖君推荐的CLion开发嵌入式程序后&#xff0c;这次尝试在CLion上开发stm32程序。 1、配置CLion用于STM32开发的环境 这里我就不详细写了&#xff0c;没必要重新写&#xff0c;网上教程很多…

【Java项目推荐之黑马头条】自媒体文章实现异步上下架(使用Kafka中间件实现)

自媒体文章上下架功能完成 需求分析 流程说明 接口定义 说明接口路径/api/v1/news/down_or_up请求方式POST参数DTO响应结果ResponseResult DTO Data public class WmNewsDto {private Integer id;/*** 是否上架 0 下架 1 上架*/private Short enable;}ResponseResult 自媒…

哈希/散列--哈希表[思想到结构][==完结版==]

文章目录 1.何为哈希?1.1百度搜索1.2自身理解1.3哈希方法/散列方法1.4哈希冲突/哈希碰撞1.5如何解决?哈希函数的设计 2.闭散列和开散列2.1闭散列/开放定址法2.2开散列/链地址法/开链法1.概念2.容量问题3.字符串问题4.开散列性能测试5.开散列与闭散列比较 3.代码实现[配备详细…

【Luckfox pico入门记录(一)】开发环境与工具链

写在前面 最近刷bilibili发现微雪电子关于luckyfox pico的介绍视频&#xff0c;感叹linux开发板居然可以把价格缩到100RMB以内&#xff0c;也正巧结束了复旦微比赛&#xff0c;受够了FM33LC046N的低性能&#xff0c;来玩点便宜又高性能的板子。   开发板型号&#xff1a;luck…

【JavaEE】_构造HTTP请求与HTTPS

目录 1. 构造HTTP请求 1.1 form标签构造HTTP请求 1.1.1 form标签构造GET请求 1.1.2 form标签构造POST请求 1.2 通过ajax构造HTTP请求 1.3 form与ajax 1.4 使用ajax构造HTTP请求 2.HTTPS 2.1 对称加密 2.2 非对称加密 2.3 证书 1. 构造HTTP请求 1.1 form标签构造HTT…

软考高项-第五章:信息系统工程

重点知识点&#xff1a; 以上总结&#xff0c;仅供参考。

MacBook内存空间不够该怎么办?

随着使用时间的增长&#xff0c;我们会发现Macbook电脑的存储空间越来越少&#xff0c;这时候我们就需要对Mac电脑进行清理&#xff0c;以释放更多的存储空间。那么&#xff0c;Mac空间不足怎么解决呢&#xff1f; 1.清理垃圾文件 Mac空间不足怎么解决&#xff1f;首先要做的就…

C#和Excel文件的读写交互

C#和Excel文件的读写交互是一项重要的技术&#xff0c;在许多应用程序开发中起着关键作用。C#作为一种现代的面向编程语言&#xff0c;提供了丰富的库和功能&#xff0c;使开发人员能够轻松地处理Excel文件&#xff0c;并进行数据的读取和写入。 首先&#xff0c;让我们了解一下…

matlab矩阵计算

1.a&#xff08;10,6&#xff09;&#xff0c;b&#xff08;6,5&#xff09;&#xff0c;那么a*b得到的是10行5列。第一个的数组的行数等于第二个数组的列数。得到的矩阵是第一个矩阵的行数和第二个矩阵的列数。 2.矩阵的除法&#xff0c;符号为“\”&#xff0c;这时就需要前一…

单调栈介绍和使用

前言&#xff1a; 今天来讲一下单调栈&#xff0c;它定义是非常简单的&#xff0c;首先栈是一种先进后出、后进先出的数据结构。而单调栈&#xff0c;就是说栈中的元素是严格单调递增或者递减的。它主要用来解决的问题&#xff1a;找到前一个或者后一个的最大或者最小元素。属…

力扣 -- 446. 等差数列划分 II - 子序列

解题步骤&#xff1a; 参考代码&#xff1a; class Solution { public:int numberOfArithmeticSlices(vector<int>& nums) {int nnums.size();//把元素和它对应的所有下标绑定存放到哈希表中unordered_map<double,vector<int>> hash;for(int i0;i<n;…

Day-08 基于 Docker安装 Nginx 镜像-反向代理

此时静态页面网站已经部署上了&#xff0c;但是还是会显示一个端口8080出来&#xff0c;就十分不美观&#xff01; ps: 怎么把端口干掉呢&#xff1f;换成XXXXX.com/demo1 或者 XXXXX.com/demo2这种效果呢&#xff1f; eg: 可以使用 Nginx的反向代理实现&#xff01; 1.开始反…