ChatGPT重磅升级:可以看图、听声音、说话啦!

news2024/11/27 17:40:07

美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。

早在今年3月OpenAI发布GPT-4模型时,就展示过看图的功能,但由于安全、功能不完善等原因一直没有开放。现在不仅开放了看图,连识别声音也来了,这是OpenAI实现AGI(通用人工智能)战略重要技术环节。

OpenAI表示,在接下来的两周内,向Plus和企业版用户提供看、听、说功能。语音功能将在 iOS 和 Android上使用,图片识别全平台可以使用。

在这里插入图片描述

用语音与ChatGPT交流

ChatGPT新的语音功能由一个文本到语音模型提供支持,能够仅通过文字和几秒钟的样本语音生成类似人类的音频。

OpenAI与专业的配音演员合作,创建了5种合成语音,同时使用了自研开源语音识别系统 Whisper,将用户的语音转录成文本。

简单来说,以后用户想将文本直接生成语音,可以在ChatGPT中完成了。

文本直接生成语音,可以在ChatGPT中完成了。

例如,让ChatGPT听一段小猫咪的文本故事,然后选择人类语音便可以一键完成转录。完成后,用户可以下载这段语音。

在这里插入图片描述

可以向ChatGPT提问图片
用户可以向ChatGPT展示一张或多张图片,提问相关的问题。例如,发送一张坏掉的烧烤炉图片,然后询问无法启动原因;拍摄一张冰箱中的食材,询问多种菜品制作方案。

可以通过移动端的绘图功能将其框起来进行发问

如果用户只想询问图片中的部分内容,可以通过移动端的绘图功能将其框起来进行发问。
ChatGPT的图片理解功能由 GPT-3.5 和GPT-4 提供技术支持,可理解的图片类型包括照片、屏幕截图或包含文本的图片等。
提供安全的AI服务
OpenAI表示,其目标是构建既安全又有益的AGI(通用人工智能)。所以,ChatGPT的功能正在逐步推出。这样做的好处是,可以让OpenAI有时间进行改进,逐步完善安全漏洞、风险。
特别是新的语音技术,可以在几秒内就能生成真实的合成声音,这可能会为诈骗者提供了便利条件,所以,这种安全的研发策略对于涉及语音和视觉的高级模型非常重要。
目前,Spotify已经使用ChatGPT的语音功能,开发一款语音翻译助手,可以将博主的声音自动翻译成其他语言,扩大用户群体。而Be My Eyes将ChatGPT的看图功能,植入在应用中,为盲人和弱视群体提供服务。
本文素材来源OpenAI官网,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1042239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《玩转smardaten | 无代码开发移动端APP需要几步?最全操作!》

看完这么多免编程、无代码APP软件开发的文章,还是一脸茫然😮...只讲能开发出什么玩意,不讲到底怎么开发,我怎么学会? 来了,无代码的移动端操作教程,从PC移动端一体式开发,到移动端单…

python+nodejs+php+springboot+vue 导师双选系统

为了直观显示系统的功能,运用用例图这样的工具显示分析的结果。分析的导师功能如下。导师管理导师选择信息,管理项目,管理项目提交并对学员提交的项目进行指导。 为了直观显示系统的功能,运用用例图这样的工具显示分析的结果。分析…

Golang 函数 不定参数

不定参数 在C语言时代大家一般都用过printf()函数,从那个时候开始其实已经在感受不定参数的魅力和价值。如同C语言中的printf()函数,Go语言标准库中的fmt.Println()等函数的实现也严重依赖于语言的不定参数功能。 我们将介绍不定参数的用法。合适地使用…

✔★ 算法基础笔记(Acwing)(五)—— 动态规划【java版本】

动态规划 一、背包问题★f[i][j] 背包容量为j,前i个物品的最大价值 1. 01背包问题(不需要初始化) ✔1.6 ✔1.72. ☆ 完全背包问题(后面的 前面的某一项的最大值)一、朴素做法(三重循环)二、二维数组的优化&#xff08…

OpenCV 实现 SIFT→SURF 算法关键点检测实现

1,SIFT算法原理 1.1,基本流程 1.1.1 尺度空间极值检测 1.1.2 关键点定位 1.1.3 关键点方向确定 、 1.1.4 关键点描述 1.1.5 总结 1.2 SURF原理 2 代码实现 import cv2 as cv import matplotlib.pyplot as plt import numpy as np from pylab i…

open ai chartgpt 安装插件 txyz.ai

1 chatgpt 页面 左下角 用户 -> setting 2 3

RK3568驱动指南|第五期-中断-第44章 共享工作队列实验

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

2023年深圳等保测评机构名称以及地址汇总

你知道深圳等保测评机构有哪些?知道在哪里吗?今天我们小编就给大家汇总一下。 2023年深圳等保测评机构名称以及地址汇总 序号:1 名称:深圳市信息安全管理中心 地址:深圳市福田区莲花街道福中路城市数字资源中心 序…

CMake 官方完整版

CMake 官方完整版 一些概念TargetSignature 1. A Basic Starting Point(Step 1)Adding a Version Number and Configured Header FileSpecify the C StandardBuild and Test 2. Adding a Library(Step 2)-添加一个库Adding an Option 3. Adding Usage Requirements for Library…

【Verilog 教程】4.8Verilog 过程连续赋值

关键词:deassign,force,release 过程连续赋值是过程赋值的一种。这种赋值语句能够替换其他所有 wire 或 reg 的赋值,改写了 wire 或 reg 型变量的当前值。 与过程赋值不同的是,过程连续赋值的表达式能被连续的驱动到 …

pinyin-match选择器拼音快速检索目标

npm地址:https://www.npmjs.com/package/pinyin-match 选择器拼音快速检索目标(pinyin-match) 一. 使用方法二. 使用实例三. 实现效果 一. 使用方法 安装 pinyin-match 包 yarn add pinyin-match 或 npm install pinyin-match --save 引入 …

3分钟,免费制作一个炫酷实用的数据可视化大屏!

在当前大数据时代背景下,数据已成为在工业革命中如同煤炭、石油一般宝贵的资源。但是由于数据越来越庞大、越来越复杂,导致数据的可读性也越来越低。因此,对数据可视化的需求也越来越高,需要解决的问题也越来越复杂,而…

测试工程师高效编写API测试

1、自动化测试流程 我一直有编写自动化测试的习惯,但之前一直没有达到最理想的效果,也在反思问题出现的原因,最近终于有了一些思路。其主要的原因是之前写测试都是靠感觉,感觉哪些需要测试了,就写一个测试&#xff0c…

【面试必刷TOP101】二分查找-I 二维数组中的查找

目录 题目:二分查找-I_牛客题霸_牛客网 (nowcoder.com) 题目的接口: 解题思路: 代码: 过啦!!! 题目:二维数组中的查找_牛客题霸_牛客网 (nowcoder.com) 题目的接口&#xff1…

emacs怎么安装插件

2023年9月26日,周二下午 目录 Linux下Emacs的配置文件位置包管理器elpa怎么给elpa换源罗列可按照的插件怎么搜索插件怎么安装插件配置插件 Linux下Emacs的配置文件位置 默认配置文件位置是 ~/.emacs 或 ~/.emacs.d/init.el 如果没有inti.el的话,自己创…

产品经理如何进行项目管理?

在网上总是有人认为产品经理和项目经理不是一路人,工作上也没有什么共性,认为项目管理仅仅是项目经理的活,其实不然。一个项目从初始到结束这一整个周期,产品经理都是需要全程盯着的。 那么优秀的产品经理是怎么管理项目的呢&…

7、如何使用Flink中的窗口(Window算子)

目录 1、如何理解 Flink中的窗口(window) 2、Flink中窗口的类型 2.1 根据上游DataStream类型分类 2.2 根据驱动类型分类 2.3 根据进入到窗口数据的分发规则分类 3、怎样使用 Flink中的 Window算子 4、怎样使用 Flink中的 Window Assigners 4.1、…

Python 进阶 - 日常工作中使用过的简单Trick

引言:无论你是一名初学者还是有一定经验的开发者,这些技巧都能帮助你更好地利用Python来解决问题、提高效率和写出更干净、可维护的代码。无论你是数据科学家、Web开发者、自动化脚本编写者还是其他领域的从业者,这些技巧都能对你有所帮助。 …

Linux 日期、时区

1、date命令 通过date命令可以在命令行中查看系统的时间 date [-d] [格式化字符串] -d 按照给定的字符串显示日期,一般用于日期计算 格式化字符串:通过特定的字符串标记,来控制显示的日期格式 %Y 年 %y 年份后两位数字 (00..99) %m …