在11月7日凌晨,OpenAI全球开发者大会宣布了 GPT-4的一次大升级,推出了 GPT-4 Turbo号称为迄今为止最强的大模型。
此次GPT-4的更新和升级在多个方面显示出强大的优势和潜力。为了让集简云用户能快速体验新模型的能力,我们第一时间整理了大会发布的模型,并率先将新模型接入到集简云中:
● 新增GPT-4 Turbo with Version: 带视觉识别的GPT4模型
● 新增GPT-4 Turbo 模型:支持最大128K上下文内容
● 新增Dall.E 3 图像模型
● 更新Whisper模型
● 更新GPT-3.5模型
● 新增GPT3.5 Fine Tuning微调功能
新增GPT-4 Turbo with Version: 带视觉识别的GPT4模型
功能亮点
在此次模型升级中,带有视觉能力的 GPT-4 Turbo也备受瞩目,GPT-4-vision-preview已突破文本限制,可以直接在聊天框中分析图像照片,提供详细分析和读图功能。
可以预见的是,开放GPT-4图像输入能力,意味着AI向新领域的进军,也势必会引发业务模式与应用使用的巨大变革。在很多涉及视觉工作(图片和视频)解析的业务场景中,将有更多重复劳动被释放,提升高价值工作的专注力。
使用示例
示例1: 截图提问
可以通过截图向GPT4 V模型提问:
汽车的这个指示灯亮了,我该怎么办?
这个指示灯是发动机故障警告灯,通常被称为“Check Engine”或“Service Engine Soon”灯。当这个灯亮起时,表示你的车辆检测到了发动机或排放控制系统中的一个问题。以下是一些你可以采取的步骤:
不要恐慌。这个指示灯可能表示多种问题,从轻微到严重不等。
检查油箱盖是否已经正确地拧紧。一个松动的油箱盖可以触发这个警告灯。
注意车辆的表现。如果你注意到任何不寻常的行为,比如发动机失去动力、怠速不稳或有奇怪的噪音,请尽快将车辆停靠在安全的地方。
尽快检查。虽然有时车辆可能仍然可以正常行驶,但最好尽快将车辆带到专业的汽车维修店进行诊断。继续行驶可能会导致更严重的损坏。
使用OBD-II(车载诊断系统)阅读器获取故障代码。许多汽车配件店提供免费的故障代码读取服务,或者你可以购买或借用一个阅读器来自己获取代码。
决定是否继续行驶之前,请考虑到你的安全和车辆的状况。如果不确定如何处理,请咨询专业的汽车技师。
示例2:生成商品描述文案
请帮助我生成商品描述:
商品名称:抽象艺术印花连帽卫衣
商品描述:
材质:采用高品质混纺棉质料,提供舒适的穿着体验和持久的耐用性。
设计:这款连帽卫衣特有的亮点在于其正面大胆的抽象艺术印花,色彩鲜明,充满现代感,为经典的黑色卫衣注入了活力和创意。
风格:适合追求个性和艺术氛围的年轻人,无论是日常穿搭还是街头风格,都能轻松驾驭。
特点:宽松的版型设计,配有可调节的抽绳帽和宽大的前袋,增加了实用性并保持了卫衣的经典元素。
适用场合:无论是户外活动、休闲娱乐,还是艺术展览,这款卫衣都是理想的选择,能够让你在人群中脱颖而出。
搭配建议:可与牛仔裤、休闲裤或运动裤搭配,配上一双板鞋,轻松打造出时尚的街头造型。
注意:为保持印花图案的完整性和色彩鲜亮,建议按照洗护标签的指示进行清洗。
示例3: 根据网站截图生成类似的网站代码:
我们截图了网易音乐的首页:
然后在语聚AI的“对话助手”中选择GPT4 Vision模型并要求其生成一个类似网站的代码
更多使用示例
Screen to Code是一个开源项目,其利用GPT4V模型的能力,可以将一个网站截图转换为网站代码,生成类似的网站
快来试试GPT4V的最新能力吧!
如何使用?
方式1: 在数据流程搭建时选择OpenAI(ChatGPT)付费版 (无需OpenAI账户)
方式2:数据流程搭建时选择ChatGPT原生(需要OpenAI账户)
方式3: 语聚AI(http://chat.jijyun.cn)的对话助手中
GPT-4 Turbo
功能亮点
● 超长文本理解,语言交互再升级
相较于GPT-4支持最多32k token,GPT-4 Turbo的出众之处在于支持128k上下文,相当于 300 页文本,在处理长篇对话和内容生成方面的能力更强大了!
是成为客户支持聊天机器人、虚拟助理等实时应用程序的最佳选择,该最新模型的性能可以确保用户在几秒钟内获得准确且相关的响应,更深入您的业务场景,实现真正无缝、自然的对话。
例如:复制近 90 分钟的写作讲座字幕,在GPT-4中输入总结的指令,GPT-4 Turbo迅速整理出了该讲座每个部分的要点,并且还可以根据每个要点进行深入扩展。
● 知识库更新,生成信息更准确
GPT-4对于知识知识截止于2021年9月,而GPT-4 Turbo外部文档和数据库的截止日期更新到了2023年4月,这意味着它可以生成更准确、更新的信息,我们可以用它来生成更贴近时事的文本,也可以与用户进行更有趣的对话。
● 价格更低,输入输出更快
GPT-4 Turbo在综合能力更出色,而价格方面却比GPT-4便宜得多。GPT-4 Turbo在输入方面比GPT-4便宜3倍,输出方面比GPT-4便宜2倍,支持用户将GPT-4 Turbo使用在更多业务场景中。
如何使用?
方式1: 在数据流程搭建时选择OpenAI(ChatGPT)付费版 (无需OpenAI账户)
方式2: 在数据流程搭建时选择ChatGPT原生应用 (需要OpenAI账户)
方式3: 语聚AI(http://chat.jijyun.cn)的知识助手、对话助手中
DALL·E 3
DALL·E 3与DALL·E 2的对比
与DALL·E 2相比,DALL·E 3表现出更卓越的性能和更细腻的细节处理能力更让人欣喜。即使在相同的提示下,DALL·E 3生成的图像在细节、清晰度和明亮度等方面均超越了DALL·E 2,大幅降低了提示词的门槛,同时语义理解和细节描绘能力大幅增强。
另外DALL·E 3可以在ChatGPT原生中直接使用,我们可以直接通过ChatGPT来创建和优化提示词,使图像生成过程更为直观和便捷。不仅减小了提示词门槛,用户还可以通过对话式交互来迭代和完善图像,为创作者提供更具个性化的体验。
效果展示
描述词:
一个可爱的小刺猬,蜷缩成球状。它拥有一副柔和的棕色毛皮和一层深褐色的尖刺。这些尖刺平滑而有光泽,小刺猬的脸圆润,带着一点点好奇和天真的表情。它的眼睛像两颗发亮的黑色小珠子,闪烁着友好的光芒,四肢短小,却显得坚实有力,小小的爪子深藏于绒密的腹毛之下。 在它面前,有几颗红莓和树叶作为它的小零食,整个场景被温暖和柔和的阳光照耀,创造出一种宁静和愉悦的氛围,小刺猬就这样安静地坐在一片绿油油的草地上,享受着宁静的时光。
DALL·E 2
DALL·E 3
描述词:
拟人化的秋叶组成了一支民间乐队,在乡村的森林中,它们演奏着传统的蓝草音乐,点缀着满月撒下的柔和月光。
DALL·E 2
DALL·E 3
描述词:
帮助我生成一个车水马龙的交通图片,4K,写实照片风格
DALL·E 2
DALL·E 3
通过两个版本的比较,我们可以看到DALL·E 3不仅更贴近现实,而且在语义理解与细节还原上效果更好,使得生成的图像更具真实感和吸引力。
如何使用?
方式一:在内置OpenAI DALL·E中使用
方式2: 在数据流程搭建时选择ChatGPT原生应用 (需要OpenAI账户)
方式3:语聚AI应用助手添加该应用
Whisper
全面升级
Whisper 是 OpenAI 开源的一款语音转文本模型。新版本 Whisper large-v3也正式上线,其特点是提高了各种语言的识别性能,能快速准确地将音频转录成文本,并且也可以在ChatGPT原生中直接使用。
应用场景
● 视频及电话会议:将会议纪要语音转换为文本,使得会议记录更加准确,也方便后续的阅读和分析。
● 语音翻译:Whisper可以将一个语言的语音转换为相应的文字,再通过机器翻译算法将其翻译成目标语言的文本,使人们能够跨越语言和文化的障碍进行交流。
● 讲座记录:对大型讲座或演讲的语音内容进行实时记录,使得听众可以更加专注于演讲内容,而不必担心遗漏笔记。
● ......
如何使用
方式1:数据流程搭建时选择内置应用OpenAI Whisper(无需账户)
方式2:您可以在数据流程搭建时选择ChatGPT原生应用 (需要OpenAI账户)
方式3: 语聚AI应用助手中添加OpenAI Wisper