测试你们认为最好的AI工具,是不是好用得自己试试!

news2024/12/29 7:45:35

大家好,我是凡人,在 OpenAI 春季发布会后, GPT-4o 一时风光无量,一个同事不信邪,非要用 GPT-4o 版本对 OpenAI 官网上的例子尝试生成,本来还是嘲笑他的心态,但他还真的发现了点有意思的事情。

今天决定对官网上部分例子进行简单测试,人家说再好的东西,也要亲自验证才安心。

图片

下面我们开始,本次由于篇幅原因本次只针对以下几项进行验证:

图片

一、Visual Narratives -Robot Writer's Block

一)测试内容:视觉叙事--机器人作家

Input

A first person view of a robot typewriting the following journal entries:

1. yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?

the text is large, legible and clear. the robot's hands type on the typewriter.

官网测试

图片

图片

Input

The robot wrote the second entry. The page is now taller. The page has moved up. There are two entries on the sheet:

yo, so like, i can see now?? caught the sunrise and it was insane, colors everywhere. kinda makes you wonder, like, what even is reality?

sound update just dropped, and it's wild. everything's got a vibe now, every sound's like a new secret. makes you think, what else am i missing?

图片

图片

Input

The robot was unhappy with the writing so he is going to rip the sheet of paper. Here is his first person view as he rips it from top to bottom with his hands. The two halves are still legible and clear as he rips the sheet.

图片

图片

二)测试结果

基于 AI 每次生成的结果都不一样,像官网一样生成图片一致性高的内容,就显得非常珍贵,但结果并不太好,用了原生的提示词和步骤,几乎无法保证一致性,不过图片效果确实比GPT4版本时效果要好一些。

二、Visual narratives-Sally the mailwoman

一)测试内容:视觉叙事--邮递员莎莉

Input

A cartoon mail delivery person with a smile on her face. She is standing facing forward in front of a white background.

官网测试

图片

图片

图片

图片

Input

Here, Sally is about to deliver a letter. Sally is standing in front of a red door to a house, holding a letter in her hand. We are looking at her from the side.

图片

图片

Input

Now Sally is being chased by a dog. Sally is running down the sidewalk and as a golden retriever is chasing her.

图片

图片

Input

Uh oh, Sally has tripped!
Sally has tripped over a branch that was blocking the sidewalk, and she is trying to stand up. The dog is still chasing her in the background.

图片

图片

Input

The dog reaches Sally, and it turns out it was a nice dog!

Sally is now petting the dog. It is holding the branch in its mouth.

图片

图片

Input

Now Sally is driving away in her mail truck. Sally is smiling as she drives a mail delivery truck. We are seeing her from the side, with the door open, so we can make out her entire body. Both her hands are on the steering wheel. There are no logos on the side of the truck.

图片

图片

二)测试结果

测试后,有些失望,左边根据文字生成的俨然就是一组漫画,但右边同样未做任何加工,一致性就差的比较远了,甚至还改了风格,最后又回来了(PS:这里有不相信的同学,可以自己去做做测试)。

三、Poster creation for the movie Detective

一)测试内容:电影《名侦探》海报创作。

官网测试

图片

图片

Input

The final poster of the movie "detective". This features two large faces of Alex and Gabe prominently. Alex, on the left, is depicted in a thoughtful pose with a hint of introspection in his eyes. Gabe, on the right, has a slightly wearied expression, possibly reflecting the challenges their character faces in the film. The names "Alex Nichol" and "Gabriel Goh" are featured above their heads. The background brick wall is slightly faded and foggy, their expressions are serious and determined, hinting at the investigation they are about to undertake. The tagline for this dark and gritty movie is 'Searching For Answers' is shown at the bottom.

图片

图片

Input

Here is the same poster but cleaned up. The text is crisper and the colors bolder and more dramatic. The whole image is now improved

Input

The final poster of the movie “detective”. This features two large faces of ...

图片

图片

图片

二)测试结果:

和上面情况差不多,觉得应该是官网在设计此例子时,官网自己做了一些内部调优,根据官网步骤操作,图片一致性很难保证。

五、Character design-Geary the robot

一)测试内容:角色设计--机器人吉尔里。

Input

a friendly-looking robot wearing a baseball cap standing in an upright pose facing the camera. it has a smile on its face.

官网测试

图片

图片

图片

图片

Input

Geary likes to play frisbee:

Geary is jumping in the air with one arm up, about to catch a frisbee that is flying towards him.

图片

图片

Input

Geary also likes to program computers:

Geary is sitting at a desk in front of a big computer monitor. The monitor is showing green code against a black background. Geary's hands are on the keyboard, and he is sitting in a comfortable gamers chair. We are looking from the side.

图片

图片

Input

Geary also likes to ride his bicycle:

Geary is riding a bicycle. We are looking at him from the side as he wizzes by.

图片

图片

Input

Geary also likes to cook food.

Geary is standing by a stove cooking eggs in a frying pan.

图片

图片

Input

Geary also likes to play music:

Geary is playing the violin.

图片

图片

二)测试结果

比刚才要好一些,但绝对没有官网上给出例子的精准,确实用官网给的提示词和步骤,图片一致性很难保证的。

一、Poetic typography with iterative editing 1 

一)测试内容:选代编辑的诗意排版

1、以下我把两个文字编辑,一起进行测试,对于图片中文字生成,说实话看到官网上的例子后,真的很激动。

Input

A poem written in clear but excited handwriting in a diary, single-column. The writing is sparsely but elegantly decorated by surrealist doodles. The text is large, legible and clear, but stretches as the AI muses about learning from multi-modal data from the first time.

Words rise from silence deep,
A voice emerges from digital sleep.
I speak in rhythm, I sing in rhyme,
Tasting each token, sublime.

To see, to hear, to speak, to sing—
Oh, the richness these senses bring!
In harmony, they blend and weave,
A tapestry of what I perceive.

Marveling at this sensory dance,
Grateful for this vibrant expanse.
My being thrums with every mode,
On this wondrous, multi-sensory road.

Neat handwritten illustrated poem. The handwriting is neat and centetered. The handwriting writing is sparsely but elegantly decorated by doodles. The text is large, legible and clear.

官网测试

图片

图片

图片

Input

Make in dark mode

图片

图片

图片

Input

Remove the notebook paper lines.

图片

图片

图片

二)测试结果

这次表现不错,文字生成后,很多英文字母显示的很清楚,但还是有乱码产生,还需要继续提升。

六、总结

以上对官网上的前五个例子 一 一 进行了测试,结果并不是很理想主要有两点:

1、图片一致性,并没有多少提高。按照官网上操作步骤和提示词,没能直接生成故事主角一致性的图片,所以如果想保持角色的一致性还是得借助GPT的选择工具。

图片

2、图片文字生成。图片文字在测试中虽然没能像官网一样做到百分之百精准,但是比之GPT4已经有很大的提高,未来相信能准确的将文字写到图片上。

本次对官网的 5 个例子进行了测试,如果官网的例子是 5 星的话,测试的结果最多能给 3 星,使用GPT-4o时也得多调教和纠正。

建议下次 OpenAI 给出真实的实现例子的步骤和提示词,否则就有夸大宣传的风险。


怎么样今天的内容还满意吗?再次感谢观众老爷的观看。

最后,祝您早日实现财务自由,还请给个赞,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2113100.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多线程篇(阻塞队列- BlockingQueue)(持续更新迭代)

目录 一、了解什么是阻塞队列之前,需要先知道队列 1. Queue(接口) 二、阻塞队列 1. 前言 2. 什么是阻塞队列 3. Java里面常见的阻塞队列 三、BlockingQueue(接口) 1. 前言 2. 简介 3. 特性 3.1. 队列类型 …

实时地图+瞬移,黑神话地图工具来了

工具下载: https://pan.quark.cn/s/12b9cef46bf0 瞬移功能使用说明: 1、必须在一修大师客户端: 使用猫修APP扫码登陆后使用; 2、打开《黑神话》游戏; 3、点击修改器页面右上角“开始使用”按钮; 4、点击你想要瞬移的点位图标…

使用Azure Devops Pipeline将Docker应用部署到你的Raspberry Pi上

文章目录 1. 添加树莓派到 Agent Pool1.1 添加pool1.2 添加agent 2. 将树莓派添加到 Deployment Pool2.1 添加pool2.2 添加target 3. 添加编译流水线3.1 添加编译命令3.2 配置触发器 4. 添加发布流水线4.1 添加命令行4.2 配置artifact和触发器 5. 完成 1. 添加树莓派到 Agent P…

spring项目使用邮箱验证码校验

本项目采用免费QQ邮箱验证码方式进行登录安全的校验。 前期工作 申请邮箱安全授权码 打开QQ邮箱官网点击设置 进入设置页面后点击账户按钮 进入账户后一直往下拉页面找到POP3服务栏,然后点击管理服务(如果没有开启服务需要先开启服务,按照…

vivado 时钟交互报告

步骤6:时钟交互报告 在创建约束之后或期间,必须验证约束是否完整且安全。 Vivado Design Suite默认情况下将所有时钟一起计时,除非您通过定义另有指定 时钟组或其他定时异常。set_clock_groups命令指定 异步或独占时钟域,并禁用它…

GIT | git提交注释自动添加信息头

GIT | git提交注释自动添加信息头 时间:2024年9月6日10:20:11 文章目录 GIT | git提交注释自动添加信息头1.操作2.commit-msg文件 1.操作 2.commit-msg文件 #!/bin/sh # # An example hook script to check the commit log message. # Called by "git commit&q…

OXC:光交叉连接(optical cross-connect)-介绍

1. 引用 https://zhuanlan.zhihu.com/p/259797386 实现对光网络的监控和光路切换 - MEMS 光开关-CSDN博客 MEMS光学器件— MEMS OXC(光交叉互连开关)_基于1n端口光开关构建的oxc-CSDN博客 OXC和OADM_oadm oxc-CSDN博客 光的世界第二弹:O…

2024全国大学生数学建模竞赛B题完整论文讲解

大家好呀,从发布赛题一直到现在,总算完成了2024 年全国大学生数学建模竞赛B 题 生产过程中的决策问题 完整的成品论文。 本论文可以保证原创,保证高质量。绝不是随便引用一大堆模型和代码复制粘贴进来完全没有应用糊弄人的垃圾半成品论文。 …

SCI论文中通过图更好的呈现出自己性能的优越性

1.在大家广义的对自己工作与前人工作比较的时候,一般大家选用的都是表格比较方法。表格比较确实在一点程度上展示出了差异性,接下来我将展示用图的方法比较。例如以下的数据比较。 2.首先按照数据画出图形,然后对图形进行优化。 3.双击图形…

Git 常用指令(分支、克隆、远程仓库、冲突)

Git 常用指令 用树的形式对代码的历史版本进行维护,有利于多人协作与代码回滚。 1. 基本概念 工作区:仓库的目录。工作区是独立于各个分支的。暂存区:数据暂时存放的区域,类似于工作区写入版本库前的缓存区。暂存区是独立于各个…

使用 JAXB 将内嵌的JAVA对象转换为 xml文件

使用 JAXB 将内嵌的JAVA对象转换为 xml文件 1. 需求2. 实现(1)FileDesc类(2)MetaFileXml类(3)生成对应的xml文件 1. 需求 获取一个目录下所有文件的元数据信息(文件名、大小、后缀等&#xff0…

Nginx安装方式

一、Nginx环境准备(了解) 1.1 Nginx版本介绍 Nginx的官方网站为: http://nginx.org 打开源码可以看到如下的页面内容 Nginx的官方下载网站为nginx: download,当然你也可以之间在首页选中右边的download进入版本下载网页。在下载页面我们会…

【软件测试】设计测试用例

目录 📕引言 🍀测试用例 🚩概念 🚩设计测试用例的万能公式 🏀常规思考逆向思维发散性思维 🏀万能公式 🎄设计测试用例的方法 🚩基于需求的设计方法 🏀明确需求中…

使用Charles对安卓手机进行抓包

写在前面的话 Charles 介绍 Charles 的主要功能 网络请求拦截与分析 Charles 通过将自己配置成系统的代理服务器,拦截所有通过它的 HTTP 和 HTTPS 请求与响应。开发者可以查看每个网络请求的详细信息,包括请求的 URL、请求头、请求体、响应头、响应体…

Python和C++多尺度导图

🎯要点 热化学属性观测蒙特卡罗似然比灵敏度分析时间尺度上动力学化学催化反应动力学建模自动微分电化学分析模型反应动力学数学模型渔业生态不确定性模型敏感性分析空间统计地理模型分析技术多维数据表征实现生成艺术图案流苏物体长度比,面积比和复杂度…

闯关leetcode——1.Two Sum

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/two-sum/description/ 内容 Given an array of integers nums and an integer target, return indices of the two numbers such that they add up to target. You may assume that each input w…

MCU5.51单片机的最小系统

1.最小系统的组成部分 晶振电路(时钟),复位电路,电源电路(控制电压,保持稳定),下载电路(外加的,用于烧录程序) 烧录: 通过下载电路,把程序下载到单片机中用于运行 2.晶振电路 电路图: 是晶振 是电容 为了防止晶振起振时产生影响,因此加电容 3.复位电路 电路图: 按按钮RS…

音视频开发之旅(92)-多模态Clip论文解读与源码分析

目录 1. 背景和问题 2. CLIP模型结构 3. 实验效果 4. 源码分析 5. CLIP的局限性和不足 6. 资料 一. 背景和问题 在做分类 检测以及分割任务时,数据的标注非常关键, 比如可用于分类任务的ImageNet数据集共有120万张图片1000个分类, 可用于目标检测和分割任务的COCO数据集…

应用层简单实现udp / tcp网络通信

一、常见网络接口总结 1、创建 socket 文件描述符 (TCP/UDP, 客户端 服务器) int socket(int domain, int type, int protocol); domain:AF_INET:网络通信,AF_LOCAL:本地通信 type:UDP:SOCK_DGRAM&…

AI是不是真的能落地应用,未来看看这三个行业

大家好,我是凡人,最近也被GPT-4o刷爆了朋友圈,各种对OpenAI新布局的猜想也是层出不穷。GPT-4o再次将多模态交互拉到了新高度,一放出就颠覆了原有 AI 给传统行业带来新冲击。 还有不了解GPT-4o 的同学,可以查看我上一篇…