1. 引言
Sora
是OpenAI
开创性的人工智能视频生成器,它能够通过简单的文字提示词来生成高质量的视频,最近在人工智能领域掀起了巨大的浪潮。
但Sora
的功能远不止根据文字提示词来生成视频。下面是五个其他功能示例:
- 改变视频中的环境风格
- 生成图像
- 将图像转化为视频
- 插值两段视频
- 扩展现有视频
闲话少说,我们直接开始吧!
2. 改变视频的风格和环境
想象一下,将一段现代视频无缝转换成 20 世纪 20 年代的场景,并配以老爷车和复古建筑。请看这个示例,以顶部视频作为输入,使用以下提示词在底部生成对应转换后的视频:
Prompt: Change the setting to the 1920s with an old school car. make sure to keep the red color
提示:将背景切换到 20 世纪 20 年代,使用一辆老式汽车。
得到结果如下:
Change the style of environment in videos
Sora
的作品质量堪称史诗级的!这带来了令人难以置信的可能性。下面是我想到的几个应用:
电影制作
:将场景转换为任何时代或风格,大大降低成本。教育
:通过直观再现历史事件或历史时期,让同学们学习犹如身临其境。广告
:通过在各种环境中放置推销产品,用以创建独特的内容。
3. 生成图像
Sora
不仅仅能生成视频,它还可以用来生成分辨率高达 2048 x 2048
的图像。
它的工作原理是在空间网格中放置高斯噪声斑块,时间范围为一帧。我们来看一个例子:
Prompt: A snowy mountain village with cozy cabins and a northern lights display, high detail and photorealistic dslr, 50mm f/1.2
提示:雪山村庄,舒适的小木屋和北极光,高细节和逼真的数码单反相机,50mm f/1.2
得到结果如下:
现在,请我们将相同的文本提示词送入DALL-E 3
模型, 与Sora
模型的结果做个对比:
在我看来,Sora
模型生成的照片更好看。它似乎更生动地捕捉到了北极光的魔力。您同意吗?
4. 将图像转换成视频
模型Sora
另一个很酷炫的功能是将图像转换成视频。下面的例子就是用Dall-E
生成的效果。文本提示词如下:
Prompt: A Shiba Inu dog wearing a beret and black turtleneck.
提示:一只戴着贝雷帽、穿着黑色高领毛衣的柴犬。
得到结果如下:
如果将Sora
集成到ChatGPT
中,那岂不是太不可思议了?大家可以向AI
描述图像提示词,让其生成图像,进而将其转化为动画!那简直太酷了。
5. 插值两段视频
比方说,我们可以拍摄两段完全不同的视频–一段是繁华的城市街道,另一段是宁静的森林–然后让 Sora
将它们无缝地融合在一起,会怎么样呢?
Interpolate two videos
插值技术正是如此,其效果令人着迷。创意视频编辑和艺术表现的潜力是巨大的。
6. 视频扩展
Sora
的另一大特色是可以向前和向后对视频进行扩展。
sora extend video
这可以为内容创作者和电影制片人提供丰富的灵活性。然而,这种无缝操控视频的能力也引发了人们对有害深度伪造视频可能性的严重担忧,并对版权所有权提出了新的挑战。
7. 总结
Sora
模型的发布已有数日,至今仍在网上热传。Sora
团队不断在 官网上传新视频,所有视频的效果都令人叹为观止。即使是初始版本,它的功能也是令人震惊的。难以想象 Sora 在迭代几个版本之后能做些什么,未来这项技术会如何彻底重塑视频创作,让我们拭目以待。