Sora介绍
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。
Sora这一名称源于日文“空”(そら sora),即天空之意,以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。模型的训练数据既包含公开可用的视频,也包括了专为训练目的而获授权的著作权视频,但OpenAI没有公开训练数据的具体数量与确切来源。
OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频,称该模型能够生成长达一分钟的视频。同时,OpenAI也承认了该技术的一些缺点,包括在模拟复杂物理现象方面的困难。《麻省理工科技评论》的报道称演示视频令人印象深刻,但指出它们可能是经精心挑选的,并不一定能代表Sora生成视频的普遍水准。
由于担心Sora可能被滥用,OpenAI表示目前没有计划向公众发布该模型,而是给予小部分研究人员有限的访问权限,以理解模型的潜在危害。Sora生成的视频带有C2PA元数据标签,以表示它们是由人工智能模型生成的。OpenAI还与一小群创意专业人士分享了Sora,以获取对其实用性的反馈。
Sora文本生成视频欣赏
视频链接
https://cdn.openai.com/sora/videos/petri-dish-pandas.mp4
提示词
一个培养皿,里面长着一片竹林,里面有小熊猫在跑来跑去。
视频链接
https://cdn.openai.com/sora/videos/stack-of-tvs.mp4
提示词
镜头围绕一大堆老式电视旋转,所有电视都显示不同的节目 - 20 世纪 50 年代的科幻电影、恐怖电影、新闻、静态、1970 年代的情景喜剧等,背景设置在纽约大型博物馆画廊内。
视频链接
https://cdn.openai.com/sora/videos/big-eyed-fluff-ball.mp4
提示词
3D 动画展示了一个小而圆、毛茸茸的生物,长着富有表情的大眼睛,探索充满活力的魔法森林。这种生物是兔子和松鼠的异想天开的混合体,拥有柔软的蓝色皮毛和浓密的条纹尾巴。它沿着波光粼粼的小溪跳跃,眼睛睁得大大的,充满惊奇。森林里充满了神奇的元素:会发光和变色的花朵,叶子呈紫色和银色的树木,还有像萤火虫一样的小漂浮灯。该生物停下来与一群围绕着蘑菇环跳舞的小仙女进行有趣的互动。该生物敬畏地抬头看着一棵发光的大树,这棵树似乎是森林的中心。