免费 逼真:快手“可灵”后又一Sora级选手登场

news2024/10/6 10:40:27

就在今日,英伟达投资的旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine,可以文生视频,图生视频,人人免费可用。同时,Luma AI 称 Dream Machine 可以从文本和图像生成“高质量”的视频效果堪比OpenAI推出的Sora。

画面逼真,视频质量高

Dream Machine 可在 120 秒生成 120 帧,目前单个视频最长为 5 秒;根据Luma AI官方放出的视频看,其生成的视频具有逼真的流畅运动、电影摄影和戏剧效果;还可以匹配摄像机运动,创造出“惊艳”的画面,虽然高需求可能会导致生成时间和队列延迟,但该模型始终可以很好地表示字符,尽管它在变形、移动和文本呈现方面存在一些限制。根据官方给出的实例,我们可以看到眼部特写清眼球中变幻的色彩,老虎在雪地中行走动作自然,脸部特写光影斑驳、镜头移动自然,人物动作衔接流畅。已有网友在社交平台上放出用Dream Machine制作的视频,画面看上去颇为真实:

401cb676dee3587b4bc11242e1b9e10c.jpeg

除了生成逼真视频外,Dream Machine 也可以尝试不同风格。
比如日本动漫风:

978889ed38033fbc491300f239c6aff9.jpeg

迪士尼风格:

d6bf5ab149a4cd5c98f3d097710abe45.jpeg


热度非常高,使用需排队

据了解,起初官方表示模型可以在120秒内生成120帧视频,但发布后的真实情况是太多人挤入,网站流量过大,现在生成一个视频甚至需要排队几个小时。此外,在推出免费公开测试版前,已经有少数AI视频创作者和电影制作人测试上了Dream Machine,他们也发布了不少作品。

7810f7925e7df2c1d712b5a98db1478d.jpeg

使用的方式也很简单,只要在输入框输入提示词,提出你想要的图像包括理想的画风以及效果,随后等待几分钟后即可;同时输入框下面还有“推荐提示词”以及“提示词强化”的选项功能来助你一臂之力。输入的关键词越详细,生成的视频就越逼真动人。

44868bca1303f8751eab197654df4a6c.jpeg

比如我们在此输入“A teddy bear in sunglasses playing electric guitar, dancing and headbanging in the jungle in front of a large beautiful waterfall”即“一只戴着墨镜的泰迪熊弹着电吉他,在丛林里、在美丽的大瀑布前摇头晃脑地跳舞” 的指令后,在等待大约两分钟后可以得到以下视频:

7580141b53a3e32eeed71e67fd71d837.jpeg


怎么样,很逼真吧!

不过,Luma Ai仍旧存在着一些相关的问题,比如切换视角时汽车会变形,狗的运动没有用到爪子,显示文字会有问题(将 Luma 显示成 Lumma),北极熊在转身时出现了两个头(Janus 是罗马人的门神,具有前后两个面孔),官方表示他们仍将继续优化模型

a16dd57fbe1c1914240724144baa4f39.jpeg

谁创造了它?

Dream Machine的背后是一家新兴Ai智能公司:Luma AI

6aeecfbf7fa965b9ea04e7779c6f3ac1.jpeg

Luma AI 成立于 2021 年,最初只是一家聚焦于 3D 内容生成的技术公司。
首席执行官 Amit Jain 曾是苹果公司的计算机视觉系统工程师,首席技术官 Alex Yu 曾是加州大学伯克利分校的研究生(放弃博士学业创办了 Luma AI )。二人在 3D 视觉、机器学习、实时图形学等领域都有所建树。
据悉,这家公司已经历数轮融资。A 轮融资由 Amplify Partners、Nvidia 投资部门 和 General Catalyst 领投,共筹集 2000 万美元;B 轮融资则由硅谷顶级风投公司 Andreessen Horowitz、英伟达领投,筹集 4300 万美元。截至目前,公司共融资 7000 多万美元,估值在 2 亿到 3 亿美元之间。

而在Dream Machine之前,Luma AI凭借去年发布的一个文本到3D生成的模型Genie 1.0,已经打出了一波知名度。Genie能够在10秒内创建3D物体,可生成四边形网格和材料,支持任意多边形数量的标准格式。Genie现在可以通过网页版、Luma iOS APP以及Discord社区使用,而这次最新推出的Dream Machine,是Luma AI打造的第一个视频生成AI。感兴趣的小伙伴可以亲自试一下。 链接: Luma Dream Machine (lumalabs.ai)

高性价比GPU平台:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_617_shemei



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1831926.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

bit band

位带(bit band) 简介: 在嵌入式系统和微控制器中,位带是一种特殊的内存映射技术. 它允许程序员像访问普通内存一样直接访问和修改特定寄存器的单个位. 使用bit band技术,可以通过内存映射的方式,将特定的位操作转换位对整个字的操作,从而实现对单个位的读写. 作用: 提高位操…

git 如何撤销已经 push 的 merge

今天在合并代码时, 发现自己失误把另外一个分支 B 的代码合并到了自己分支 C, 于是想到要撤销这次 merge 一般地, 如果我们想要撤销某次 commit 可以 git revert <commit-id>. 然而, 对于 merge 类型的 commit 不能直接 git revert <commit-id> 这里举个例子: 我…

Pytorch构建vgg16模型

VGG-16 1. 导入工具包 import torch.optim as optim import torch import torch.nn as nn import torch.utils.data import torchvision.transforms as transforms import torchvision.datasets as datasets from torch.utils.data import DataLoader import torch.optim.lr_…

优思学院|IT行业学习六西格玛的价值

提到六西格玛&#xff08;Six Sigma&#xff09;&#xff0c;很多人可能首先想到的是制造业。六西格玛确实在制造业中有着广泛的应用和显著的效果&#xff0c;如提高产品质量、降低缺陷率、减少浪费等。那么&#xff0c;六西格玛在信息技术&#xff08;IT&#xff09;行业是否同…

Android11 以Window的视角来看FallbackHome的启动

在WMS中&#xff0c;使用WindowState代表着一个Window并维护着一个Window的"层级树"&#xff0c;每个Window需要按照"层级"的规则进行排列。对于FallbackHome&#xff0c;其Window是挂载在home task上&#xff0c;而home task挂载在DefaultTaskDisplayArea…

IconWorkshop中文版安装包下载及安装教程

​IconWorkshop官方版是一款使用起来非常简单便捷的可以让用户朋友根据自己的需求制作LOGO图标的工具&#xff0c;不管您是在生活中还是软件制作中遇到了需要原创LOGO的机会&#xff0c;通过最短的时间对logo图标进行细节制作&#xff0c;添加各类效果&#xff0c;设置等高线&a…

LabVIEW的热门应用

LabVIEW是一种图形化编程语言&#xff0c;因其易用性和强大的功能&#xff0c;在多个行业和领域中广泛应用。介绍LabVIEW在以下五个热门应用领域中的使用情况&#xff0c;&#xff1a;工业自动化、医疗设备与生物医学工程、科学研究与实验室自动化、能源管理与智能电网、航空航…

跟TED演讲学英文:Entertainment is getting an AI upgrade by Kylan Gibbs

Entertainment is getting an AI upgrade Link: https://www.ted.com/talks/kylan_gibbs_entertainment_is_getting_an_ai_upgrade Speaker: Kylan Gibbs Date: April 2024 文章目录 Entertainment is getting an AI upgradeIntroductionVocabularySummaryTranscriptAfterwor…

Linux下的crontab命令

文章目录 目录 文章目录 前言 一、crond和crontab 二、命令文档 三、命令使用 总结 前言 crontab命令是用于在Unix和类Unix操作系统中安排定期执行的任务的命令。crontab命令允许用户创建、编辑、显示和移除他们的crontab文件。通过在crontab文件中定义任务和执行时间&#xf…

【刷题】LeetCode刷题汇总

目录 一、刷题题号1&#xff1a;两数之和 二、解法总结1. 嵌套循环2. 双指针 一、刷题 记录LeetCode力扣刷题 题号1&#xff1a;两数之和 双循环&#xff08;暴力解法&#xff09;&#xff1a; class Solution {public int[] twoSum(int[] nums, int target) {int[] listne…

光伏工程开发的详细步骤

光伏工程作为可再生能源领域的重要组成部分&#xff0c;其开发过程涉及多个环节&#xff0c;包括开发、测绘、设计、施工和运维等。下面将详细介绍这些步骤。 一、开发阶段 1、前期调研&#xff1a;对目标地区进行能源政策、市场需求、资源条件等方面的调研&#xff0c;评估项…

spring boot接入nacos 配置中心

再接入nacos配置中心时&#xff0c;需要确认几点&#xff1a; 1. spring boot 版本 (spring boot 2.x ) 2. nacos 配置中心 服务端 版本 (1.1.4) 3. nacos client 客户端版本 (1.1.4) 方式一 1. 启动 nacos 服务端&#xff0c;这里不做解释 在配置中心中加入几个配置 2. 在…

【Qt 学习笔记】Qt系统相关 | Qt事件 | 事件的介绍及基本概念

博客主页&#xff1a;Duck Bro 博客主页系列专栏&#xff1a;Qt 专栏关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ Qt系统相关 | Qt事件 | 事件的介绍及基本概念 文章编号&#xff1a;Qt…

FPGA的基础仿真项目--七段数码管设计显示学号

一、设计实验目的 1&#xff0e; 了解数码管显示模块的工作原理。 2&#xff0e; 熟悉VHDL 硬件描述语言及自顶向下的设计思想。 3&#xff0e; 掌握利用FPGA设计6位数码管扫描显示驱动电路的方法。 二、实验设备 1. PC机 2.Cyclone IV FPGA开发板 三、扫描原理 下图所…

夏季家里粉尘螨虫满天飞?一招搞定!好用家用空气净化器品牌分享

每到夏季&#xff0c;是家中尘螨滋生的高发期。夏季无论是开窗通风还是关窗开空调&#xff0c;都很容易造成空气中的浮尘堆积&#xff0c;不注意卫生清洁&#xff0c;容易滋生细菌、尘螨。 易过敏、体质弱的人群长时间在空气污染环境中&#xff0c;很容易就会过敏或者发生其他…

在矩池云快速使用ChatTTS,文本转语音太酷了

ChatTTS 最新的一款文本转语音模型&#xff0c;目前支持英文和中文两种语言&#xff0c;面向对话场景的转化则更为精准&#xff0c;在汉语的语音韵律方面超越了以往很多同类模型&#xff0c;此外它还支持细粒度控制&#xff0c;允许在文字中加入笑声、停顿、语气词等&#xff0…

一道全等三角形证明题

接着上次那道题 一道初中一年级几何题解析&#xff0c;再来做一道初中一年级下半学期几何题目&#xff1a; 傍晚丢垃圾散步时看到小小的学生学习群里丢了这个题目&#xff0c;想到一个解法。实在构造不出契合题干阅读材料结论的三角形&#xff0c;索性先根据这结论做一个推论…

openh264 帧间预测编码过程源码分析

openh264 OpenH264 是一个开源的 H.264 编码和解码器&#xff0c;由思科系统开发并维护。它专为实时应用程序如 WebRTC 设计&#xff0c;提供了从基础到高级特性的广泛支持。OpenH264 的编码器支持从 Constrained Baseline Profile 到 5.2 级别&#xff0c;允许任意分辨率的编…

硕士毕业论文《基于磁纹理的磁化动力学研究》

前言 本文是博主的硕士毕业论文&#xff0c;应该也是“自旋电子学&#xff08;微磁学&#xff09;”博客专栏的最后一篇博客&#xff0c;该毕业论文预设排版的PDF版本见下载链接&#xff1a;https://download.csdn.net/download/qq_43572058/89447526。若该博客专栏对读者您的…

一分钱不花!本地部署Google最强开源AI大模型Gemma教程

谷歌发布了轻量级开源系列模型Gemma&#xff0c;其性能强大&#xff0c;可与主流开源模型竞争。通过Ollama可轻松部署Gemma模型&#xff0c;并使用JANAI美化UI界面。显卡在AIGC应用中至关重要&#xff0c;推荐选择性能强、显存大的NVIDIA系列显卡。 半个月前&#xff0c;谷歌搞…