通义千问免费新功能：EMO，让照片和视频“活”起来

通义千问免费新功能：EMO，让照片和视频“活”起来

news2026/2/16 14:57:34

🧙‍♂️ 诸位好，吾乃斜杠君，编程界之翘楚，代码之大师。算法如流水，逻辑如棋局。

📜 吾之笔记，内含诸般技术之秘诀。吾欲以此笔记，传授编程之道，助汝解技术难题。

📄 吾之文章，不以繁复之言，惑汝耳目；但以浅显之语，引汝入胜。

🚀 若此文对阁下有所裨益，敬请👍🏻-点赞 ⭐ - 收藏 👀 - 关注，不胜感激。

什么是EMO

EMO（Emote Portrait Alive）是由阿里巴巴集团智能计算研究院开发的一个音频驱动的AI肖像视频生成系统，它能够通过单一的参考图像和语音音频，生成具有表现力的面部表情和各种头部姿势的视频。这一技术的核心在于其高度的表现力和逼真度，能够捕捉并再现人类面部表情的细微差别，包括微妙的微表情，以及与音频节奏相匹配的头部运动。

EMO的主要特点包括：

1.音频驱动的视频生成：无需依赖预先录制的视频片段或3D面部模型，直接根据输入的音频生成视频。

2.高表现力和逼真度：视频生成质量高，能够再现人类表情的细微差别。

3.无缝帧过渡：确保视频帧之间的过渡自然流畅。

4.身份保持：通过FrameEncoding模块保持角色外观与输入图像的一致性。

5.稳定的控制机制：采用速度控制器和面部区域控制器增强稳定性。

6.灵活的视频时长：根据输入音频长度生成任意时长的视频。

7.跨语言和跨风格：适应多种语言和艺术风格，包括中文、英文以及现实主义、动漫和3D风格。

技术报告地址：https://arxiv.org/abs/2402.17485

EMO的使用方法

在手机的软件平台下载通义千问APP，在选择“频道”->“全民舞台”，即可进入使用。

EMO的使用方法简单直观，用户可以通过通义App体验这一前沿技术。首批上线了80多个EMO模板，包括热门歌曲和网络热梗等。用户可以在歌曲、热梗、表情包中任选一款模板，上传一张肖像照片，EMO随即合成演戏唱歌视频。

就是生成时间有些漫长，大概需要15-20分钟左右。

EMO的使用场景

EMO技术的潜力巨大，未来有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。它将为内容创作者提供更多的可能性，使得创意表达不再受限于传统的视频制作方式。随着技术的不断进步和优化，EMO有望成为AI领域的一个重要里程碑。

好了，关于阿里EMO的项目就为大家分享到这里。我为大家整理了关于阿里EMO项目的相关网址，大家可以到这里了解更详细的信息，可以亲自体验一下哦：）

官方主页：https://humanaigc.github.io/emote-portrait-alive/

研究论文：https://arxiv.org/abs/2402.17485

GitHub地址：https://github.com/HumanAIGC/EMO

🧙‍♂️ 诸位好，我是斜杠君。全栈技术，正在从事AI应用领域的研究，如果您有关于 AI 或 AI工作流 的特别需求或问题，可以通过 爱发电 向我提问。

爱发电 · 连接创作者与粉丝的会员制平台

👑 阁下若觉此文有益，恳请👍🏻-点赞 ⭐ - 收藏 👀 - 关注，以资鼓励。倘若有疑问或建言，亦请在评论区💬评论赐教，吾将感激不尽。

欢迎关注我的公众号

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1651984.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

编写burp插件实现数据包自定义修改

编写burp插件实现数据包自定义修改

背景安全测试工作中经常遇到各种加密加签或者添加了其它安全措施的数据包。以加密为例，为了测试正常进行，我们需要解密后修改数据包再进行加密还原，手工的话很是繁琐且没必要，所以我们需要一个工具帮我们自动化的实现。由于我们…

阅读更多...

盘点一下近年来常用的电脑监控软件

盘点一下近年来常用的电脑监控软件

企业电脑监控软件通常用于监视员工在工作时间内的电脑使用情况，以确保他们的工作效率和安全性。以下是几种常见的企业电脑监控软件： 1、Ping32 Ping32是一款集成多功能的企业级电脑监控软件，包括员工上网行为管理、文件外发审计、屏幕活动监…

阅读更多...

Stable Diffusion Ai绘画模型推荐：二次元Coriander_Mix v1大模型推荐

Stable Diffusion Ai绘画模型推荐：二次元Coriander_Mix v1大模型推荐

负tag嵌入式:EasyNegative,badhandv4 此模型经测试是写实偏3D的效果画质灰暗的话请加：VAE840000 或者负tag：(watermark:2),(blurry:2),fat,paintings,sketches,(worst quality:2),(low quality:2),(normal quality:2),((monochrome)), ((grayscale))…

阅读更多...

Redis 源码安装（CentOS 单机）

Redis 源码安装（CentOS 单机）

序言本文给大家介绍如何在 CentOS 上，通过 Redis 源码单机部署 Redis 服务。一、部署流程通过官网下载源码 # 下载源码 wget https://download.redis.io/redis-stable.tar.gz# 解压源码包 tar -xzvf redis-stable.tar.gz在 linux 中执行以下命令，安…

阅读更多...

工业级路由器的穿透力是不是更强（原创科普）

工业级路由器的穿透力是不是更强（原创科普）

今天我想和大家聊聊工业级路由器的一个重要特性——穿透力。作为一名从事工业网络通信的工程师,我发现很多用户在选择工业级路由器时,都会问到一个问题:"工业级路由器的穿透力是不是更强?"下面就让我来为大家解答这个疑问。当然如果有通信产品需要也可以关注星创易联…

阅读更多...

修图新风尚：AI技术赋能，Remini引领修图新纪元，从Remini到未来，AI修图如何改变我们的视觉世界？

修图新风尚：AI技术赋能，Remini引领修图新纪元，从Remini到未来，AI修图如何改变我们的视觉世界？

最近一款名为Remini的AI修图软件凭借其独特的“丑萌”的黏土风格，迅速在海内外市场走红。用户只需要上传一张照片，就可以利用AI技术生成对应的黏土滤镜风格的图像。 “黏土AI”风格的图像刷爆了今年的五一假期旅游照片“大赛”，在小红书、…

阅读更多...

【京东电商API接口】 | 京东某商品销量数据分析可视化

【京东电商API接口】 | 京东某商品销量数据分析可视化

Python当打之年当打之年，专注于各领域Python技术，量的积累，质的飞跃。后台回复：【可视化项目源码】可获取可视化系列文章源码和数据本期将利用Python分析「京东商品数据接口」，希望对大家有所帮助，如有疑…

阅读更多...

检测机构的双资质是什么？

检测机构的双资质是什么？

CMA和CNAS是两种在检测、校准和认证领域具有权威性的资质。 CMA资质全称为“检验检测机构资质认定”（China Inspection Body and Laboratory Mandatory Approval）。它是根据《中华人民共和国计量法》等相关法规，由国家认证认可监督管理委员会…

阅读更多...

Python 中的 Unit testing 文件写入

Python 中的 Unit testing 文件写入

在 Python 中进行单元测试时，有时候需要测试文件写入操作。为了模拟文件写入并进行单元测试，你可以使用 Python 的 unittest 模块，并结合 io.StringIO 或 tempfile 模块来模拟文件操作。 1、问题背景在 Python 中，为 ConfigPars…

阅读更多...

Chromium编译指南2024 Windows11篇-GN 工具生成构建文件（六）

Chromium编译指南2024 Windows11篇-GN 工具生成构建文件（六）

前言在《Chromium编译指南2024（五）》我们已经获取了 Chromium 的源代码并且同步了相关的第三方依赖。现在，我们将进一步学习如何使用 GN 工具生成构建文件，为后续的编译工作做好准备。 1. 使用gn工具生成构建文件再次在Win…

阅读更多...

禅道20.0.stable发布啦，重构底层PHP和UI框架，用户体验全新升级

禅道20.0.stable发布啦，重构底层PHP和UI框架，用户体验全新升级

禅道20.0.stable版本终于正式发布啦！ 自2023年4月启动以来，经过一年多的努力，我们动员了全公司的产研力量，致力于为用户提供全新的用户体验。本次版本升级主要包括两个方面：一是用户体验全新升级，二是整体…

阅读更多...

4diacIDE同时编译不同版本踩坑记录

4diacIDE同时编译不同版本踩坑记录

4diac不同版本依赖插件版本及jdk版本是不同的，当你需要搭建不同版本4diacIDE开发环境时，就会出现各种问题。最近一个月github上项目提交记录比较多，出现了不少坑。以下记录下此背景下的解决方法： 1、首先由于.target依赖的eclipse…

阅读更多...

搭建电商ERP系统电商独立站最实用的电商API商品数据采集接口||电商API接口接入

搭建电商ERP系统电商独立站最实用的电商API商品数据采集接口||电商API接口接入

通常搭建电商独立站需要接入的商品数据接口包括： 1. 商品信息接口：包括商品基本信息（名称、描述、价格等）、图片信息、库存信息、分类信息等。 2. 库存信息接口：用于同步更新商品的库存情况，保证实时性…

阅读更多...

DC-DC电路中电感的下方该不该挖空

DC-DC电路中电感的下方该不该挖空

DC-DC电路中的电感下方该不该挖空？ 在回答这个问题之前，先来了解一下DC-DC电路中常见的功率电感类型一．DC-DC电路常用功率电感类型图1 DC-DC电路常用电感类型这四种类型电感，按照无屏蔽电感→磁封胶半屏蔽电感→组装式全屏蔽…

阅读更多...

I forgot my Plex Account PIN； how can I reset it? How can I change my PIN?

I forgot my Plex Account PIN； how can I reset it? How can I change my PIN?

If you’ve set a PIN on your Plex account, it’s possible to reset or remove that PIN. Related Page: Plex Home Regular Plex Account If you know the current PIN If the current PIN is known, then simply edit the current PIN on the Settings > Users &…

阅读更多...

uni-app 多列picker切换列显示对应内容

uni-app 多列picker切换列显示对应内容

html部分： <view class"uni-list"><view class"uni-list-cell"><view class"uni-list-cell-left">选择用户</view><view class"uni-list-cell-db"><picker mode"multiSelector"…

阅读更多...

python绘制等高线函数参数说明

python绘制等高线函数参数说明

文章目录函数说明参数说明返回值示例生成双峰山体数据代码案例生成三维的空间双峰山形函数 plt.contour 是 Matplotlib 库中的一个函数，用于绘制等高线图。等高线图是一种特殊的地图，其中等高线表示相同高度的等值线。函数说明 matplotlib.pyplot.co…

阅读更多...

2024年四川省中小企业数字化转型城市试点申报对象要求、时间安排

2024年四川省中小企业数字化转型城市试点申报对象要求、时间安排

一、重点任务 （一）聚焦企业需求，加快中小企业数字化转型。以中小企业数字化转型为契机，促进数字经济和实体经济深度融合。优先将数字化转型需求迫切、具备一定数字化基础的专精特新中小企业纳入试点范围。围绕中小企业创新、市场…

阅读更多...

【BUUCTF】Crypto_RSA（铜锁/openssl使用系列）

【BUUCTF】Crypto_RSA（铜锁/openssl使用系列）

【BUUCTF】Crypto_RSA（铜锁/openssl使用系列） 1、题目在一次RSA密钥对生成中，假设p473398607161，q4511491，e17 求解出d作为flga提交 2、解析 RSA加密过程： 1）选择素数：选择两个不…

阅读更多...

AI绘画是什么？分享11张精美的AI绘画图片

AI绘画是什么？分享11张精美的AI绘画图片

AI绘画是什么？ AI绘画是指利用人工智能技术来生成艺术作品的一种创作方式。通过训练机器学习算法，使计算机能够学习艺术家的风格和技巧，并自动生成类似的绘画作品。这种技术可以模仿各种绘画风格，如印象派、抽象艺术、写实主义等&…

阅读更多...

推荐文章

最新文章