【专题速递】多模态数字人、多模态媒体大模型以及AI与AIGC对音视频的影响

news2026/2/12 14:03:01

随着AIGC内容的兴起，多模态媒体大模型逐渐进入大家的视野，而LLM的发展又让人们对未来音视频工具产生了新的思考。7月29日LiveVideoStackCon2023上海站AIGC与内容生产专场，集齐当下最热门的AIGC话题，与您共享。

AIGC与内容生产

在技术、需求与产业链的共同驱动下，人们也从继UGC、PGC后，迈向了AIGC这个新兴的内容生产时代。但AIGC并不是一门单一的技术，它的本质是利用AI赋能技术而形成的一种高自由度且低门槛的内容生产能力，而这种能力将服务于各类场景中的创作者与生产者。

TOPIC1《华为云MetaStudio多模态数字人进展及挑战介绍》

李明磊华为虚拟数字人技术负责人

数字人作为AI能力集大成者，涉及计算机视觉、计算机图形学、语音处理、自然语言处理等技术，正在金融、政务、传媒、电商等领域应用越来越广。本报告主要介绍华为云在数字人领域当前的主要进展，包括2D数字人驱动、3D数字人建模、绑定、驱动、情感数字人生成等，同时介绍数字人领域的一些挑战。

本次分享将分为三个部分，第一个部分介绍华为云云原生数字人生产管线介绍及业务规划；第二部分介绍华为云2D数字人技术进展介绍，如何解决口型驱动、肢体编排、移动场景驱动等问题；第三部分介绍华为云3D数字人建模、绑定、驱动等技术的进展。

TOPIC2《AIGC音视频工具分析和未来创新机会思考》

王闻宇-PPIO CTO&联合创始人

大语言模型LLM和其他AIGC的技术发展，会给音视频行业带来哪些变化呢？我将会盘点一些很不错的硅谷流行的AIGC应用，然后进行技术+商业的一些思考，分析音视频结合AIGC在未来的创新创业机会所在。

演讲大纲：

1. AIGC给全行业带来了十倍变化要求；2. 盘点几款不过的硅谷AIGC应用；
3. 思考AIGC的本质和音视频的连接；4. 音视频行业未来的创新创业机会在哪

TOPIC3《AI重新定义音视频生产力“新范式”》

武磊-网心科技副总裁

主要框架：1、面向新摩尔定律时代，AI技术对音视频内容的影响；2、AI对音视频生产力的革新，需求构建怎样的基础设施与算力平台？3、AI智能化应用与构建实践。

TOPIC4《从AIGC到多模态媒体大模型》

宋利-上海交通大学教授

本次演讲将从多模态媒体生成、多模态媒体编码和多模态媒体交互三个方面展现新一代多模态媒体的特点以及未来基于大模型的智能跨模态编码的新趋势。

▲扫描图中二维码或点击“阅读原文” ▲

查看更多LiveVideoStackCon 2023上海站精彩话题

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/778476.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【专题速递】多模态数字人、多模态媒体大模型以及AI与AIGC对音视频的影响

AIGC与内容生产

TOPIC1《华为云MetaStudio多模态数字人进展及挑战介绍》

TOPIC3《AI重新定义音视频生产力“新范式”》

TOPIC4《从AIGC到多模态媒体大模型》

相关文章

华为云使用 helm 模板

基于linux下的高并发服务器开发（第二章）- 2.24 信号集及相关函数

概率论和随机过程的学习和整理--番外15，如何计算N合1的合成数量问题？

微分流形2：流形上的矢量场和张量场

uni-app 微信小程序：启用组件按需注入

大数据面试题：HBase读写数据流程

MySQL的主从复制练习

【youcans动手学模型】目标检测之 RCNN 模型

《个人理财》——第六章理财规划计算工具与方法

IDEA+SpringBoot +ssm+ Mybatis+easyui+Mysql求职招聘管理系统网站

kafka 总结宝典

听GPT 讲K8s源代码--pkg(八)

深度学习入门教学——神经网络

Java基础之stream流最新版,stream流的基本操作

java 应用 cpu 过高故障排查

二十六章：Pyramid Vision Transformer ——金字塔视觉Transformer:一种无卷积的用于密集预测的多功能主干网络

无人机自主探索FUEL：代码阅读1--边界簇检测更新与视点生成

五、模型训练

Linux 下 nc 发送接收 udp、tcp数据

【Hive】Centos7安装单机版Hive