从文本图片到多模态：3D 数字人打开企业全域商业增长新空间

摘要：数字化与AI浪潮推动各行业变革，内容形式也发生巨变，从文本到多媒体的多模态表达，标志着内容创造走向升维。AIGC 3D生成技术的突飞猛进，彻底打破了传统3D内容生产门槛高、周期长、成本高昂的问题。将3D数字人的打造和视频生成，从数月的生成时间压缩至秒级。3D内容生成的 GPT 时刻，正在来临。

——————————————————————————

AI风口下，数字人技术备受各界关注。9月23日，首届中国数字人大会在北京召开，政界、学界、企业界领袖齐聚一堂，共同探讨数字人应用的趋势和场景。此次大会不仅为行业交流提供了平台，也彰显了数字人在人工智能发展中的重要地位及其商业价值。

当下，数字人技术已无处不在。从影视动画中的数字偶像到企业数字员工及数字助手，为各行各业商业模式创新带来新的可能性。通过创建个性化的多模态数字人，制作各类数字人宣传视频、开启数字人直播等等。数字人已经融入金融、教育、政务、培训等各行各业，赋予了企业更加生动、高效的内容生产力及更具真实情感的沉浸式互动体验。

AI多模态输出：从文本语音到3D数字人

想要理解数字人的价值，不妨从人与人的沟通中寻找答案。人们最原始的交流，就是在三维空间中面对面进行。过去，受限于技术及生产力瓶颈，文字、图片和视频，还停留在二维空间。这导致很多真实世界的信息，无法被最大化还原，例如文字没有声音、色彩等信息，视频缺乏真实世界的三维立体感和面对面的交互性。

亚里士多德曾说：“技术既超越自然，又模仿自然。”从纸质媒体时代、互联网时代到移动互联网时代，再到空间计算时代，人们不断寻回因技术制约而失去的真实世界。3D内容，以其独有的光、影、动态的丰富性，不仅赋予了人们超越2D的感官之旅，更引领我们踏入一个沉浸立体可交互的全新世界，令人心驰神往。

从3D电影大片，到全息投影再到苹果的VIsionPro空间计算技术，3D 视频能够提供比2D文字、图片更沉浸、更真切的体验。随着 3D 技术的发展，人们渴望像《黑客帝国》《头号玩家》那样，能够以3D分身，走进一个三维立体的、高度还原沉浸感的世界。

而从另一维度审视，以ChatGPT为代表的AI语言大模型，从文字表达上已日趋接近人类思维方式。而借助多模态表达，当文本大模型与3D数字人动作大模型相结合，将带来更高的信息传递效率。

试想，若ChatGPT不再局限于冰冷的文字或声音，而是化身为栩栩如生的3D数字人，通过丰富的表情和动作与我们进行更直观的交流，将是何等生动有趣的场景。融入3D数字人视觉形象，ChatGPT走向多模态应用，不仅代表着技术的进步，更预示着其发展的终极形态已经显现。

AIGC革命，攻克3D数字人技术难点，赋能千行百业

未来5-10年，3D互联网将创造超万亿美元的市场价值。产业繁荣背后，是传统生产方式下内容生产供需之间的巨大缺口。在这样的背景下，魔珐科技凭借其前沿的3D数字人技术及AIGC全栈解决方案，实现3D数字人高质量、高效率、规模化打造，破解3D视频、直播生产面临生产质量与效率无法兼顾的难题。

大会现场，魔珐科技AIGC业务负责人杜子航向参会领导和嘉宾们，展示了魔珐科技的自研的3D数字人技术产品，对传统3D内容制作成本、时间和效率的革命性改进。展示了3D数字人产品在沉浸感、互动性、视频生成的专业性和可编辑性方面，展现出独特优势。

魔珐科技的AIGC全栈技术，涵盖了文生文、文生3D数字人、文本生成3D数字人动画、文本生成语音、文生镜头等全方位革新。相较于传统的3D角色生产，如3A游戏《黑神话·悟空》中的角色，魔珐科技提供了低门槛、高效率的解决方案。每个普通人和企业都可以借助魔珐科技的有言、有光等产品，低门槛的拥有灵活匹配不同应用场景的高质量3D数字人。

有言中，内置了海量的个性化3D数字人形象，他们拥有不同的年龄、性别、种族及服饰穿搭。用户还可以根据喜好，为3D数字人搭配妆容、发型和服装，自由地打造个性化的3D专属数字人形象。魔珐科技，打破了外界对于数字人无法被用户自行创作修改、人物呈现呆板、动作有限、无法呈现人物空间感的认知。

魔珐科技自研全球首个文生动作大模型，可以根据文本语义和场景，生成出自然灵动的表情、动作和手势表达，结合不同的应用场景，可以表现出真人一样的肌肉动态与动作，甚至可以精细的还原出人物的眼球生理状态与神韵。

在有言中，3D数字人拥有大量不同的动作风格。同时，人物动作可编辑、调整，可以根据用户喜好，表现出多样化的动作节奏。在人物声音方面，魔珐科技的自研TTS语音技术，能够还原人物的语音节奏、停顿、音色，海量的音色库，和语音风格，能够匹配带货、主持、解说等各种不同的场景风格。

这些先进技术已落地于魔珐科技的视频、直播、1V1服务产品，赋能金融、娱乐等多个行业。真正实现个性化编辑、灵活匹配不同应用场景的高质量3D数字人，可以还原出更加沉浸的视觉体验，轻松传递出更多的真实情感。

此外，魔珐科技还拥有3D数字人AI镜头生成能力，可以通过AI生成多种专业影视级镜头。借助有言的AIGC能力，可以根据文本轻松生成多机位、多景别、专业影视级的镜头效果。 专业的运镜技巧与真实可感的3D场景与灯光呈现，能够增强视频叙事性，让视频更生动，从而提升观众观看视频的时长。同时，专业的镜头语言和3D视频，能够让观众更轻松地理解视频内容，提升视频的质感，展现企业实力，与用户建立起更专业的认知。

通过魔珐科技的3D数字人AIGC全栈技术，让一切交互和体验更为亲切，还原人与人面对面的沟通。通过产品化的方式，借助AI技术让每个普通员工都能轻松操作，帮助企业提升视频、直播与1V1服务的生产效率。

借助有言，3D数字人可以活跃在企业的各个对外营销场景中，高频生产出产品介绍、品牌营销、活动宣传、电商运营、企业培训等各类品牌对外、对内视频；还可以通过有光实现24*7快速开播，或者借助星云平台定制生成品牌代言人或客服代表，可全天候、跨地域与消费者进行互动，提升品牌形象与客户满意度。

魔珐科技已服务数百家行业领军企业，通过3D数字人技术助力企业打造独特的品牌IP，生产高质量的品牌宣传、营销推广内容，举办线上发布会，并制作各类企业培训视频。这些应用已深入教育、法律、金融、政务、文旅等多个领域。借助数字人直播和1V1服务产品，企业能够提供24*7的全天候咨询和指导服务，确保每一位客户都能得到及时、专业的服务。提升企业宣发效率，提升客户满意度，为企业带来了实实在在的业务增长。

3D数字人技术与产品，不仅为企业带来了营销和服务方面的变革，更以其独特的商业价值，为企业开辟出新的增长空间。

魔珐科技已助力数百家企业降本增效，运用3D数字人技术打造前沿的全域企业解决方案。

9月25日晚7点，我们将为您独家揭秘3D数字人前沿技术，展示各行业头部企业的实操案例，诚邀您共同探讨。