DGX AGX Ominiverse With Cosmos 功能 1w 张 H100 训练了 3个月 使用 Ray 串流 数据 数据准备 处理 pipeline 数组组成 真实世界的物理数据 训练 1、使用 L1 损失,最小化 输入和重构视频之间的像素级差异 以及基于 VGG19 的一个特征感知损失 2、使用光流的损失,要求生成视频的光流场,和原始视频的比较像,叫做 RAFT 的一个估计二流 的光流 在微调的过程中,使用了对抗损失,进一步增强和重构相关的细节 特别是经过 Encoder 的一个高压缩比例的时候