GAMES Webinar 317-渲染专题-图形学 vs. 视觉大模型|Talk+Panel形式

news2024/10/7 20:27:57
  • 两条路线:传统渲染路线,生成路线
    • 两种路线的目的都是最终生成图片或者视频等
    • 在现在生成大火的情况下,传统路线未来该如何发展呢,两种路线是否能够兼容呢

严令琪

  • 这篇工作是吸取这两条路各自优势的一篇工作
    • RGB是一张图,X是生成模型根据图片生成的东西,可以认为是一个buffer(特征性,控制性的东西),它可以被修改,并且可以再生成一张图
  • 想生成真实的图and又想精准的控制,就是这篇文章的思想
  • X: intrinsic channels(G-buffers)是几何缓冲区
    • 现在是用X去生成RGB图,当然也沿用以前的语言模型,也就是文本
    • 当然这个工作也完成了给一张RGB图,从中提取G-buffers
    • 这个工作可以让X生成RGB的过程可控,也就是可以生成想要的图,支持图片编辑(比如,给一张RGB图,提取出G-buffers,修改,再生成图)

RGB->X

  • 可以根据文本(关键词)提取出最多这五种信息

X->RGB

  • 根据X的信息可以走传统的渲染过程,也可以不走,用扩散模型生成
  • 也不用把X的五种信息都给才生成图片,给哪些,哪些就体现在生成结果上

pipeline

Results






霍宇驰







  • 对于AI来说,未来NPU应该比GPU更重要

sora

  • sora是一种模糊语言来生成,也就是文本
    • 未来可能可以通过模糊文本一点点修改结果到自己需求那样
  • 传统的图像管线是精细化生成,sora是模糊生成
    • 而且传统的管线,前面几步骤完成后,最后结果的生成不用再做前面一些步骤,但sora每次都要从0开始
  • 具体用哪个看需求是在精细度的哪个层级
  • 目前也有很多工作在把两个连接起来

王利民




  • 第一阶段单模态的信息抽取
  • 第二阶段多模态,涉及到音频和文本,要进行对齐
  • 第三阶段多模态的生成与对话能力

第一阶段

  • 将视频进行掩码处理,再生成

第二阶段

  • 多模态对齐

第三阶段







总结

王申龙


QA

  • sora如此强大,传统图形学是否与到了大挑战?
    • 闫令琪:它是有缺陷的,比如会凭空多东西,少东西,这些缺陷可能在这个时代,在sora表现这么好的情况下,可以容忍,但它是不好解决的,因为它是神经网络控制的,不是那么可控。sora它现在是一个快速发展阶段,但它一定会进入瓶颈期的,包括传统的渲染生成,也进入过瓶颈期,也就是从0到90,快速发展,但最后10是很难完成的,比如比较好的控制,小瑕疵的解决
    • 霍宇驰:我同意sora能做到百分之90,95的效果,但它比较适合做一些离线工作,在实时工作中出现百分之10、5的错误是不能容忍的。在实时和交互方面,图形学应该是有一定优势
    • 王利民:不止sora,包括gpt这些也是存在幻觉的,它是不好解决的,未来一定要加入理解和约束的知识来控制生成,尽管sora它会有瑕疵,但是它肯定会慢慢被接受,比如自动驾驶:找一个老司机开也会犯错误
    • 王申龙:社区有非常大的优势,它能够让一个什么也不会的人做生成
  • 光线追踪还能打几年,或者还有几年要失业?
    • 严令琪:具体情况要看应用,需要精准控制的还是要走这种完全可控的渲染路线。实时渲染没有任何可以修正的余地,用生成性模型生成失败了怎么办,比如打游戏。很多东西会有一个长期共存的状态,比如从光栅化转到光线追踪,已经很多年了,但现在还是处于共存状态
    • 霍宇驰:光线追踪一定会存在一些特定领域,但蛋糕就这么大,sora一定会切走一块
  • 进行城市级别的场景生成会有什么困难?
    • 王申龙:要保持从A到B然后再回到A,还是相同的A是比较困难的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1577415.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

好用的AI智能工具:AI写作、AI绘画、AI翻译全都有

在科技不断进步的今天,人工智能(AI)已经成为我们日常生活中不可或缺的一部分。它不仅在各个领域都有应用,还为我们提供了许多方便快捷的工具。对此,小编今天推荐7款人工智能软件,AI写作、AI绘画、AI翻译全都…

Vue - 你知道Vue组件之间是如何进行数据传递的吗

难度级别:中级及以上 提问概率:85% 这道题还可以理解为Vue组件之间的数据是如何进行共享的,也可以理解为组件之间是如何通信的,很多人叫法不同,但都是说的同一个意思。我们知道,在Vue单页面应用项目中,所有的组件都是被嵌套在App.vue内…

2024/4/1—力扣—BiNode

代码实现: /*** Definition for a binary tree node.* struct TreeNode {* int val;* struct TreeNode *left;* struct TreeNode *right;* };*/void convertBiNode_pro(struct TreeNode *root, struct TreeNode **p) {if (root) {convertBiNode_pro(roo…

Git - 如何重置或更改 Git SSH 密钥的密码?

Git 使用 ssh 方式拉取代码时,报 ssh password login,提示输入密码,这时很容易误填为 Git 的登录密码,其实这时需要输入 SSH 证书的密码,下面直接提供更改以及重新导入证书的方式。 首先需要确认你的本地是否有 SSH 钥…

HIS系统是什么?一套前后端分离云HIS系统源码 接口技术RESTful API + WebSocket + WebService

HIS系统是什么?一套前后端分离云HIS系统源码 接口技术RESTful API WebSocket WebService 医院管理信息系统(全称为Hospital Information System)即HIS系统。 常规模版包括门诊管理、住院管理、药房管理、药库管理、院长查询、电子处方、物资管理、媒体管理等&…

与汇智知了堂共舞,HW行动开启你的网络安全新篇章!

**网安圈内一年一度的HW行动来啦! ** 招募对象 不限,有HW项目经验 或持有NISP二级、CISP证书优先 HW时间 以官方正式通知为准 工作地点:全国 薪资待遇 带薪HW (根据考核成绩500-4000元/天不等) 招募流程 1.填写报名…

中科数安 || 公司电脑文件资料防泄密系统

#公司电脑文件资料防泄密# 中科数安推出的公司电脑文件资料防泄密系统,是一款专为企业电脑终端设计的数据安全解决方案,旨在全方位保护公司电脑中存储、处理、传输的各类文件资料免遭非法窃取、泄露或滥用。 中科数安 || 文件数据资料防泄密软件 PC地址…

第二十五周代码(蓝桥杯查缺补漏)

2024/03/31 周日 填充 题目链接 【参考代码】 想用暴力&#xff0c;没过 //枚举&#xff0c;未出结果QAQ #include <bits/stdc.h> using namespace std; string s00 "00"; string s11 "11"; int ans 0; //m个问号&#xff0c;子串有2^m…

如何本地搭建Discuz论坛并实现无公网IP远程访问

文章目录 前言1.安装基础环境2.一键部署Discuz3.安装cpolar工具4.配置域名访问Discuz5.固定域名公网地址6.配置Discuz论坛 前言 Crossday Discuz! Board&#xff08;以下简称 Discuz!&#xff09;是一套通用的社区论坛软件系统&#xff0c;用户可以在不需要任何编程的基础上&a…

基于velero和minio实现k8s数据的备份

1.30部署minio rootk8s-harbor:/etc/kubeasz/clusters/k8s-cluster1# docker run \ -d --restartalways -p 9000:9000 -p 9090:9090 –name minio -v /data/minio/data:/data -e “MINIO_ROOT_USERadmin” -e “MINIO_ROOT_PASSWORD12345678” quay.io/minio/minio server…

Golang | Leetcode Golang题解之第9题回文数

题目&#xff1a; 题解&#xff1a; func isPalindrome(x int) bool {// 特殊情况&#xff1a;// 如上所述&#xff0c;当 x < 0 时&#xff0c;x 不是回文数。// 同样地&#xff0c;如果数字的最后一位是 0&#xff0c;为了使该数字为回文&#xff0c;// 则其第一位数字也…

2024Spring> HNU-计算机系统-实验2-datalab-导引

前言 datalab考验对于位运算以及浮点数存储的理解&#xff0c;如果真的肯花时间去搞懂&#xff0c;对计算机系统存储的理解真的能上一个台阶。与课程考试关联性上来说不是很大&#xff0c;但对于IEEE的浮点数表示一定要熟练掌握。 导引 ①实验工具包 要完成的是bits.c中的15个…

Java | Leetcode Java题解之第13题罗马数字转整数

题目&#xff1a; 题解&#xff1a; class Solution {Map<Character, Integer> symbolValues new HashMap<Character, Integer>() {{put(I, 1);put(V, 5);put(X, 10);put(L, 50);put(C, 100);put(D, 500);put(M, 1000);}};public int romanToInt(String s) {int …

Linux中shell脚本的学习第一天,编写脚本的规范,脚本注释、变量,特殊变量的使用等,包含面试题

4月7日没参加体侧的我自学shell的第一天 Shebang 计算机程序中&#xff0c;shebang指的是出现在文本文件的第一行前两个字符 #&#xff01; 1)以#!/bin/sh 开头的文件&#xff0c;程序在执行的时候会调用/bin/sh, 也就是bash解释器 2)以#!/usr/bin/python 开头的文件&#…

Qt通讯录管理系统

在git上面找的一个操作文件的qt通讯录管理系统,尝试将它复刻了一下. 成果展示 分两个txt文件存储,一个是手机联系人,一个是电话卡联系人,主要功能就是增删改查,主要使用的是OOP的编程思想. 实现过程 界面布局 考虑设计三个界面,主界面,添加联系人界面和修改联系人的界面.于是添…

深入理解nginx realip模块[上]

目录 1. 引言2. Real IP模块的使用2.1 启用Real IP模块2.2 配置Real IP模块2.2.1 配置指令2.2.2 举例 3. 变量的使用 深入理解nginx realip模块[上] 深入理解nginx realip模块[下] 1. 引言 nginx 的 Real IP 模块用于解决代理服务器转发请求到nginx上时可能出现的 IP 地址问题…

ES入门十一:正排索引和倒排索引

索引本质上就是一种加快检索数据的存储结构&#xff0c;就像书本的目录一下。 为了更好的理解正排索引和倒排索引&#xff0c;我们借由一个 **唐诗宋词比赛&#xff0c;**这个比赛一共有两个项目&#xff1a; 给定诗词名称&#xff0c;背诵整首给诗词中几个词语&#xff0c;让…

lua学习笔记6(经典问题输出99乘法表)

print("************for循环的99乘法表*************") for i 1, 9 dolocal line "" -- 创建一个局部变量来累积每行的输出--local 是一个关键字&#xff0c;用于声明一个局部变量。for j 1, i doline line .. j .. "*" .. i .. ""…

mysql查询时大小写,末尾空格容易造成的问题。

问题描述 在使用mysql innodb 默认的配置时&#xff0c;发现mysql查询时是忽略大小写和末尾空格的。 示例 比如下面的查询&#xff1a;查询条件中是大写的字母&#xff0c;末尾也没有空格。但是查询出的结果中&#xff0c;既有小写的&#xff0c;也有末尾带有空格的&#xf…

Windows Edge浏览器的兼容性问题及解决方案

1、Windows Edge&#xff08;了解 Microsoft Edge&#xff09;&#xff1a; 简单介绍&#xff1a; Microsoft Edge是一款由微软开发的网页浏览器&#xff0c;最初于2015年伴随Windows 10推出&#xff0c;作为Internet Explorer的继任者&#xff0c;旨在提供更快、更安全、更现代…