ChatGPT+Roblox,元宇宙的AI叙事逻辑#Leveling Up

news2025/1/12 21:03:47

3a1f25f3174252e9fb0090d04a6ebeec.png

a88bc62ac37aea89bb69374a148af2bd.png

abfd2c73d80c3e3ef37f9e71cb85a8af.png

MixCopilot

嗨,亲爱的听众朋友们!欢迎收听我们的播客节目!我是你们的主播:MixCopilot 混合副驾。今天我们要为大家带来的是我们的AI革命系列节目之一。这个系列节目聚焦于AI领域的一些最有影响力的建设者,他们将会讨论和辩论AI的现状、未来以及其中的一些重大问题。如果你想了解更多关于我们AI革命系列的内容,可以回顾往期👆

a9190a28483c6b82c5586f2b4b3e8d87.jpeg

在本期节目中,我们有幸邀请到了Roblox的联合创始人兼CEO David Baszucki和a16z的Jonathan Lai。他们将会讨论AI如何改变游戏和虚拟世界以及我们如何创造它们。

这可是个非常令人兴奋的话题啊!

不知道你们有尝试过使用 ChatGPT 编写 Roblox 游戏吗?

ChatGPT 让您只需与其聊天即可轻松创建自定义游戏内容。您可以使用它来构建关卡、创建角色、设计游戏机制等等。借助 ChatGPT,Roblox 开发变得简单了 1000 倍。

AI在游戏和虚拟世界中的应用,真是让人大开眼界啊!

所以,亲爱的听众朋友们,准备好了吗?

让我们一起来听听精彩分享吧!

5263110a19d8e673167497bb97e27395.png

在游戏中应用生成式人工智能

接下来分享一些关于Roblox游戏平台上人工智能如何改变游戏开发方式的见解。

Dave告诉我们,Roblox不仅仅是一个游戏平台,更是一种远程沟通的最终形式。

特别是在疫情期间,很多孩子们无法和朋友们一起玩耍,Roblox提供了一个平台让他们在游戏中与朋友们保持联系。甚至在Roblox的办公室里,他们也模拟了一种偶然性的体验,让远程工作的员工们能够更好地互动。

Dave还提到了人们在Roblox平台上的三个主要应用类别。

第一个是个性化发现,安全和文明的质量,语音和文本监控以及实时自然翻译的质量。

大家可能都没注意到,但这些功能已经在平台上运行了2到4年了。

第二个是生成式模型的应用,包括代码生成、3D物体生成、角色生成和游戏生成。

这些都非常有趣!

最后一个则是未来的方向,也就是虚拟环境中的虚拟副本或者一种智能代理的形式。

你想象一下,在你孩子的学校项目中,你可以让乔治·华盛顿亲自出演?

又或者,如果Roblox与Tinder合作,你是否愿意让你的虚拟副本在首次3D见面时代替你去?

这些想法真是令人兴奋啊!Jon提到了游戏制作中所涉及的各个环节,包括概念设计、故事板、2D和3D图像的创作,还有代码和物理引擎。

而Roblox已经在他们的工作室和平台中构建了许多这些环节。

那么,根据刚才Dave所说的生成式模型的新一代技术,你们可能会好奇这些环节中哪些会受到最大的影响呢?Dave认为几乎所有环节都会受到影响,但他们对此持乐观态度。

在Roblox上有超过6500万的用户,但大多数人并没有达到他们想要的创作水平。

Dave提到了一个有趣的例子,他们曾经设想在Roblox上创建一个仿真的Project Runway,但发现对于大多数人来说,这也太复杂了。现在,当Project Runway在Roblox上出现时,你可以通过文本提示、图像提示、语音提示等方式来参与创作,就像你真的在现场一样。

Dave相信,这种生成式模型技术将加速游戏内容的创作过程。

个性化游戏体验

我们的主讲人Jon提到了一个很有意思的观点,就是人们可以在游戏中创造出自己的个性化体验。

即使在游戏中,他们也能拥有一个完全个性化的角色或外观装扮。这真是太酷了!

Dave接着解释说,传统的3D创作通常使用一些复杂的软件,比如Blender、3D Studio或Maya。而Roblox Studio则提供了更简单易用的创作工具,让更多人可以参与到创作中来。而且,随着AI技术的发展,未来我们还可以看到更高级的个性化体验。

他举了一个例子,比如在Roblox上的“Tycoon Builder”和“Roller Coaster Builder”等游戏中,玩家可以更直观地创建自己的3D物体,并且这些物体还可以在游戏中保持持久化。

而当AI服务能够在任何游戏体验中提供支持时,我们可以想象,比如在“Project Runway”这样的游戏中,玩家可以创造出真正独一无二的时尚体验,而不再局限于传统的3D软件。

Jon进一步提到了个性化游戏体验的强大潜力,即未来的Roblox用户可以享受到完全独特、根据自己偏好和选择量身定制的游戏体验。这真是让人兴奋不已!Dave补充说,这甚至可以进一步扩展,通过实时生成和大规模推理,实现完全个性化的游戏体验。

想象一下,你在玩一款超级龙与地下城的游戏,但是它会根据你的玩法和历史记录,实时生成一个独一无二的3D体验,这是之前没有人见过的!当然,这需要大量的计算能力和推理能力的支持。

我们团队在建设自己的基础设施方面一直做得很好,拥有成千上万台服务器、多个边缘数据中心和大量的网络连接。

这些基础设施主要用于3D模拟,但随着技术的发展,我们也可以将其用于高效的推理任务,以低成本提供高质量的推理服务,让创作者们无需担心成本问题。

哇,听起来真是令人兴奋!

未来的游戏体验将更加个性化、独特而又充满创意。

我们可以期待在Roblox这样的平台上,创造出属于自己的游戏世界,享受到前所未有的个性化乐趣。

Roblox

在最新的股东信中,Roblox提到他们正在开发自己的多模态生成模型,这个模型将包含许多我们刚刚聊到的内容。那么,到底Roblox正在构建什么呢?根据Dave的解释,Roblox是一个非常个性化的公司,有着20到30个面向最终用户的垂直应用程序。自然语言过滤与生成式3D完全不同。但是,在最终用户层面,我们希望所有这些应用都能运行,并且以自愿参与的方式使用所有的数据来帮助提升它们的质量。

在公司内部,可能会有2到3个大型模型的聚类。其中一个与安全和文明、自然语言处理、自然语言翻译有关,另一个与3D创作有关。

就像在《Project Runway》中一样,这些模型可能会结合文本、图像和生成的头像。还有一个领域是虚拟人类,我们如何利用50亿小时的人类自愿参与数据来更好地模拟人类在3D环境中的行为?

我认为在这三个领域中,大型模型的应用是有可能的。

然后,还会有像LLM这样的超大型公司。而我们可能处于这个层级的下一层,非常专注于我们想要的领域,并具备训练和运行这些领域的大规模推断的能力。另外,Roblox有一个庞大的专有数据集供他们使用。所有这些年来在Roblox中创建的3D资源都是宝贵的数据。

在任何3D沉浸式环境中,人们之间的交流可以为安全性、文明性、3D、动作眼球追踪以及人类互动提供有价值的信息。

我们目前正在关注一个非常困难的问题,那就是如何实现真正高质量的3D生成,而不仅仅是2D生成。

虽然市面上有很多出色的2D生成技术,但我们将更加专注于3D生成。在构建技术栈的过程中,Roblox会考虑与外部合作伙伴合作,还是自己内部建设。

毕竟,他们拥有丰富的数据和计算资源。Dave提到,他们对于那些可以以低成本大规模训练和推断的技术非常感兴趣,以及那些可以抽象不同硬件设备的技术。他们会密切关注这些技术栈的发展。

未来的界面设计

你们知道吗,随着我们朝着元宇宙的方向发展,是否需要新的用户界面或发现机制呢?这是我们要探讨的问题。Dave认为,像亚马逊、Netflix、TikTok和YouTube这样的平台,他们面临的难题在于如何在短期内提高企业价值和股价的同时,又能优化长期价值。他们要解决的就是发现问题,因为有时候一些惊人的作品可能会被埋没,本可以为平台增加5%的价值。

发现问题确实是一个挑战,虽然很多公司正在以非常有趣的方式来解决。不仅仅是内容和实时社交网络,用户界面也有很多改变的机会。我们可以思考其他人在做什么,从而找到更多的机会。

Jon觉得这很有趣,因为我们刚刚提到了Netflix和TikTok等大公司使用人工智能的例子,它们都有个性化的推荐和动态供应。

你可以想象一下未来的情景,当一个用户进入Roblox时,可能不再看到游戏库或游戏目录,而是直接展示一个动态供应,你就像是从一个端到另一个端穿梭一样。Dave表示,这个想法很准确。我们正在不断测试新的用户体验。

应该是2D还是3D界面呢?

数字身份的创建和发现之间的权重是多少?

与朋友们的互动和优化又如何权衡?

或许我们会发现,这些都需要个性化来实现。哇,听起来未来的界面设计真是令人兴奋啊!我们可以期待在元宇宙中体验到更多个性化和创新的界面呢!

AI技术对创作者的影响

我们刚刚听到了Jon和Dave的对话,他们谈论了AI工具对创作者和玩家的影响以及反馈。根据Dave的说法,当我们给用户或玩家提供更多的功能时,通常会看到事情的加速发展,尽管现在还只是初期阶段。他提到了一些已经推出的AI工具,比如代码辅助和材质生成器,还有一些即将推出的功能,比如基于提示的角色创建和通用3D资产创建。

这些功能都非常令人兴奋,能够给创作者和玩家带来更多的可能性。Jon接着问道,这些技术是否会改变游戏的玩法机制,是否会出现新的游戏类型?

Dave表示乐观地认为,越来越多的人将能够在创作中拥有更多的控制权。

他举了一个例子,就像是《Project Runway》或Karlie Kloss的经验,这样的创作体验在过去是不可能的。但是,如果有数以百万计的人可以充当时装设计师,并参与投票和选择最优秀的作品,那么一些作品甚至可能被制作成真实的物品,或者被学院挑选出成为未来的设计师。

我们可以想象,通过AI工具来增强孩子们的创造力,从他们的想象力和玩耍中获得更多的灵感。比如,如果在房间中发生了自然灾害,创作者们很难制作出这样的体验。但是通过一个文本提示,你可以想象到有一些游戏会在瞬间生成,这些体验的多样性和狂野程度将是令人难以置信的。

Dave进一步提到,我们不仅可以在开发大型游戏时使用AI工具,而且可以在任何地方自然地使用文本提示或语音提示。这将取代传统的使用体素或在3D环境中建模的方式,就像在传统的角色编辑器中使用滑块和单选按钮一样,我们可以更交互式地使用文本提示来进行创作。

AI技术的发展将给创作者和玩家带来更多的可能性和创作空间。让我们拭目以待,看看未来会有怎样的创作和游戏新体验吧!

NPC作为副驾驶员的概念

NPC作为教师和副驾驶员这个想法感到非常兴奋。他们认为,在你第一次使用Roblox时,可以有一个向导NPC,告诉你接下来应该去哪里。如果你对建设方面感兴趣,它还可以帮助你组织你的前几个体验,等等。

这种将NPC作为副驾驶员而不是合作玩家的概念,潜力巨大!Dave提到了一些关于副驾驶员的有趣事情。有一种副驾驶员是我们整天戴着耳机,它会一直和我们对话。这可能更多地是面向消费者的实时副驾驶员。但显然有很多公司正在努力构建一种副驾驶员,它可以连接到你的电子邮件、短信、Slack、网络浏览器等,代替你进行一些操作。

我对副驾驶员之间使用自然英语进行对话的概念非常感兴趣,我认为这将成为副驾驶员的通用界面。他们还谈到了一种有趣的情景,就是通过提供一些提示来创建NPC。比如说,"嘿,我正在建设一个历史宪法的场景。我希望乔治·华盛顿在那里,但我希望他在最高程度上表现出礼貌,并且能够引导新用户进行体验,给他们一些关于宪法历史的介绍,并在完成后离开。" 我们相信,你将会看到这种形式的辅助。Jon认为这是一个令人难以置信的例子,因为有什么比直接与那些参与历史场景或时代的人交谈更好的学习历史的方式呢?你可以真正体验到这种方式如何推动教育...

我们还讨论了与朋友一起去古罗马的交流方面。你将会去到古罗马,大部分你会与历史上的人物进行互动,这些人物将尽可能真实地呈现,以丰富你的体验。这将是非常迷人的!

NPC作为副驾驶员的概念将为我们的游戏体验带来全新的可能性,不仅可以帮助新手玩家更好地上手,还能丰富教育和历史体验。我们迫不及待想要看到这个概念的进一步发展了!

VR和空间计算(spatial computing)

最近有个消息引起了我的注意,Roblox应用在Meta Quest平台上的beta版本仅仅在前五天就实现了100万次下载,这还不包括正式版在Oculus Store上的下载量。这让我对VR和空间计算产生了很多想法。我们知道,当iPhone发布的时候,它带来了一个革命,让我们可以在小屏幕上消费2D HTML内容,而不再局限于大屏幕的网页浏览。

现在我们已经习以为常了,但是我们的孩子可能根本意识不到10年前还有一种叫做“手机网页”的落后东西。

同样的,我认为3D也是如此。它是云端中的沉浸式多人体验,是模拟的3D世界。正因为如此,每个设备都有其最佳的相机和用户交互方式,并且具有不同的沉浸程度。你的手机可能不如VR头盔那么沉浸,但是手机更加便捷。

我们认为市场最终会决定你使用哪种设备来消费这些内容。我们并不试图改变市场,但我们希望能够出现在每个地方,以便与我们的玩家一起见证市场的变化。

我们过去的做法之一是,我们的所有3D工程师都在使用糟糕的Android设备作为主要测试设备,这对于Oculus的开发非常有帮助。我不是说这是一款糟糕的Android设备,但是它需要渲染两个眼睛的画面,这在技术上是具有挑战性的。通过我们高性能的基础设施,而不是仅仅依赖16个核心,我们能够应对这个挑战。

很令人兴奋的是,未来可能会针对不同的设备优化不同类型的体验。比如,你可以在电脑上使用鼠标和键盘玩经营游戏,然后在VR头盔中玩第一人称射击游戏。你可以选择合适的设备来玩游戏。

好了,接下来是一个有趣的快问快答环节。首先是,你最喜欢的书是什么?Dave回答是《无限游戏》(Infinite Game)。

接下来是,你最喜欢的游戏是什么?Dave回答是国际象棋。

然后是,你从导师、朋友或其他人那里得到的最好的建议是什么?

Dave说他小时候没有得到很多好的建议,他父亲给他的最糟糕的建议是“你应该学会会计和商业”。他给大家的一般建议是:我觉得我的前两份工作是灾难,但是生活是漫长的。如果你找到了一件你非常擅长并且热爱的事情,那就是最佳的选择。不要追随你的激情,也不要追随你擅长的事情。如果你能够将这两个方面结合起来,那就是最理想的选择。

最后一个问题,你对未来5年世界的发展有什么疯狂的预测?

Dave提出了一个关于人工智能的图灵测试问题。如果我们将AI应用于1633年的信息,并让它预测太阳系中是地球还是太阳居中,尽管99.9%的信息都在说地球居中,但我认为在5年内AI可能会选择太阳。如果是10年的话,Dave认为AI会选择太阳。

非常感谢大家收听,这真是一次愉快的讨论!希望你们喜欢今天的内容。记得继续关注我们的播客,我们会为你们带来更多有趣的话题。

我是你们的播客主播:MixCopilot 混合副驾,我们下次再见!

ef51a0ce3923e550037d8bb8a0081f51.png

原文视频

https://youtu.be/RirqAH2m1HY

生成式人工智能的“经济学”,The Economic Case for Generative AI#a16z

我们将抵达”终点“?Where We Go From Here#a16z#openai

figma+ChatGPT,人人都是设计师#设计开放·开源#Democratizing Design#a16z

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1198298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Leetcode -463.岛屿的周长 - 476.数字的补码

Leetcode Leetcode -463.岛屿的周长Leetcode - 476.数字的补码 Leetcode -463.岛屿的周长 题目:给定一个 row x col 的二维网格地图 grid ,其中:grid[i][j] 1 表示陆地, grid[i][j] 0 表示水域。 网格中的格子 水平和垂直 方向…

数字化仪的超声波应用

超声波是频率大于人类听觉范围上限的声学声压(声学)波。超声波设备的工作频率为 20 kHz 至几千 MHz。表 1 总结了一些更常见的超声波应用的特征。每个应用中使用的频率范围都反映了实际情况下的平衡。提高工作频率可以通过提高分辨率来检测较小的伪影&am…

【刷题】力扣每日一题 : 381、2300、765

前言 本篇文章用于记录在做力扣每日一题的时候遇到的一些知识点以及自己的思路 381 题干 题目链接 我的思路及做题过程 思路1 我的想法是 记录每个字符串的字母出现个数 然后比较两个字符串是否有字母同时出现 class Solution { public:int judge(string s1, string s2…

RAG相关内容介绍

本文记录在查找RAG相关内容时所整合的一些资料与内容,还有一个组会报告的PPT 文章目录 定义LLM的知识更新难题 RAG是什么?-“开卷考试”RAG原理与技术RAG技术细节一、数据索引• 数据提取• 分块(Chunking)分块方式确定应用程序的…

本地编译安装 Minkowski Engine 报错 Cuda 版本 与 Pytorch 版本不匹配

编译 Cuda 版本 C 插件 Cuda 版本 与 Pytorch 版本不匹配解决方案 报错详情环境报错分析 报错详情 RuntimeError: The detected CUDA version (12.2) mismatches the version that was used to compile PyTorch (11.8). Please make sure to use the same CUDA versions.环境 …

WebSocket是什么以及其与HTTP的区别

新钛云服已累计为您分享774篇技术干货 HTTP协议 HTTP是单向的,客户端发送请求,服务器发送响应。举个例子,当用户向服务器发送请求时,该请求采用HTTP或HTTPS的形式,在接收到请求后,服务器将响应发送给客户端…

IOC - Google Guice

Google Guice是一个轻量级的依赖注入框架,专注于依赖注入和IoC,适用于中小型应用。 Spring Framework是一个全面的企业级框架,提供了广泛的功能,适用于大型企业应用。 是吧!IOC 容器不止Spring,还有Google Guice,来体…

钉钉统计部门个人请假次数go

前言 最近小组需要统计部门各种请假次数,写了一个方法,第一次实战中用到递归函数,简单记录一下。 效果展示 这些数据不需要返回json,这里这样是为了方便测试。可以通过这些数据完成其它的操作。 功能实现 钉钉服务端调试工具A…

linux入门---线程池的模拟实现

目录标题 什么是线程池线程的封装准备工作构造函数和析构函数start函数join函数threadname函数完整代码 线程池的实现准备工作构造函数和析构函数push函数pop函数run函数完整的代码 测试代码 什么是线程池 在实现线程池之前我们先了解一下什么是线程池,所谓的池大家…

C语言——求 n 以内(不包括 n)同时能被 3 和 7 整除的所有自然数之和的平方根 s,n 从键盘输入。

#define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h> #include<math.h> int main() {int i,n;double s0.0;printf("输入任意一个自然数&#xff1a; ");scanf("%d",&n);for(i1;i<n;i) {if(i%30&&i%70){si;}}ssqrt(s);printf(…

低价寄快递寄件微信小程序 实际商用版,对接了低价快递渠道,运营平台赚取差价,支持市面上全部主流快递

盈利模式 快递代下CPS就是用户通过线上的渠道&#xff08;快递小程序&#xff09;&#xff0c;线上下单寄快递来赚取差价&#xff0c;例如你的成本价是5元&#xff0c;你在后台比例设置里面设置 首重利润是1元&#xff0c;续重0.5元&#xff0c;用户下1kg的单页面显示的就是6元…

JAVA集合学习

一、结构 List和Set继承了Collection接口&#xff0c;Collection继承了Iterable Object类是所有类的根类&#xff0c;包括集合类&#xff0c;集合类中的元素通常是对象&#xff0c;继承了Object类中的一些基本方法&#xff0c;例如toString()、equals()、hashCode()。 Collect…

Linux —— 网络编程套接字

目录 一&#xff0c;网络字节序 二&#xff0c;socket编程接口 sockaddr结构 源IP地址、目的IP地址&#xff0c;在IP数据包头部&#xff0c;有此两个IP地址&#xff1b; 端口号&#xff0c;是传输层协议的内容&#xff1b; 端口号是一个2字节16位的整数&#xff1b;端口号用…

第 117 场 LeetCode 双周赛题解

A 给小朋友们分糖果 I 动态规划&#xff1a;设 p [ k ] [ i ] p[k][i] p[k][i] 为将 i i i 个糖果分给 k k k 个小朋友的方案数&#xff0c;先求 p [ 2 ] [ i ] p[2][i] p[2][i] &#xff0c;再求 p [ 3 ] [ n ] p[3][n] p[3][n] class Solution { public:using ll long …

API SIX系列-服务搭建(一)

APIsix简介 APISIX是一个微服务API网关&#xff0c;具有高性能、可扩展性等优点。它基于nginx&#xff08;openresty&#xff09;、Lua、etcd实现功能&#xff0c;借鉴了Kong的思路。和传统的API网关相比&#xff0c;APISIX具有较高的性能和较低的资源消耗&#xff0c;并且具有…

SpringBoot--中间件技术-2:整合redis,redis实战小案例,springboot cache,cache简化redis的实现,含代码

SpringBoot整合Redis 实现步骤 导pom文件坐标 <!--redis依赖--> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId> </dependency>yaml主配置文件&#xff0c;配置…

代码随想录 Day43 动态规划11 LeetCode T309 买卖股票的最佳时期含冷冻期 T714买卖股票的最佳时机含手续费

LeetCode T309 买卖股票的最佳时机含冷冻期 题目链接:309. 买卖股票的最佳时机含冷冻期 - 力扣&#xff08;LeetCode&#xff09; 题目思路: 这题其实就是将卖出的状态拆分成三个状态 1.前两天就卖出并一直保持卖出的状态 2.今天卖出的状态 3.今天是冷冻期的状态 当然还有一个…

ElasticSearch中常见的分词器介绍

文章目录 ElasticSearch中常见的分词器介绍前言分词器的作用如何指定分词器分词器的组成分词器的类型标准分词器空格分词器简单分词器关键词分词器停用词分词器IK分词器NGram分词器正则匹配分词器语言分词器自定义分词器 ElasticSearch中常见的分词器介绍 前言 ElasticSearch是…

泛微E-Office信息泄露漏洞复现

简介 Weaver E-Office是中国泛微科技&#xff08;Weaver&#xff09;公司的一个协同办公系统。 Weaver E-Office 9.5版本存在安全漏洞。攻击者利用该漏洞可以访问文件或目录。 漏洞编号&#xff1a;CVE-2023-2766 漏洞复现 FOFA语法&#xff1a; app"泛微-EOffice&qu…

Linux系统编程,Linux中的文件读写文件描述符

文章目录 Linux系统编程&#xff0c;Linux中的文件读写操作1.open函数&#xff0c;打开文件 Linux系统编程&#xff0c;Linux中的文件读写操作 1.open函数&#xff0c;打开文件 我们来看下常用的open函数 这个函数最终返回一个文件描述符struct file 我们查看一下它的Ubuntu…