OpenAI再出新作,AIGC时代,3D建模师的饭碗危险了!

news2024/11/15 19:38:50

大家好,我是千与千寻,也可以叫我千寻哥,说起来,自从ChatGPT发布之后,我就开始焦虑,担心自己程序员的饭碗会不会哪天就被AIGC取代了。

有人说我是过度焦虑了,但是我总觉有点危机感肯定没有坏处。(结尾反转,hhh,希望你看下去!)

不过好家伙,还没等AIGC大模型完全替代程序员,我发现AIGC大模型又开始抢三维建模行业从业者的饭碗了…

OpenAI公司有整新活了,发布了模型应用shape-E,这个模型能干什么呢?千寻先卖个关子!先给大家介绍一种职业,3D建模师。

3D建模师,这个职业的工作内容是什么呢?

3D建模师,在工业界和游戏界里面的需求最多。通俗来说,就是将二维平面的人物形象进行三维建模的转换。啊这?说人话!我们直接用一个例子说明:

《哆啦A梦》人员合照2D版本

《哆啦A梦》人员合照3D版本

将平面的2D的动漫形象,转化为3D立体的手办,用于制作3D动漫大电影,这是在游戏与动漫里面的3D建模应用。

其实3D建模技术,更多的应用在工业届多一些,在前几年3D打印技术十分火爆的时候,就类似现在的ChatGPT的风口,在三维建模软件里面画好三维模型,直接通过3D打印机打印出来零件。3D建模技术的最佳应用之处就是3D打印。

3D的齿轮模型建模

通过以上的三维建模仿真,然后再接入3D打印机就可以实现齿轮零件的实际打印需求。而且现在3D打印技术已经飞入寻常百姓家了,所以有条件的,真的可以尝试一下,很有意思。

讲解完了2D转换为3D建模的实际效果,下面我们进入本文章的正题,OpenAI发布的这个shape-E算法模型。

这个模型的话,它能实现的功能的话包括两种。

一、输入文字描述来输出指定的三维模型图

我们先来看一下官方的生成例子

  1. 一个生日蛋糕

  1. 一个像树一样的椅子

  1. 一个正在跑步中的人

以下是官方提供生成的三维模型的合集图片。可以看到官方生成的模型效果还是很不错的。

千寻自己也测试了一些,给大家看看效果

  1. a red apple with green leaves

(一个带绿叶的苹果)

  1. a desk

(一张桌子)

  1. a silver gear

(一个银色的齿轮)

千寻测试的这几个“文字转3D模型”的测试用例都是相对简单一些的。

而且千寻发现,还是输入的text文字描述,最好还是英文句子,借助一下谷歌翻译,可以保证3D模型生成的效果更加漂亮、准确。

二、输入二维平面图输出指定的三维模型图

除了实现输出文字描述可以生成三维模型的图片,我们也可以通过输入3D模型的平面视角图片,生成3D模型,以下是一些简单的生成效果,供大家参考。

  1. 二维齿轮图片转三维模型

  1. 二维小狗图片转三维模型

  1. 二维建筑平面图片转三维模型

不仅如此,除了在Hugging Face社区可以进行直接的三维模型。

生成的三维模型的图片也是支持本地查看的,将三维模型的图片进行下载。

使用windows系统自带的3D画图就可以查看了,效果更好!

以上是shape-E的模型实现的最终效果,我们下面分析一下shape-E模型的工作原理。

三、模型工作原理

Shap-E 还是用到了潜空间扩散模型(Latent Diffusion)。

熟悉 Stable Diffusion 的小伙伴应该对于这个概念并不陌生,其实就是将一些高维信息,降维表示到一个特定的特征空间,然后再根据这些特征,做生成。

Shap-E 整体结构也是类似的 Encoder - Decoder 结构。

不过输入和输出变了,比如 Shap-E 的 Encoder 结构是这样的:

输入是点云模型,经过降维、交叉注意力层、Transformer等结构,最终获得一个 implicit MLP。

至于 Decoder 则采用 STF Rendering 进行渲染,同时加入了 CLIP 的 text embedding。

Shap-E 支持多模态,输入既可以是文字,也可以图片。

四、模型算法应用

项目地址:

https://github.com/openai/shap-e

算法部署并不复杂,Shap-E 只依赖于 CLIP。

(1)可以单独创建一个名为 shape 的虚拟环境

conda create -n shape python=3

(2)激活conda环境

conda activate shape

(3)然后安装好 CLIP 的一些依赖

conda install --yes -c pytorch pytorch=1.7.1 torchvision cudatoolkit=11.0
pip install ftfy regex tqdm

(4)进入 Shap-E 项目的根目录,pip 安装剩余依赖包

pip install -e .

shap_e/examples/sample_text_to_3d.ipynb 是文本描述生成三维模型的脚本代码。

shap_e/examples/sample_image_to_3d.ipynb 是二维平面图片生成三维模型的脚本代码。

五、千寻总结

写完这篇技术文,千寻的第一个想法就是,害,文章刚刚开始时候,有点贩卖焦虑了,就这!

就这生成效果,想要完全取代人家3D建模师,我觉得还是有很长的路要走的。

目前的生成算法存在的问题:

1.模型的推理时间较长,平均生成一次三维模型图片,耗时大约30S左右。

2.生成的三维模型,细节度不够,只能算是有一个大体的外部轮廓,动物的面部细节特征几乎是全部没有。

所以根本不用焦虑,但是还是要继续努力啊!

我是千与千寻,一个只讲干货的码农,我们下期见~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/564357.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分布式事务解决方案-Seata

分布式事务解决方案-Seata 1.分布式事务问题1.1.本地事务1.2.分布式事务1.3.演示分布式事务问题 2.理论基础2.1.CAP定理2.1.1.一致性2.1.2.可用性2.1.3.分区容错2.1.4.矛盾 2.2.BASE理论2.3.解决分布式事务的思路 3.初识Seata3.1.Seata的架构3.2.部署TC服务3.3.微服务集成Seata…

C++ string类 迭代器 范围for

string类 在C语言当中 ,也有字符串,它是以 " \0 " 结尾 的 一些字符的集合,在C的标准库当中还有一些 用于操作 str 类型的库函数,但是,这些函数的功能不是很全面,而且这些操作函数和 str 类型是分…

B2B企业需要什么样的客户体验管理?销售易出手了

导读:如何将类似B2C领域的私域体验延展到B2B领域? “不愿在顾客上花时间带来的结果只有一个,那就是让客户转而寻找值得他们花时间的消费体验。”2012年问世的《体验经济》一书,一语道破客户体验的重要性。 过去,提到体…

PG安装使用walminer插件教程

一、下载源码 https://gitee.com/movead/XLogMiner/tree/walminer_3.0_stable/ 二、编译安装插件 克隆下载源码后,将walminer目录放进pg下的contrib目录中 cd /home/postgres/postgresql-15.3/contrib/将walminer源码目录放进此路径下,进入walminer目…

卷麻了,公司新来的00后测试用例写的比我还好,简直无地自容......

经常看到无论是刚入职场的新人,还是工作了一段时间的老人,都会对编写测试用例感到困扰?例如: 如何编写测试用例? 作为一个测试新人,刚开始接触测试,对于怎么写测试用例很是头疼,无法…

STM32寄存器映射

1. 寄存器基本原理 寄存器是单片机内部一种特殊的内存,可以实现对单片机各个功能的控制,我们编写程序最终就是去控制寄存器 下面的举例平台为STM32F407ZG 1.1 STM32寄存器分类 大类小类说明 内核寄存器 内核相关寄存器 包含R0~R15、xPSR、特殊功能寄…

《幸福关系的7段旅程》

关于作者 本书作者安德鲁∙马歇尔,英国顶尖婚姻咨询机构RELATE的资深专家,拥有 30年丰富的咨询经验,并为《泰晤士报》《观察家》和《星期日快报》撰写专栏文章。已出版19部作品,并被翻译成20种语言。 关于本书 《幸福关系的7段…

SQL查询比较慢,如何进行排查?如何进行SQL优化?

目录 一、开启慢查询日志 二、SQL优化 三、总结 一、开启慢查询日志 SQL慢查询是指执行时间较长的SQL语句,可能导致系统性能下降和响应时间延长。通过以下步骤可以开启慢查询日志记录: #查询是否开启慢查询日志 slow_query_log显示ON说明已开启&#…

广和通携手有人物联网完成5G SUL辅助上行功能验证

近日,广和通5G模组FM650-CN已在商用网络中实现5G SUL上行能力增强,助力有人物联网工业路由器在仿真网络环境中完成SUL辅助上行功能的验证。本次验证成功,意味着FM650-CN已具备SUL辅助上行商用能力,有利于推动更多5G终端支持SUL特性…

es 7 Es分布式基础

目录 复杂特性es已经做了分片副本负载均衡实现 设置分片数副本数 双机器读写 自动横向扩容 Node 节点宕机主节点切换 数据路由 增删改操作 读操作 _bulk 复杂特性es已经做了分片副本负载均衡实现 1.每个索引包含多个分片 设置分片数副本数 双机器读写 自动横向扩容 No…

React | React的CSS方式

✨ 个人主页:CoderHing 🖥️ React.js专栏:React的CSS方式 🙋‍♂️ 个人简介:一个不甘平庸的平凡人🍬 💫 系列专栏:吊打面试官系列 16天学会Vue 11天学会React Node专栏 &#x…

Axure教程—多色折线图(中继器)

本文将教大家如何用AXURE中的中继器制作多色折线图 一、效果介绍 如图: 预览地址:https://xpdm3g.axshare.com 下载地址:https://download.csdn.net/download/weixin_43516258/87814320 二、功能介绍 简单填写中继器内容即可动态显示值样…

AppJoint2-2023再看安卓组件化框架

零、什么是组件化 为了避免一些小伙伴一脸懵的进来,又一脸懵的出去,我先简单的说一下什么是组件化。 开发程序时,我们都希望功能间的耦合度尽可能的低,这样的好处是:便于并行开发、代码易于维护、出问题时也好定位。…

抖音seo矩阵系统源码开发开源型私有化部署方案

抖音SEO矩阵系统是基于抖音平台的搜索引擎优化技术的一种系统,其主要作用是通过一系列的技术手段,提高抖音视频的曝光和排名,使其获得更多的流量和粉丝。在本文中,我们将介绍抖音SEO矩阵系统的开发技术,包括系统设计、…

map reduce实现累加器

需求:数组长度为100,每一项为对应下标,累加求和。 切题思路: 1.如何声明一个长度为100的数组?答:new Array(100) 2.数组每一项如何比前一项1 答:map(item,index)index为数组下标,…

企业推行OKR的必要条件

今天我们的话题是“OKR在企业落地执行,有哪些必要条件?” 对于有落地 OKR 经验的人可能更深有感触,OKR理解起来容易,但落地起来却困难重重,常言道“万事开头难”,那接下来我们就先从落地 OKR 的先决条件开始说起吧。 …

我的创作纪念日,成为创作者的第512天

机缘 从事编程岗一有将近4年的时光了,但正在开始总结写博客还是一年前,是在百度搜素资料了解到的CSDN开发者社区。在CSDN认识了很多技术大牛,他们的文章记录了他们的学习路径,看到他们从小白一步一步成长为大牛,这才下…

大数运算(加法,减法,乘法,除法)

目录 一.大数加法 1.题目描述 2.问题分析 3.代码实现 二.大数减法 1.题目描述 2.问题分析 3.代码实现 三.大数乘法 1.题目描述 2.问题分析 3.代码实现 四.大数除法 1.题目描述 2.问题分析 3.代码实现 一.大数加法 1.题目描述 以字符串的形式读入两个数字&#…

Smartbi电子表格故事之高效营销活动后的自助数据分析

自助数据分析是BI的潮流,但几乎都是数据可视化流派,Smartbi电子表格另辟蹊径,在Excel中提供自助分析的能力,然后通过服务器进行发布,这个功能我们称之为“Excel融合分析”,目前在免费版中即可体验。 系统数…

Python脚本如何定时运行

一、背景 很多时候,我们使用Python编写好的各种脚本,会有定时运行的需求,希望脚本能每天在指定的时间点定时运行,比如:定时发送消息、定时发送邮件、定时执行自动化测试脚本等。 定时运行脚本常用的有2种方式&#x…