几张图片生成3D模型?距离真正的AI建模还有多远?

news2024/11/26 18:47:09

时间溯回,早在2017年,美图秀秀就曾引入人工智能美化人像而被谷歌誉为“最佳娱乐App”。智能技术奔腾发展,今年的AIGC技术可谓在各行各业大放异彩,从AI绘画、AI写作到AI配音,人工智能技术自动生成内容已经成为继UGC、PGC之后的一种新型内容生产方式。

在AI-GC的背后,AI生成工具在每个迭代阶段流出的产品,总能引发一波“人类下岗”热议。本文就从现阶段人们对AI内容生产的使用情况,聊聊AI让我们“慌”在哪里?

1、AI绘画:“驯服”之前,需要接受随机性?

现在,除了意间绘画小程序和draft.art网站,如美图秀秀、美颜相机这种扎根于美化人像的软件也立刻释放了AI绘画功能。

 

各个社交平台上涌现出大量使用AI绘制的影像。使用AI绘画,要输入一些限定语。很多网友表示,如果想让AI参考上传的照片/图片画出…不离谱的作品,需要赘述大量“关键词”。

例如:大师之作,极高分辨率,完成度极高,等等(先写20个试试效果),同时还要很清楚地描述参考图,在此基础上,还需接受随机性有概率得到一片混沌。

看到各大社交平台的晒图,有精美的,也不乏一不小心漏掉什么描述,让AI把情侣合影直接变成两位花臂大哥的、无中生“友”的。

 

大家很开心地看到AI将自己的爱宠拟绘成人,但看到自己精致形象照被AI画成牧羊犬、哈士奇,甚至靠背椅、墙纸贴画……虽无法欣然接受,但也纷纷晒到社交媒体中取乐一下——大家似乎很快习惯了AI绘画这个项目,默认在“驯服AI”之前需要接受AI的随机性。

2、AI建模:会让建模师下岗?

最近让建模师比较关注的AI工具当属英伟达(NVIDIA)推出的Magic3D,基于文本描述自动生成3D模型。据说只需要输入一段文字,AI就能生成出一只色泽、纹理、造型俱全的3D模型。

比如,“一只坐在睡莲上的蓝色箭毒蛙”就可以生成如下结果。

 

据悉,这一结果耗时大约40分钟(这个生成速度已经比之前的DreamFusion快2倍)。Magic3D还可以执行基于提示的3D网格编辑,只需要修改文字提示,就能够立即生成新的3D模型。

看到这个最终成品,各位模型师朋友是不是松了口气?虽说模型特征算得上有模有样,不过这个小青蛙的样子依然带有随机性。事实就是如此:

如果没有限定词,AI生成的模型随机性会更大;如果增加多个限定词,那么随机性堆积出的事物会与你想要设计的目标相去更远。

所以说至少目前,各个领域中依然需要能够“指哪打哪”的优秀设计师。

有关Magic3D,另一个进步点是质量。据说,Magic3D使用监督方法可合成8倍高分辨率的3D内容。具体来说普通的用户朋友有可能不太好理解,Magic3D用一种“从粗到精”的优化方法,使用多种不同分辨率下的多个扩散先验来优化3D表征,从而生成视图一致的集合形状及高分辨率细节,以生成高保真的3D内容,同时很容易在主流的图形软件中导入和可视化。

可是,问题也来了,AI生成的小青蛙最多能代表存在这样的物种,可是并不存在这样一只小蛙,对于现实生活中并不存在的客观事物,怎样才算是“高保真”呢?

3、什么是真正的高保真三维模型?AI建模还有哪些必经之路?

截至目前,AI绘画、AI建模做的都是人类做过的事情,我们就深入说说3D建模。

我们经常提到的建模有三种:数学建模、实景建模、原生建模。数学模型不是我们要讨论的事情,而另外两种,实景建模基于现实生活中已经存在的物品,逆向工程实现三维数字化,作为模型使用的时候要求的是尺寸颜色甚至质感的高度还原;原生建模是创造现实生活中尚不存在事物,上文中的小青蛙是本不存在的,还有就是从零开始设计各种物品也算。

而这两种模型结果最终的使用方向,无外乎两种:用在现实世界中;用在虚拟空间中。(如下图所示,三维设计涉及人们生活中的方方面面)

 

最终使用在现实生活中的三维模型,例如造车、玩具设计,最终都要通过3D打印或者批量生产做出实实在在的物品;用在虚拟空间中的模型,也与近两年比较火的元宇宙话题密不可分,比方说商品的网页展示、动画人物设计。 要说二者区别,例如在影视领域,演员手持的道具就是需要3D打印出来的;角色背后的现实生活中完全不存在的场景,就只需出现在虚拟空间中。当然如果说要开一个影片发布会,现场需要通过实景还原出经典场景,这也需要制作出实际物品。 既然制作3D模型的起点和最终使用场景各不相同,那么就可以有不同的方法来提升各自的效率。

在无实物领域,大家看到了,AI可以制作一个没有角色设定、没有目标的小青蛙,但如果你想用这样的AI替代从绘画到模型的过程是不现实的。

例如,动画作品《哈尔的移动城堡》。

 

动画中的城堡并不是标准意义的西方古堡,更像一个把人类起居驼在了身上的昆虫。假设已经还原了内部客厅、壁炉、浴室、卧室等房间在空间上与外观的一一对应,并且让AI事先学习“移动城堡”的建筑原型,但是让还在学习理解客观事物的AI接受这个“城堡”是靠一团有意志的火焰来驱动,并且拥有细细的腿脚,是不是有点勉为其难?

同时,现在的AI只是单一领域的工具,例如城堡内部在搬家后的几次结构变化就依然需要人工配置才能体现出作者与导演本身的设计,视情况可能需要大量的人工限定和人工操作。所以说,让3D建模AI在一些领域可控到可以实现创作者原本意图还有很长的路要走(目测跨界喂养,需要大量数据)。

而如果从实物出发去制作模型,因为不需要手绘技能,相对来说更容易让无基础的人来上手。

我们知道,华为推出了建模服务,将AI建模体验带给了非专业的普通用户(华为用户)。苹果公司也在pro系手机/平板中内置LiDAR激光雷达。不过,由于系统的原因,得到的模型尚不能直接以文件的形式导出使用。那这是不是太遗憾了?连博雅仔都想说一句不以导出使用为目的的三维建模都是浪费感情!

如果是这样,建议大家试试易模,研发团队基于在视觉AI领域20多年的积累,设计了这款泛在于Android与iOS系统的移动端轻量化3D建模应用,内置模型编辑功能,让任何人都可以在手机端触屏编辑3D模型,还提供多种文件导出方式和格式,满足将模型导出至标准图形软件二次设计的需求,让专业用户三维处理效率更高,让非专业的普通手机用户均可快速上手体验一键式智能三维创作。

 

​易模,更快更好地创作真正的高保真3D模型

易模拥有五种建模模式(场景/主体/人脸/人像/器物),均为一键拍摄采样+AI建模模式。

用户可上传满足条件的照片组或视频进行建模,也可以直接使用易模拍摄实物进行建模。其中的器物模式可制作无底面的模型或者有底的全息3D模型,还有不同拍摄采样方法以满足不同场景下的文件需求、得到更高标准的三维模型。

易模生成的模型均是根据拍摄到的影像来生成的,AI所见,即为模型所得。模型1:1依托实物而生,颜色根据实拍获得,贴图分辨率根据影像数据决定,易模App真正做到实物尺寸可量测、实现真正意义的高保真。

团队基于视觉AI技术,将专业领域实景影像的图像精密解算过程(遥感测绘领域算法)跨界研发,开发智能算法,让手机用户可在手机端完成三维建模、模型编辑、模型分享、多格式导出,实现3D创作的普及化、便捷化、高效化。

说到高效,很多人关注建模时间。前文提到,Magic3D生成一只小青蛙需要大约40分钟,已经比之前的DreamFusion快2倍,而易模拍摄建模,保守地说,最快出模时间可在5分钟以内,复杂实物也可在20分钟内完成轻量化建模。 相比国外技术与带有技术限制的主机厂商建模方法,易模是国内自主研发的完整、快捷、轻量化的手机端建模应用,横跨Android与iOS系统,最重要的是,随着与不同领域的易模用户的深入交流,目前已经迭代出包括.obj/ .stl/ .3mf等在内的10余种三维文件的通用格式及细分行业常用格式,核心算法经历了多次优化后,易模的建模操作已经越发宽容,对零基础用户更加友好,更加接近目标——使其满足人们对3D扫描的各类想象。

纵然原生领域的AI建模还有很长的路要走,但是依托实景的AI建模已经在3D打印、工业设计、真人手办、元宇宙相关等各个领域迎来突出表现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/86136.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Go C编程 第1课 神奇的魔笔

慧通教育 慧通教育 1.画长方形(GoC测试题样例) 难度:1 登录 26.画7字(魔法学院第3课) 难度:1 登录 27.画2字(魔法学院第3课) 难度:1 登录 28.画十字(魔法学院第3课) 难度:1 登录 29.画旗帜(魔法学院第…

linux系统使用rsync做主备服务器文件同步

根据本文档设置,可以实现备机自动同步主机中的文件。 (注意,此方式缺陷为:如果主机文件修改,但是文件大小无变化或者文件变小时,无法自动同步到备机中,只有主机中文件修改后变大或者名称修改才能…

DP学生最喜欢/讨厌选学的IB课程是什么?

我们看看IBDP在读生们对于IBDP各学科的主观看法供正在选课的准IB学生们参考!(以下以第一人称方式,信息汇总于IB论坛,仅汇总部分科目,主观性强,仅供参考)DP学生最喜欢的IB课程 ● 数学 AA HL 被数…

Java基于springboot+vue+elementUI企业制度管理系统

本企业制度管理系统是针对目前企业制度管理的实际需求,从实际工作出发,对过去的企业制度管理系统存在的问题进行分析,完善用户的使用体会。采用计算机系统来管理信息,取代人工管理模式,查询便利,信息准确率…

如何从音频中提取伴奏?这篇文章告诉你如何提取伴奏

有没有小伙伴在制作视频后期的时候为配乐而烦恼过呢?我就有,之前想为一个视频配上音乐,就直接将歌曲导入视频里面,但出来的效果很是杂乱,导致视频的声音听起来非常嘈杂,影响到了听感和观感,但是…

.NET MAUI Community Toolkit 中的新增功能

对于 .NET MAUI Community Toolkit 来说,11月是一个繁忙的时期,它发布了多个版本,其中包含大量令人惊叹的新功能。最新版本具有新的视图、布局、Tizen 支持、.NET 7 支持等等。这篇文章带你快速了解所有新功能。 什么是 .NET Community Toolk…

Spring Security学习笔记

目录 1、简介 2、初步使用 3、简单实现自定义登录页面用户名和密码 1、简介 Spring Security是一个安全管理框架,主要功能是认证和授权,大中型项目用的比较多,小项目Shiro用的比较多,但是Spring Security比Shiro功能更强大&am…

Appium基础 — APPium基础操作API

目录 1、前置代码 2、安装和卸载APP 3、判断APP是否已安装 4、关闭app软件和关闭驱动对象 5、发送文件到手机和获取手机中的文件 6、获取当前屏幕内元素结构(重点) 7、脚本内启动其他app 8、将应用程序置于后台运行(重点)…

小雉系统4.0

项目地址 官网 飞天雉&&小雉视频系统 github https://github.com/feitianzhi/xiaozhios gitee xiaozhios: “小雉系统”并非是开发操作系统,而是一套服务于软件供应商的产品升级方案; QQ交流群:869598376 小雉系统简介 “小雉系统”并非是开发操作系统,而…

SpringCloud项目实例--服务通讯基础API方法

Spring Cloud Alibaba提供的组件如下: Sentinel:阿里巴巴开源产品,不仅仅可以作为断路器,也支持流量控制和服务降级。 Nacos:阿里巴巴开源产品,服务注册与服务发现,同时也可以作为配置中心。 R…

21 【styled-components的使用】

21 【styled-components的使用】 1.为什么要用这个 我们都知道,我们从最开始学css的时候,为了避免写的样式影响到另外的地方。所以我们这样来写的。 #userConten .userBtn button{font-size: 18px; }首先给一个元素写了一个唯一id | class&#xff0c…

自动化测试流程:Python编写执行测试用例及定时自动发送最新测试报告邮件(最完整的)

今天笔者就要归纳总结下一整套测试流程,从无到有,实现零突破,包括如何编写测试用例,定时执行测试用例,查找最新生成的测试报告文件,自动发送最新测试报告邮件,一整套完整的测试流程。以后各位只…

Spring Boot使用EasyExcel导入导出Excel

一、导入依赖 <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.1.6</version></dependency> 二、实现导出excel操作 1、对我们需要导出的实体类上加上注解&#xff0c;如下&#…

(二)字符函数和字符串函数详细讲解和模拟实现(优化)

✨✨✨✨✨✨✨✨✨&#x1f4d7;字符串查找函数&#xff1a;1.strstr函数2.strtok函数&#x1f4d4;错误信息报告函数&#xff1a;1.strerror函数&#x1f4d3;内存操作函数1.memcpy函数2.memmove函数3.memset函数4.memcmp函数❤️字符函数讲解&#x1f4d2;字符分类函数&…

Spring Cloud Alibaba整合Sentinel,使用nacos持久化流控规则

一、引入依赖 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId></dependency><dependency><groupId>com.alibaba.cloud</groupId><artifac…

小程序开发有什么快捷、低成本的方法?

2022年1月17日&#xff0c;阿拉丁研究院在《2021 年度小程序互联网发展白皮书》中提到&#xff0c;微信小程序开发者突破 300 万&#xff0c;DAU 超过 4.5 亿&#xff0c;正成为人们生活的 “标配”。 作为用户&#xff0c;我们几乎时时刻刻都享受着互联网带来的便利&#xff…

JMeter5.5入门到实战:HTTP+TCP+响应断言+自定义拓展+返回值获取

前言 众所周知JMeter是业内公认的性能测试工具&#xff0c;功能十分强大且易于拓展&#xff0c;但是入门有一定门槛&#xff0c;需要明白一些基本概念。本文使用了HTTP取样器、TCP取样器、响应断言、JSON提取器等组件&#xff0c;对公司现存的登录流程进行了测试。公司的产品包…

Java中hashmap底层Hash冲突是什么?以及如何解决Hash冲突 【杭州多测师_王sir】【杭州多测师】...

一、hashMap的底层实现hashmap的底层结构在jdk1.7之前是数组链表&#xff0c;但是在jdk1.8以后&#xff0c;其变成了数组链表红黑树&#xff0c;这个操作会加快在链表时候的查询速度。当链表的长度大于8 的时候&#xff0c;链表就会变为红黑树&#xff0c;而当长度小于6的时候&…

培训机构的存在对 IT 行业产生了哪些影响

这个标题我一看&#xff0c;应该就会引发一波口水、键盘要遭罪啦。。。做为从业十余年&#xff0c;培训行业从事也已经快7年了。 在正厚软件从一开始到今天。从讲师到教学和团队的协作、校区运营&#xff0c;从行业小白到对整体机构的运营和团队&#xff0c;有些许经验谈下个人…

测试4年裸辞失业,面试17k的测试岗被按在地上摩擦,结局让我崩溃大哭....

作为IT行业的大热岗位——软件测试&#xff0c;只要你付出了&#xff0c;就会有回报。说它作为IT热门岗位之一是完全不虚的。可能很多人回说软件测试是吃青春饭的&#xff0c;但放眼望去&#xff0c;哪个工作不是这样的呢&#xff1f;会有哪家公司愿意养一些闲人呢&#xff1f;…