微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向

news2025/1/14 22:20:12

去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框架 TRELLIS,加入 3D 资产生成领域的竞争中。TRELLIS 支持多格式输出,包括辐射场、3D 高斯和网格,为不同需求提供最大灵活性。

两个模型现均已上线 hyper.ai 超神经官网,快来试试哪个更胜一筹吧~

在线使用 Hunyuan3D:https://go.hyper.ai/Rsrno

在线使用 TRELLIS:https://go.hyper.ai/JE5s5

1 月 6 日-1 月 11 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:6 个

  • 社区文章精选:8 篇

  • 热门百科词条:5 条

  • 1 月截稿顶会:7 个

访问官网:hyper.ai

公共数据集精选

1. VSI-Bench 视觉空间智能基准测试集

该数据集包含超过 5k 个问题-答案对,覆盖近 290 个真实室内场景视频,涉及住宅、办公室和工厂等多种环境,涵盖了物体识别、位置关系、动作预测等多个方面的问题。

直接使用:https://go.hyper.ai/q0DYA

在这里插入图片描述

VSI-Bench 的任务演示

2. Facial Feature Extraction Dataset 面部特征提取数据集

该数据集是一个包含 750 张图像的标记数据集,用于检测脸部的眉毛、眼睛、鼻子、嘴唇、胡须区域。数据标记过程在 Roboflow 中执行,以 YOLOv8 格式从导出。

直接使用:https://go.hyper.ai/O3kER

在这里插入图片描述

数据集示例

3. Sentiment and Emotion Analysis Dataset 情感情绪分析数据集

该数据集包含 422,000 个情绪分析句子,和 3,309 个情感分析句子作为补充。情绪分析标记有 6 种不同情绪:喜悦、悲伤、愤怒、恐惧、喜爱和惊讶。

直接使用:https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data 数学编程问题训练数据集

该数据集是一个专门用于强化学习训练的高质量数据集,主要应用于数学和编程问题的解决,包含了约 455k 个数学问题和 27k 个编程问题。

直接使用:https://go.hyper.ai/Wdo1k

5. Medical o1 Reasoning SFT 医学推理数据集

该数据集专为微调 HuatuoGPT-o1 这一医学大语言模型而设计,旨在提升其在复杂医学推理任务中的表现。数据集的构建依赖于 GPT-4o,通过搜索可验证的医学问题并利用医学验证器进行答案验证,确保了数据的准确性和可靠性。

直接使用:https://go.hyper.ai/XMtXp

6. MCTS 中文文本简化数据集

该数据集包含 723 条基于 Penn Chinese Treebank (CTB) 的标准、选自新闻语料的复杂结构句子,并且每一句都配有多个人工简化的版本,从而成为中文文本简化任务上规模最大、参考最多的评估数据集。

直接使用:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm 教育领域对话数据集

该数据集包含了 400 万个数据点,包含了多样化的教育垂直领域数据,如开放问答、作文批改、启发式教学、情感支持和课程辅导等。

直接使用:https://go.hyper.ai/nQw0K

8. GOAT 算数任务微调数据集

此数据集有 dataset.json 和 dataset.ipynb 两个文件。dataset.json 文件包含约 170 万个由 dataset.ipynb 生成的、用于算术任务的合成数据。

直接使用:https://go.hyper.ai/8ZAvG

9. NaturalProofs 数学推理数据集

该数据集是一个用于研究自然语言中数学推理的多领域语料库,它包含了大约 30k 个定理陈述和证明、15k 个定义以及 2k 个额外页面(例如公理、推论),这些内容都是用自然数学语言编写的。

直接使用:https://go.hyper.ai/Bk4WE

10. TransGPT-pt&sft 交通对话预训练数据集

该数据集为国内首款综合交通大模型 TransGPT 的一部分,包含约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。

直接使用:https://go.hyper.ai/vuDHa

公共教程精选

1. Hunyuan3D:仅需 10 秒生成 3D 资产

Hunyuan3D 是 3D 生成扩散模型模型,包括一个轻量版和一个标准版,均支持从文本和图像输入生成高质量的 3D 资产。经过定性和定量的多维度评估,Hunyuan3D-1.0 在几何细节、纹理细节、纹理-几何一致性、 3D 合理性、指令遵循等方面的表现都非常出色。

本教程是 Hunyuan3D 轻量版,点击下方链接,按照教程指引即可体验 3D 模型生成。

在线运行:https://go.hyper.ai/Rsrno

在这里插入图片描述

效果示例

2. TRELLIS:微软开源的 3D 资产生成模型 Demo

TRELLIS 是微软 (Microsoft) 团队于 2024 年开发的一个基于图神经网络的可解释性框架,旨在通过学习图结构数据的特征,提供高效的模型可解释性。

该模型与环境已经部署完毕,根据教程指引即可使用大模型进行图像转 3D 影像。

在线运行:https://go.hyper.ai/JE5s5

在这里插入图片描述

效果示例

3.快速部署 ChatGLM2-6b-32k

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于通用语言模型 (GLM) 架构,拥有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地(INT4 量化)等级下最低只需 6 GB 显存)。

按照教程步骤操作,直接复制生成的 API 地址,即可使用 ChatGLM-6B。

在线运行:https://go.hyper.ai/B0b7V

在这里插入图片描述

模型 web 界面

4. 使用 NLTK 进行自然语言处理

NLTK 是使用自然语言数据创建 Python 程序的最流行的平台之一。除了用于分类、标记化、词干、标记、解析和语义推理的文本处理库以外,它还为 50 多个大型结构化文本数据集(语料库)和词汇资源提供了简单的接口。

本教程将介绍如何使用 NLTK 在文本处理阶段进行各种 NLP 操作,并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。

在线运行:https://go.hyper.ai/BFZ10

在这里插入图片描述

词频分布示例

5. Audio LDM 音频编辑教程

AudioLDM 是一种潜在的文本到音频扩散模型,能够在给定任何文本输入的情况下生成真实的音频样本。AudioLDM 将文本提示作为输入并预测相应的音频。它可以生成文本条件音效、人类语音和音乐。

该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,点击下方链接即可编辑音频。

在线运行:https://go.hyper.ai/BCOWL

6. ShowUI:专注 GUI 自动化的视觉-语言-动作模型

ShowUI 模型通过理解屏幕界面的内容,并执行如点击、输入、滚动等交互动作,支持网页和手机应用场景,能够自动完成复杂的用户界面任务。ShowUI 能够解析屏幕截图和用户指令,进而预测出界面上的交互动作。

该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行体验。

在线运行:https://go.hyper.ai/reHs7

在这里插入图片描述

模型 web 界面

💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们添加神经星星微信(微信号:Hyperai01)备注【SD教程】,入群探讨各类技术问题、分享应用效果~

社区文章精选

1. 10大圣诞数据集汇总:热门歌曲/礼物愿望清单/菜谱/10年间圣诞推特文案……

圣诞节期间,HyperAI超神经为大家准备了 10 个圣诞节相关的数据集,支持在线使用与加速下载,快来体验吧。

查看数据集汇总:https://go.hyper.ai/if7Lc

2. 成本下降 100 倍!非营利组织 E11 Bio 新成果,绘制大脑数百万细胞连接关系

生物科技公司 E11 Bio 推出 PRISM 技术,能够以极低成本绘制整个大脑中数百万个细胞的连接关系,这一系列创新使得全脑连接组学的整体成本预计下降至少 100 倍,为未来探索人类大脑提供了可能。本文是对该企业的详细报道,点击速看。

查看完整报道:https://go.hyper.ai/ISc4j

3. 多国政策/科研突破/先锋人物/企业布局……一文看尽 2024 年 AI4S 行业大事

HyperAI超神经为大家梳理盘点了 2024 年 AI for Science 领域的高影响力事件。点击查看详细报道。

查看完整报道:https://go.hyper.ai/d2Dlv

4. 全球变暖难逆转,斯坦福团队用 AI 预测最高温变化,破纪录可能性达 90%

在全球持续变暖等大背景下,罕见的极端气候事件开始频发。斯坦福大学、科罗拉多州立大学与苏黎世联邦理工学院的研究团队,通过将人工智能卷积神经网络系统用于全球变暖预测,发现即便我们能够实现快速减排,全球气温仍有 90% 的可能性持续升高。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/vDt3e

5. 模拟人类反应式抓取过程,普渡大学团队实现机器人学习的数据高效触觉表征

普渡大学三年级博士生徐政通以「面向机器人学习的数据高效触觉表征」为题,向大家分享了反应式抓取控制器 LeTac-MPC 和用于机器人统一触觉表示的 UniT 两大科研成果。本文是对分享内容的整理汇总,点击速看。

查看完整报道:https://go.hyper.ai/IPIjj

6. 五战蛋白质结构预测风向标 CASP,南开大学郑伟:竞争性与难度提升,关注实际生物问题

CASP 一直以来被行业看作是蛋白质结构预测的风向标。 在此背景下,HyperAI超神经有幸与郑伟教授进行了一次深度访谈,透过具有行业风向标意义的国际大赛 CASP,他为我们剖析了当下蛋白质结构预测领域的发展趋势。干货满满,点击速看。

查看完整报道:https://go.hyper.ai/Y83iz

7. 坚守 30 年,麻省理工学院瞄定下一代锂电池,用生成式 AI 实现固态电解质重大突破

麻省理工学院和丰田研究所的研究团队在一项最新研究中深入研究了不同先进生成式模型在聚合物生成中的复杂性,并提出了一种可以持续生成和评估新的基于 GPT 和扩散模型的聚合物电解质的从头设计方法,为实验检验提供了新的候选物。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/PDc8J

8. 刚刚!世界最快GPU RTX 5090官宣售价超1.4万元,国行阉割版5090 D定价超1.6万元

在 CES 2025 大会上,英伟达 RTX 5090 正式官宣,是迄今为止速度最快的 GeForce RTX GPU,首发价 1.4 万元,国行版 5090 D 售价 1.6 万元。RTX 5090 还增加了 FP4 支持,与上一代产品相比,内存占用空间更小,运行生成式 AI 模型的速度提高了 2 倍。本文是对该产品的详细介绍,点击速看。

查看完整报道:https://go.hyper.ai/dyyZS

热门百科词条精选

  1. 核范数 Nuclear Norm

  2. 配对 t 检验 Paired t-Test

  3. 大规模多任务语言理解 MMLU

  4. Sigmoid 函数 Sigmoid function

  5. 最小二乘法 The least square method

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

1 月截稿顶会

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1700+ 公开数据集提供国内加速下载节点

  • 收录 500+ 经典及流行在线教程

  • 解读 200+ AI4Science 论文案例

  • 支持 600+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2276673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【爬虫】单个网站链接爬取文献数据:标题、摘要、作者等信息

源码链接: https://github.com/Niceeggplant/Single—Site-Crawler.git 一、项目概述 从指定网页中提取文章关键信息的工具。通过输入文章的 URL,程序将自动抓取网页内容 二、技术选型与原理 requests 库:这是 Python 中用于发送 HTTP 请求…

设计模式-结构型-组合模式

1. 什么是组合模式? 组合模式(Composite Pattern) 是一种结构型设计模式,它允许将对象组合成树形结构来表示“部分-整体”的层次结构。组合模式使得客户端对单个对象和组合对象的使用具有一致性。换句话说,组合模式允…

js:正则表达式

目录 正则表达式的语法 定义 检测 检索 元字符 边界符 量词 字符类 表单判断案例 修饰符 过滤敏感词 正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本字符组合模式 正则表达式是一…

PHP数据过滤函数详解:filter_var、filter_input、filter_has_var等函数的数据过滤技巧

PHP数据过滤函数详解:filter_var、filter_input、filter_has_var等函数的数据过滤技巧,需要具体代码示例 在 Web 开发中,数据过滤是非常重要的一环。过滤用户输入的数据可以保护我们的应用程序免受潜在的安全威胁。PHP 提供了一系列强大的数…

QT跨平台应用程序开发框架(1)—— 环境搭建

目录 一,关于QT 二,关于应用程序框架 三,环境搭建 3.1 预备 3.2 下载Qt SDK 3.3 安装Qt SDK 3.4 配置环境变量 3.5 认识一些重要工具 四,Qt Creator 的基本使用 4.1 创建项目 4.2 代码解释 一,关于QT 互联网…

【MySQL】基础架构分析

考察频率难度40%⭐⭐⭐⭐ 这道题在面试时的出现频率其实并不高,最起码对于笔者来说是没有遇到过。那为什么还是选择把这个问题作为 MySQL 八股文系列的第一个呢?其实原因也挺简单的,还是老规矩,先通过一个问题把整个知识框架来一…

【华为云开发者学堂】基于华为云 CodeArts CCE 开发微服务电商平台

实验目的 通过完成本实验,在 CodeArts 平台完成基于微服务的应用开发,构建和部署。 ● 理解微服务应用架构和微服务模块组件 ● 掌握 CCE 平台创建基于公共镜像的应用的操作 ● 掌握 CodeArts 平台编译构建微服务应用的操作 ● 掌握 CodeArts 平台部署微…

Elasticsearch ES|QL 地理空间索引加入纽约犯罪地图

可以根据地理空间数据连接两个索引。在本教程中,我将向你展示如何通过混合邻里多边形和 GPS 犯罪事件坐标来创建纽约市的犯罪地图。 安装 如果你还没有安装好自己的 Elasticsearch 及 Kibana 的话,请参考如下的链接来进行安装。 如何在 Linux&#xff0…

P10打卡——pytorch实现车牌识别

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者:K同学啊 1.检查GPU from torchvision.transforms import transforms from torch.utils.data import DataLoader from torchvision import datasets import torchvisio…

GitCode G-Star 光引计划终审前十名获奖项目公示

在技术的浩瀚星空中,GitCode 平台上的 G-Star 项目熠熠生辉。如今,“光引计划” 已圆满落幕,众多 G-Star 项目作者,一同分享项目在 GitCode 平台托管的宝贵体验,并深入挖掘平台的多样玩法。 众多投稿纷至沓来&#xf…

【pycharm】远程部署失败,查看日志

pycharm 远程部署失败,查看日志 远程一直失败,gateway超时会还知道拉取一份日志: 在./root 下 发现了崩溃日志,启动崩溃了,导致backend一直无法启动。win11就是一直在connect到ubuntu的后端pycharm。。gateway 拉取的日志 我上传的linux版本的pycharm暂时存在dist目录下,…

浅谈云计算02 | 云计算模式的演进

云计算计算模式的演进 一、云计算计算模式的起源追溯1.2 个人计算机与桌面计算 二、云计算计算模式的发展阶段2.1 效用计算的出现2.2 客户机/服务器模式2.3 集群计算2.4 服务计算2.5 分布式计算2.6 网格计算 三、云计算计算模式的成熟与多元化3.1 主流云计算服务模式的确立3.1.…

Vue 学习之旅:从基础到实践(vue快速上手+插值表达式+指令上)

Vue 学习之旅:从基础到实践 文章目录 Vue 学习之旅:从基础到实践一、Vue 简介二、创建 Vue 实例与插值表达式(一)创建 Vue 实例步骤(二)插值表达式 三、Vue 核心特性 - 响应式四、Vue 指令(一&a…

PMP–一、二、三模、冲刺–分类–7.成本管理

文章目录 技巧一模7.成本管理--4.控制成本--数据分析--挣值分析--进度绩效指数(SPI)是测量进度效率的一种指标,表示为挣值与计划价值之比,反映了项目团队完成工作的效率。 当 SPI小于 1.0 时,说明已完成的工作量未达到…

字符串 (算法十一)

简介 没有固定题型&#xff0c;内容很杂&#xff0c;可以学习下string接口与相关操作 1.最长公共前缀 link&#xff1a; 解法一&#xff1a;两两比较 code class Solution { public:string longestCommonPrefix(vector<string>& strs) {// 两两比较string ans …

摄像头模块在狩猎相机中的应用

摄像头模块是狩猎相机的核心组件&#xff0c;在狩猎相机中发挥着关键作用&#xff0c;以下是其主要应用&#xff1a; 图像与视频拍摄 高清成像&#xff1a;高像素的摄像头模块可确保狩猎相机拍摄出清晰的图像和视频&#xff0c;能够捕捉到动物的毛发纹理、行为细节及周围环境的…

给DevOps加点料:融入安全性的DevSecOps

从前&#xff0c;安全防护只是特定团队的责任&#xff0c;在开发的最后阶段才会介入。当开发周期长达数月、甚至数年时&#xff0c;这样做没什么问题&#xff1b;但是现在&#xff0c;这种做法现在已经行不通了。 采用 DevOps 可以有效推进快速频繁的开发周期&#xff08;有时…

沸点 | 聚焦嬴图Cloud V2.1:具备水平可扩展性+深度计算的云原生嬴图动力站!

近日&#xff0c;嬴图正式推出嬴图Cloud V2.1&#xff0c;此次发布专注于提供无与伦比的用户体验&#xff0c;包括具有水平可扩展性的嬴图Powerhouse的一键部署、具有灵活定制功能的管理控制台、VPC / 专用链接等&#xff0c;旨在满足用户不断变化需求的各项前沿功能&#xff0…

Mysql--架构篇--存储引擎InnoDB(内存结构,磁盘结构,存储结构,日志管理,锁机制,事务并发控制等)

MySQL是一个多存储引擎的数据库管理系统&#xff0c;支持多种不同的存储引擎。每种存储引擎都有其独特的特性、优势和适用场景。选择合适的存储引擎对于优化数据库性能、确保数据完整性和满足业务需求至关重要。 注&#xff1a;在同一个Mysql的数据库中&#xff0c;对于不同的表…

springboot高校电子图书馆的大数据平台规划与设计

Spring Boot高校电子图书馆的大数据平台规划与设计是一个综合性的项目&#xff0c;旨在利用现代信息技术提升高校电子图书馆的服务质量和管理效率。以下是对该项目的详细介绍&#xff1a; 一、背景与需求 随着高校教育信息化的不断推进&#xff0c;电子图书馆的资源和用户数量…