AAAI‘25 今日截稿!SD 核心成员开源比 Midjourney 还强的文生图模型,现已提供一键启动

news2024/12/23 23:25:39

Midjourney 真的不香了!继 Stable Diffusion 3 于 6 月开源后,Stability AI 前核心成员 Robin Rombach 带领着新团队在本月初推出了 FLUX.1 图像生成模型家族。官方声称 FLUX.1 在多个关键指标上超越了 Midjourney v6.0 和 DALL·E 3 等文生图的头部模型,还是开源的。说的这么强,你是不是也摩拳擦掌了呢?

hyper.ai 官网现已在教程板块上线了「FLUX.1-schnell 文生图 Demo」, 一键克隆即可开玩,下拉文章获取链接~

8 月 12 日-8 月 16 日,hyper.ai 官网更新速览:

  • 优质教程精选:3 个

  • 优质公共数据集:10 个

  • 社区文章精选:4 篇

  • 热门百科词条:5 条

  • 8 月截稿顶会:2 个

访问官网:hyper.ai

公共教程精选

1. FLUX.1-schnell 文生图 Demo

FLUX.1 是一个 120 亿个参数的大模型,能够从文本描述中生成图像,在即时跟踪、视觉质量、图像细节和输出多样性方面都达到了最先进的水平。该教程使用的是 FLUX.1 [schnell] 版本模型,模型与环境部署完毕,大家可根据教程指引直接使用大模型进行推理生成。

直接使用:https://go.hyper.ai/peksE

2. 在线教程 | 仅需 1 张图片即可生成完整绘画过程,Lvmin Zhang 新作 Paints-Undo 上线!

ControlNet 作者张吕敏 (Lvmin Zhang) 开发了名为 Paints-Undo 的新项目,能够快速拆解任意图像的绘画过程,帮助初学者更好地理解不同风格图像的绘画技巧。HyperAI超神经现已上线了「Paints-Undo 一张图生成绘画全过程 Demo」,该教程为大家搭建好了环境,无需输入任何命令,一键克隆即可启动!

直接使用:https://go.hyper.ai/EwBE0

3. 一键部署浦科化学大模型 ChemLLM-7B-chat Demo

ChemLLM-7B-Chat 是上海人工智能实验室(上海 AI 实验室)于 2024 年开源的首个用于化学和分子科学的开源大型语言模型「浦科化学 (ChemLLM)」。该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

直接使用:https://go.hyper.ai/X8V9z

公共数据集精选

1. ChemData 化学任务数据集

该数据集是由上海人工智能实验室与其发布的首个科学大模型浦科化学大模型 (ChemLLM) 一同开源的,主要包含了 9 项化学核心任务,730K 个高质量问答的大语言模型化学能力指令微调数据集。

直接使用:https://go.hyper.ai/94tF1

2. ChemBench4K 化学能力评测基准数据集

该数据集是由关于化学分子和反应的 9 个任务组成,包含 4,100 个多项选择题,该基准为客观衡量大语言模型的化学水平奠定了基础。

直接使用:https://go.hyper.ai/itsdU

3. BRIGHT 文本检索基准数据集

该数据集从不同领域(StackExchange 、 LeetCode 和数学竞赛)收集了 1,385 个真实查询,这些查询全部来自真实的人工数据。BRIGHT 数据集专门设计用来检索系统是否能够识别这种深层次的逻辑关系,并找到相关的学术文章或报告。

直接使用:https://go.hyper.ai/s735d

4. Multimodal ArXiv 科学理解数据集

Multimodal ArXiv 由 ArXivCap 和 ArXivQA 组成,以增强 LVLM 的科学理解能力。ArXivCap 是一个图形标题数据集,包含 640 万张图像和 390 万条标题。ArXivQA 是一个通过提示基于科学图形的 GPT-4V 生成的问答数据集。相关成果已被 ACL 2024 接受。

直接使用:https://go.hyper.ai/n64Jh

5. SPIQA 多模态科学论文问答数据集

这是首个专门设计用于解释计算机科学各个领域科学研究文章中复杂图形和表格的大型 QA 数据集,包含 270K 个问题,分为训练、验证和 3 个不同的评估部分。通过对 12 个著名的基础模型进行大量实验,团队评估了当前多模态系统理解研究文章细微方面的能力。

直接使用:https://go.hyper.ai/qd7I2

6. MMEvaIPro 多模态基准评估数据集

MMEvalPro 通过增加两个「锚」问题(1 个感知问题和 1 个知识问题)来改进现有的评估方法,形成测试模型多模态理解不同方面的「问题三元组」。最终的基准包含 2,138 个问题三元组,总共 6,414 个不同的问题,涵盖不同主题和难度级别。

直接使用:https://go.hyper.ai/Hw8JA

7. PubMedVision 大规模医学 VQA 数据集

PubMedVision 是一个大规模且高质量的医疗多模态数据集,研究团队通过精细的数据处理方法,从 PubMed 国际医学期刊的论文中筛选出与医疗相关的图片及有信息量的图片描述,有效过滤了大量医疗无关的图片和上下文不相关内容。
直接使用:https://go.hyper.ai/Uy8XM

8. Multi modal Self instruct 多模态基准数据集

该数据集共包含 11,193 个带有相关问题的抽象图像,涵盖了仪表板、路线图、图表、表格、流程图、关系图、视觉谜题和 2D 平面图等 8 大类别,此外还有额外的 62,476 条数据用于微调模型。

直接使用:https://go.hyper.ai/FwGuz

9. Assetto Corsa Gym 大规模自动驾驶赛车模拟基准

该数据集收集了 6,400 万步的赛车驾驶数据,其中 230 万步来自不同驾驶水平的人类驾驶员,其余来自 Soft Actor-Critic (SAC) 策略。

直接使用:https://go.hyper.ai/6tfuM

10. MiraData:具有长时长和结构化字幕的大规模视频数据集

MiraData 专注于 1 至 2 分钟的未剪辑视频片段(平均时长 72.1 秒),每个视频都配有不同角度的结构化描述,描述平均长度为 318 个字,确保了视频内容的全面呈现。该数据集为长视频生成、视频内容理解与生成领域的研究者提供了宝贵的资源和新的挑战机遇。

直接使用:https://go.hyper.ai/2LmEJ

更多公共数据集,请访问:

https://hyper.ai/datasets

社区文章精选

1. ACL 2024 公布 7 篇最佳论文,华中科技大学本科生一作成果获奖

8 月 14 日,ACL 2024 的各类奖项逐一揭晓,共有 7 篇成果荣获 Best Paper,华中科技大学、阿德莱德大学、安阳师范学院、华南理工大学共同发表的「Deciphering Oracle Bone Language with Diffusion Models」获奖,HyperAI超神经为大家带来了详细解读。

查看完整报道:https://go.hyper.ai/t5Zon

2. 麻省理工/ CETI 团队用机器学习技术分离出抹香鲸发音字母表!高度类似人类语言系统,信息承载能力更强!

近期,麻省理工学院 Pratyusha Sharma 以及 CETI 的研究者使用机器学习对抹香鲸的录音进行了分析,证实了抹香鲸发出的声音具有结构性,由不同特征组合形成,并且分离出了抹香鲸发音字母表,与人类语言表达系统高度类似。本文是对研究论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/nA23S

3.国产光芯片重大突破!清华团队利用神经网络,首创全前向智能光计算训练架构

近期,清华大学戴琼海院士、方璐教授研究团队抓住了光子传播具有对称性这一特性,将神经网络训练中的前向与反向传播都等效为光的前向传播,开发出了一种全前向模式学习的方法。本文是对研究论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/lxNhj

4. 材料探索新纪元!清华大学徐勇、段文晖团队发布神经网络密度泛函框架,打开物质电子结构预测的黑箱!

为了将神经网络算法和 DFT 算法更有机地结合起来,清华大学徐勇、段文晖课题组提出了神经网络密度泛函理论 (neural-network DFT) 框架。该框架统一了神经网络中损失函数的最小化与密度泛函理论中的能量泛函优化,相比传统的有监督学习方法,具有更高的准确性和效率,为发展深度学习 DFT 方法开辟了一条新的途径。本文是对研究论文的详细解读与分享。
查看完整报道:https://go.hyper.ai/oE7nH

热门百科词条精选

1. 配对 t 检验 Paired t-Test

2. 倒数排序融合 RRF

3. 帕累托前沿 Pareto Front

4. 大规模多任务语言理解 MMLU

5. 数据增强 Data Augmentation

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1300+ 公开数据集提供国内加速下载节点

  • 收录 400+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2044659.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VMware Workstation Pro 安装 Ubuntu Server

这里写目录标题 VMware Workstation Pro 安装 Ubuntu Server1. 启动选项2. 系统语言3. 安装程序升级4. 键盘配置5. 安装类型6. 网卡配置7. 代理配置8. 系统镜像配置9. 硬盘配置10. 账户配置11. Ubuntu Pro 版本12. SSH 服务13. 推荐软件14. 安装成功15. 第一次重启报错16. 登录…

JavaScript调试:console 命令的使用

1、console 命令介绍 console 对象用于 JavaScript 调试。JavaScript 原生中默认是没有 console 对象,这是宿主对象(也就是浏览器)提供的内置对象。 用于访问调试控制台,在不同的浏览器里效果可能不同。 console 对象常见的两个用途&#x…

【计算机操作系统】覆盖与交换

覆盖与交换 覆盖与交换是实现内存空间扩充的技术,虚拟存储技术后续会详细讲解 覆盖技术 为了解决程序大小超过物理内存总和的问题引入了覆盖技术 覆盖技术的思想: 将程序分为多个段(多个模块),常用的段常驻内存&…

Go Kafka 操作详解

Go Kafka 操作详解 引言 Apache Kafka 是一个分布式流处理平台,广泛应用于构建实时数据管道和流应用程序。在 Go 语言中,使用 github.com/IBM/sarama 库可以方便地与 Kafka 进行交互。本文将详细介绍如何使用 Sarama 库在 Go 中实现 Kafka 的生产者和消…

等保测评中的安全需求分析:构建精准的信息安全防护体系

在数字化转型的时代背景下,信息安全成为企业发展的关键因素之一。等保测评,作为我国信息安全等级保护制度的重要组成部分,要求企业进行详细的安全需求分析,以构建精准、有效的信息安全防护体系。本文旨在探讨等保测评中的安全需求…

基于SpringBoot+VUE的在线视频教育平台(源码+文档+部署

主要内容:Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、单片机开发、物联网设计与开发设计、简历模板、学习资料、面试题库、技术互助、就业指导等 业务范围:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写…

TQX310光口自环检测

本历程实现X310的光口自环测试,以及查看眼图。需要准备板卡以及好烧写的文件,文件在文档末尾的连接中提供。 X310连接好JTAG与电源线,在MGT x4口插入光口自环模块,并开机。 打开vivado,打开硬件管理器,会识…

Kubernetes—k8s集群存储卷(pvc存储卷)

目录 一、PVC 和 PV 1.PV 2.PVC 3.StorageClass 4.PV和PVC的生命周期 二、实操 1.创建静态pv 1.配置nfs 2.创建pv 3.创建pvc 4.结合pod,将pv、pvc一起运行 2.创建动态pv 1.上传 2.创建 Service Account,用来管理 NFS Provisioner 在 k8s …

Harmony OS 后台任务-代理提醒

三、代理提醒 传送门 1.什么是代理提醒 应用退到后台或进程终止后,仍然有一些提醒用户的定时类任务,例如购物类应用抢购提醒等,为满足此类功能场景,系统提供了代理提醒(reminderAgentManager)的能力。当…

Linux系统使用Typecho搭建个人网站并一键发布公网远程管理本地站点

文章目录 前言1. 安装环境2. 下载Typecho3. 创建站点4. 访问Typecho5. 安装cpolar6. 远程访问Typecho7. 固定远程访问地址8. 配置typecho 💡 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大…

Python 数据可视化,怎么选出合适数据的图表

数据可视化最佳实践 1. 引言:为什么数据可视化最佳实践很重要 数据可视化是数据分析和决策过程中不可或缺的一部分。通过有效的可视化,复杂的数据可以转化为易于理解的信息,从而帮助观众快速做出正确的判断。然而,糟糕的可视化可…

Qt-认识tT(1)

目录 QT是做什么的? 什么是QT GUI开发的各种技术方案 QT支持的平台 Qt的版本和优点 开发工具概述 Qt是做什么的? Qt是用来干嘛的? 什么是Qt Qt是⼀个跨平台的C图形用户界⾯应用程序框架。它为应用程序开发者提供了建立艺术级图形界⾯所…

Vue3+Ts封装类似el-drawer的抽屉组件

提供9个字段对drawer组件进行控制: modelValue: 对抽屉显示隐藏进行控制, width: 控制抽屉的宽度, title: 控制抽屉的标题, appendToBody: 是否将抽屉添加至body, closeOnClickModal: 是否点击遮罩层关闭抽屉, showConfirm: 是否显示确认按钮, showCancel: 是…

Linux网络:基于OS的网络架构

Linux网络:OS视角下的网络架构 网络分层模型OSI 七层模型TCP/IP 五层模型 协议操作系统与网络网络相关命令ifconfigpingnetstat 本博客将基于操作系统,讲解计算机网络的设计理念,帮助大家理解操作系统与网络之间的关系。 网络分层模型 网络…

DIAdem 与 LabVIEW

DIAdem 和 LabVIEW 都是 NI (National Instruments) 公司开发的产品,尽管它们有不同的核心功能和用途,但它们在工程、测试和测量领域中常常一起使用,以形成一个完整的数据采集、分析、处理和报告生成的解决方案。 1. 功能和用途 LabVIEW (Lab…

杭州造价信息_杭州造价信息网建设工程材料信息价

杭州造价信息,全称为《杭州造价信息》,简称为“杭州市信息价”或“杭州市建材信息价”,是杭州市建设工程主管部门发布的建筑建材市场指导价,也是杭州市建筑工程项目招标与结算的建材价格标准。这一信息由杭州市住建局或共享建材汇…

【深度学习基础】关于卷积神经网络你了解多少?

文章目录 卷积稀疏交互参数共享池化层全连接层转置卷积空洞卷积卷积神经网络与全连接神经网络 本篇博客主要是讲解一些本人对于卷积的理解,包括: 为什么会出现卷积操作?最基本的卷积操作?卷积的优缺点。空洞卷积等等。卷积操作牵扯…

启明智显借 AI 之翼重塑人机交互,强劲赋能智能硬件升级腾飞

在科技日新月异的今天,启明智显作为人机交互(HMI)与物联网人工智能(AIoT)硬件领域的领航者,正以前所未有的决心和行动力,推动着智能硬件行业的深刻变革。公司不仅致力于将最先进的人工智能技术融…

Java 中高级面试题:16题

1. Java 中有哪些不同类型的线程优先级?JVM 分配的线程默认优先级是多少? 线程优先级是这样的概念:每个线程都有一个优先级,用外行人的语言来说,可以说每个对象都有优先级,用 1 到 10 之间的数字表示。Jav…

Openleyer 获取features样式

目录 一、需求说明: 二、业务功能分析: 三、地图点击事件 四、地图要素select事件 五、地图双击事件 六、移动到地图点事件 一、需求说明: 若聚合情况下,点击聚合要素,若只有一个要素,则显示详情信息…