Llama 3.1中文微调数据集已上线,超大模型一键部署

news2024/9/21 4:39:03

7 月的 AI 圈真是卷完小模型卷大模型,精彩不停!大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型,但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大模型让很多小伙伴犯了难。

别担心!hyper.ai 官网在教程板块为大家提供了使用「Open WebUI」和使用「OpenAI 兼容 API 服务」两种方式启动这两个超大模型的教程! 此外,还上线了中文微调数据集 DPO-zh-en-emoji,下拉文章获取链接~

8 月 5 日-8 月 9 日,hyper.ai 官网更新速览:

  • 优质教程精选:5 个

  • 优质公共数据集:10 个

  • 社区文章精选:3 篇

  • 热门百科词条:5 条

  • 8 月截稿顶会:2 个

访问官网:hyper.ai

公共教程精选

1. 使用 Open WebUI 一键部署 Mistral Large 2 / Llama 3.1 405B

该教程是使用 OpenWebUI 一键部署 Mistral Large 2 / Llama 3.1 405B,相关环境和配置已经搭建完成,只需克隆启动容器即可进行推理体验。

在线运行 Mistral Large 2 模型部署:

https://go.hyper.ai/Bwf6G

在线运行 Llama 3.1 405B 模型部署:

https://go.hyper.ai/iyL60

2. 一键部署 Mistral Large 2 / Llama 3.1 405B 模型 OpenAI 兼容 API 服务

该教程为使用 OpenAI 兼容 API 部署 Mistral-Large-Instruct-2407-AWQ。「OpenAI 兼容 API」意味着第三方开发者可以使用与 OpenAI 相同的请求和响应格式,将类似的功能集成到自己的应用程序中。启动该教程后可以在任何 OpenAI 兼容的 SDK 对该模型进行连接。和上个教程相比更为复杂一些,适合有编程基础的

在线运行 Mistral Large 2 模型部署:

https://go.hyper.ai/Smexo

在线运行 Llama 3.1 405B 模型部署:

https://go.hyper.ai/1AiDi

3. 使用吉布斯扩散 (Gibbs-Diffusion) 进行图像盲降噪

GDiff 全称 Gibbs-Diffusion,是一种贝叶斯盲去噪方法,解决了信号和噪声参数的后验采样问题。该教程是根据论文「Listening to the Noise: Blind Denoising with Gibbs Diffusion」搭建的测试方法,按照教程步骤操作即可体验研究成果。

在线运行:https://go.hyper.ai/y2wIU

公共数据集精选

1. DPO-zh-en-emoji 表情符号问答数据集

该数据集是一个专为微调大语言模型而设计的数据集,包含了大量的问答对数据,每个问题都有中文和英文两个版本的答案,并且答案中融入了趣味幽默的元素,包括表情符号 (emoji) 的使用。shareAI 团队已将其用于微调 Llama 3.1 8B 模型。

直接使用:https://go.hyper.ai/Y90pZ

2. UrbanSARFloods v1 洪水制图基准数据集

UrbanSARFloods 是专门用于城市和开放区域洪水制图的数据集,包含 8,879 个 512×512 的图像块,覆盖 807,500 平方公里,涵盖了 18 次洪水事件。解决了现有的大规模 SAR 衍生洪水制图研究中对城市洪水关注不足的问题。

直接使用:https://go.hyper.ai/yOXx7

3. VRSBench 大规模高质量遥感视觉语言基准数据集

该数据集是一个为遥感图像理解设计的多用途视觉-语言基准数据集,包含 29,614 张经过人工验证的详细字幕图像、52,472 个对象引用和 123,221 个问答对,旨在推进通用的、大规模的遥感图像视觉-语言模型的发展。

直接使用:https://go.hyper.ai/O7DtC

4. ATLAS 高分辨率 3D 人物纹理数据集

该数据集全称 ArTicuLated humAn textureS(简称 ATLAS)是一个最大的高分辨率 (1,024 × 1,024) 3D 人物纹理数据集,包含了 5 万个具有文本描述的高保真纹理。相关论文成果已入选 ECCV 2024。

直接使用:https://go.hyper.ai/Zx1nj

5. MIND 微软新闻数据集

MIND 包含约 16 万篇英文新闻文章和 100 万用户生成的超过 1500 万条印象日志,收集自 Microsoft News 网站的匿名行为日志。旨在作为新闻推荐的基准数据集,并促进新闻推荐和推荐系统领域的研究。

直接使用:https://go.hyper.ai/lVOyX

6. BoWFire 火灾检测分割数据集

BoWFire 数据集是一个专门用于火焰检测的图像数据集,旨在提高火灾检测的准确性并减少误报。该数据集包括了多种紧急情况下的火灾图像,例如建筑物着火、工业火灾、车祸和骚乱等情况。

直接使用:https://go.hyper.ai/73AYY

7. CNN/DailyMail 新闻文章数据集

该数据集包含 CNN 和 Daily Mail 记者撰写的 30 多万篇新闻文章,旨在帮助开发能够用一两句话概括长段落文本的模型。

直接使用:https://go.hyper.ai/AbidL

8. Doodle Dataset 涂鸦图像数据集

该数据集包含 100 多万张图像,涵盖 340 个涂鸦类别,经过处理后可用于机器学习任务。

直接使用:https://go.hyper.ai/Ns4M4

9. Yoga-16 人体瑜伽动作图像数据集

Yoga-16 数据集旨在提高瑜伽姿势识别模型的分类准确率。它分为三个主要目录:训练、测试和验证,每个目录包含 16 个子目录,对应 16 种不同的瑜伽姿势。

直接使用:https://go.hyper.ai/iMe0Z

10. Human Images Dataset 男性和女性人体图像数据集

该数据集包含男性和女性两个人物类别图像文件夹。图像包括面部、上半身和全身。可用于性别识别、人类身份识别和图像分类等各种项目。

直接使用:https://go.hyper.ai/6UJb7

更多公共数据集,请访问:
https://hyper.ai/datasets

社区文章精选

1. 学术分享丨清华大学博士后李雨哲详解 Cell/Nature 子刊论文,探索基因组学的 AI 应用

「Meet AI4S」系列直播第二期,邀请到了清华大学张强锋实验室博士后李雨哲。8 月 21 日,李雨哲博士将以线上直播的形式进一步为大家分享空间转录组学和单细胞组学研究中的 AI 方法。

查看活动详情:https://go.hyper.ai/GIzpo

2. 全球首个!清华/上海交大等联合构建面向糖尿病诊疗的视觉-大语言模型,登 Nature 子刊

Google Research 联手麻省理工获得 IJCAI 2024 最佳论文奖!公众号后台回复 IJCAI 2024,获取 IJCAI 2024 最佳论文奖、杰出论文奖、AIJ 经典论文奖与杰出论文奖合集。

查看完整报道:https://go.hyper.ai/ZGzI2

3. 首次!GPT-2赋能无线通信物理层,北大团队提出基于预训练LLM的信道预测方案

清华大学副教务长、医学院主任黄天荫教授团队,上海交通大学电院计算机系/教育部人工智能重点实验室盛斌教授团队,上海交通大学医学院附属第六人民医院贾伟平教授及李华婷教授团队,新加坡国立大学及新加坡国家眼科中心覃宇宗教授团队通力合作,成功构建全球首个面向糖尿病诊疗的视觉-大语言模型集成系统 DeepDR-LLM 。本文是该研究的详细解读和分享。

查看完整报道:https://go.hyper.ai/qnzSp

热门百科词条精选

1. 交并比 IoU

2. 倒数排序融合 RRF

3. 对比学习 Contrastive Learning

4. 大规模多任务语言理解 MMLU

5. 长短期记忆 Long Short-Term Memory

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1300+ 公开数据集提供国内加速下载节点

  • 收录 400+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2033250.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从AGV到立库,物流自动化的更迭与未来

AGV叉车 随着柔性制造系统的广泛应用,小批量、多批次的生产需求不断增强,“订单导向”生产已经成为趋势。这也让越来越多的企业认识到,产线的智能设备导入只是第一步,要想达到生产效率的最优解,物流系统的再优化必须提…

【redis的大key问题】

在使用 Redis 的过程中,如果未能及时发现并处理 Big keys(下文称为“大Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。 本文将介绍大Key产生的原因、其可能引发的问题及如何快速找出大Key并将其优…

Z 字形遍历二叉树

假设一个二叉树上各结点的权值互不相同。 我们就可以通过其后序遍历和中序遍历来确定唯一二叉树。 请你输出该二叉树的 ZZ 字形遍历序列----也就是说,从根结点开始,逐层遍历,第一层从右到左遍历,第二层从左到右遍历,…

Linux文本处理shell脚本

文本处理 在进行文本处理时,我们有一些常见的需求: 获取文本的行数、字数比较两段文本的不同之处查看文本的开头几行和最后几行在文本中查找字符串在文本中替换字符串 下面介绍如何在 shell 中做到这些事情。 文本统计:wc wc 是文本统计…

了解经典的 MPLS L3VPN 网络架构

1.多协议标签交换技术MPLS的概念 MPLS(Multi-Protocol Label Switching,多协议标签交换技术),传统网络中就拥有了 3 种经典转发实现,它们分别是: L2 交换转发L2.5 标签转发L3 路由转发 MPLS 协议则作用于 L2.5 层&…

大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

布隆过滤器将应用Redis缓存使用量降低100倍

文章目录 背景布隆过滤器介绍定义工作原理数据结构: Redis布隆过滤器实战总结 背景 由于在业务中用到了Redis用于存储一些关系信息,且对应的请求量比较大,为了防止缓存击穿导致数据库压力过大,一般我们都会采用将不存在的内容存储…

头狼择校小程序

综述介绍 头狼择校,是头狼择™高校的简称,我们专注高校、大学的择校。倡导先嗅就业再择校,是预约工具和对话平台。帮您嗅招办、嗅教授、嗅学姐,预约择校有关的老师、顾问,助力考大学和考研的“双考”学生及家长了解就…

C# OnnxRuntime部署LivePortrait实现快速、高质量的人像驱动视频生成

目录 效果 说明 项目 模型信息 代码 下载 效果 LivePortrait实现快速、高质量的人像驱动视频生成 说明 官网地址:https://github.com/KwaiVGI/LivePortrait 代码实现参考:https://github.com/hpc203/liveportrait-onnxrun 模型下载:…

【健康革命】让AI成为你的私人健身教练!

本文由 ChatMoney团队出品 现在市面上有很多男生和女生为了保持身材都进行疯狂的减肥,有些是靠吃减肥药来保持身材,有些是晚上不吃饭要控制,还有些疯狂且漫无目的健身;但往往以上几种都很伤身体的,毕竟身体健康是革命的…

历史库,成本与性能如何兼得?| OceanBase应用实践

随着数据量的迅猛增长,企业和组织在数据库管理方面遭遇的挑战愈发凸显。数据库性能逐渐下滑、存储成本节节攀升,以及数据运维复杂性的增加,这些挑战使得DBA和开发者在数据管理上面临更大的压力。 为了应对这些挑战,对数据生命周期…

简单的docker学习 第13章 CI/CD与Jenkins(下)

第13章 CI/CD 与 Jenkins 13.13 自由风格的 CI 操作(最终架构) 前面的架构存在的问题是,若有多个目标服务器都需要使用该镜像,那么每个目标服务器都需要在本地构建镜像,形成系统资源浪费。若能够在 Jenkins 中将镜像相撞构建好并推送到 Har…

Java属性重写问题

目录 属性重写 案例演示 多态练习 练习1 练习2 属性重写 ​​​​​​​ 属性没有重写之说,属性的值看编译类型。 instanceOf 比较操作符,用于判断对象的运行类型是否为某类型或者某类型的子类。 案例演示 父类base,有一个count属…

Collection和List集合

1.Collection集合 1.1数组和集合的区别【理解】 相同点 都是容器,可以存储多个数据 不同点 数组的长度是不可变的,集合的长度是可变的 数组可以存基本数据类型和引用数据类型 集合只能存引用数据类型,如果要存基本数据类型,需要存对应的包装类 1.2集合类体系结构【理解】 …

旧手机拍摄的视频模糊可以修复清晰吗?

你是否时常“考古”一些老电影、老动漫来回忆旧日时光?你是否也有一些珍贵的录像,带你重温过去的美好?然而,我们已经习惯了高清体验,回头再看曾经的旧影像,画质或许“渣”的让人不忍直视。 旧手机像素不好&…

【论文笔记】Dual-Balancing for Multi-Task Learning

Abstract 多任务学习(Multi-task learning, MTL)中,任务平衡问题仍然是重要的挑战,损失、梯度尺度的不同,会导致性能的折中。 本文提出Dual-Balancing for Multi-Task Learning (DB-MTL),从损失和梯度两个角度缓解任务均衡问题。…

成功解决:IDEA导入java项目 或 建包的时候com.不分开 【详细原理解释说明】

我 | 在这里 ⭐ 全栈开发攻城狮、全网10W粉丝、2022博客之星后端领域Top1、专家博主。 🎓擅长 指导毕设 | 论文指导 | 系统开发 | 毕业答辩 | 系统讲解等。已指导60位同学顺利毕业 ✈️个人公众号:热爱技术的小郑。回复 Java全套视频教程 或 前端全套视频…

子串 前缀和 | Java | (hot100) 力扣560. 和为K的子数组

560. 和为K的子数组 暴力法&#xff08;连暴力法都没想出来……&#xff09; class Solution {public int subarraySum(int[] nums, int k) {int count0;int len nums.length;for(int i0; i<len; i) {int sum0;for(int ji; j<len; j) {sumnums[j];if(sum k) {count;}…

C/C++复习 day2(模板,继承,多态)

C/C复习 day2 文章目录 C/C复习 day2前言一、模板1.模板的原理2.非类型模板参数3.模板的特化a. 函数模板的特化b. 类模板的特化1.全特化2.偏特化 4.模板的分离编译 二、继承1.继承的概念2.继承与派生类对象赋值转化3.隐藏1.成员变量的隐藏2. 成员函数的隐藏 4.继承中的友元5.继…

数据结构:栈(含源码)

目录 一、栈的概念和结构 二、栈的实现 2.1 头文件 2.2 各个功能的实现 初始化栈 入栈 出栈 获取栈顶元素和栈中有效个数 判断栈是否为空 栈的销毁 2.3 测试 完整源码 一、栈的概念和结构 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和…