#Datawhale AI夏令营第4期#多模态大模型复盘

#Datawhale AI夏令营第4期#多模态大模型复盘

news2025/4/8 6:37:31

这是Datawhale AI夏令营第4期多模态大模型赛道的复盘总结。本次学习最终获得了优秀学习者的称号。

本次赛事是天池Better Synth多模态大模型数据合成挑战赛。Better Synth 是一项以数据为中心的挑战赛，考察如何合成与清洗图文数据以在多模态大模型上取得更优的图片理解能力。数据集产出流程中必须包含“合成”的过程。

涉及到的知识点：

多模态大模型训练脚本
简单的Linux操作系统下的环境配置和安装
Data Jucier 与 Mini-Gemini 的学习
数据处理的进阶技巧和模型训练阶段的技巧等
Data Jucier Playground
Mini-Gemini
数据处理
官方赛事解读
自定义算子介绍
data-juicer sandbox insights讲解
上分思路

困难：

1.全数据未跑通；

2.150k数据跑完结果不对，未找到原因

3.时间、算力困难，上分思路未实践

4.data-juicer和sandbox没有深入研究

后续方向：

熟悉Data-Juicer官方文档和示例
sandbox样例研究
上分思路实践（10k模型）
多模态相关论文阅读（B站）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2051384.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

高效同步与处理：ADTF流服务在自动驾驶数采中的应用

目录一、ADTF 流服务 1、流服务源（Streaming Source） 2、流服务汇（Streaming Sink） 二、数据链路 1、数据管道（Data Pipe） 2、子流（Substreams） 3、触发管道（Tri…

阅读更多...

遥感之常用各种指数总结大全

遥感之常用各种指数总结大全

目前在遥感领域基本各种研究领域都会用到各种各样的指数，如水体指数，植被指数，农业长势指数，盐分指数，云指数，阴影指数，建筑物指数，水质指数，干旱指数等等众多。本文对上…

阅读更多...

Qt第十五章动画和状态机

Qt第十五章动画和状态机

文章目录动画框架动画架构动画框架类QPropertyAnimation串行动画组QSequentialAnimationGroup并行动画组QPararallelAnimationGroupQPauseAnimationQTimeLine窗口动画下坠效果抖动效果透明效果状态机QStateQStateMachine 动画框架动画架构动画框架类类名描述QAbstractAn…

阅读更多...

字符串金额转换，字符串手机号屏蔽，身份证信息查看，敏感词替换

字符串金额转换，字符串手机号屏蔽，身份证信息查看，敏感词替换

2135 在发票上面该写成零佰零拾零万贰仟壹佰叁拾伍元我们用逆推法可以写成零零零贰壹叁伍->贰壹叁伍->2135 1.遍历获取到每一个数字，然后把大写放到数组里面，将数字当作索引，在数组里面查找大写 package stringdemo;import java.uti…

阅读更多...

传输层安全性 ——TLS（Transport Layer Security）简介

传输层安全性 ——TLS（Transport Layer Security）简介

TLS（Transport Layer Security）是一种广泛使用的安全协议，旨在确保互联网通信的隐私性和数据完整性。它是SSL（Secure Sockets Layer）的继任者，最初版本于1999年发布，最新版本是TLS 1.3。 TLS 握手为每个通信会话建立一个密码套件密码套件是一组算法，其中指定了一些细节…

阅读更多...

如何轻松获取麒麟操作系统架构信息？

如何轻松获取麒麟操作系统架构信息？

如何轻松获取麒麟操作系统架构信息？ 一、使用uname -a命令二、用arch命令三、示例输出 💖The Begin💖点点关注，收藏不迷路💖 在使用麒麟操作系统（Kylin OS）时，了解系统的架构信息对于…

阅读更多...

stm32单片机学习 - stm32 的命名规则

stm32单片机学习 - stm32 的命名规则

STM32命名规则: 以STM 32 F 103 C 8 T 6 A xxx为例:

阅读更多...

动手学深度学习（pytorch）学习记录9-图像分类数据集之Fashion-MNIST[学习记录]

动手学深度学习（pytorch）学习记录9-图像分类数据集之Fashion-MNIST[学习记录]

注：本代码在jupyter notebook上运行封面图片来源 Fashion-MNIST是一个广泛使用的图像数据集，主要用于机器学习算法的基准测试，特别是图像分类和识别任务。Fashion-MNIST由德国的时尚科技公司Zalando旗下的研究部门提供。作为MNIST手写数字集…

阅读更多...

Java并发类API——CompletionService

Java并发类API——CompletionService

CompletionService 是 Java 中 java.util.concurrent 包的一部分，用于管理并发任务的执行，并以完成的顺序提供结果。它结合了线程池和阻塞队列的功能，用于提交任务并按照任务完成的顺序来检索结果，而不是按照任务提交的顺序。接…

阅读更多...

uni-app--》打造个性化壁纸预览应用平台（二）

uni-app--》打造个性化壁纸预览应用平台（二）

🏙️作者简介：大家好，我是亦世凡华、渴望知识储备自己的一名前端工程师 🌄个人主页：亦世凡华、 🌆系列专栏：uni-app 🌇座右铭：人生亦可燃烧，亦可腐败&#xf…

阅读更多...

python语言day7 函数式编程面向对象编程

python语言day7 函数式编程面向对象编程

Java 函数式编程_java函数式编程-CSDN博客 25.Java函数式编程-CSDN博客函数式编程： 通过调用函数send_email()，完成业务需求。将具体的业务需求封装成一个函数这样的一种解决问题的思想称它为函数式编程。在java中本来没有函数的概念，因为…

阅读更多...

指针详解

指针详解

目录 1. 内存 2. 编址编辑 3. 指针变量和地址 1）取地址操作符（&） 2）指针变量 3）指针类型 4）解引用操作符 4. 指针变量的大小 5. 指针变量类型的意义 1）指针的解引用 6. 指针 -…

阅读更多...

Java使用XXL-Job-Admin创建和管理调度任务的指南

Java使用XXL-Job-Admin创建和管理调度任务的指南

文章目录一、调度中心添加任务的基本方法二、配置文件中的任务配置三、创建并调用调度任务的客户端四、配置RestTemplate 总结在日常开发中，我们经常需要处理各种定时任务，而XXL-Job作为一款强大的分布式任务调度平台，为我们提供了简单易用…

阅读更多...

进程与线程（6）

进程与线程（6）

有名管道： 目录有名管道： 1.创建（mkfifo）： 2。打开（open）： 3.读写（read /write）： 4.关闭（close）： 5.卸…

阅读更多...

presto高级用法(grouping、grouping sets)

presto高级用法(grouping、grouping sets)

目录准备工作： 在hive中建表在presto中计算分解式按照城市分组统计人数按照性别分组统计人数编辑按照爱好分组统计人数编辑按照城市和性别分组统计人数按照城市和爱好分组统计人数按照性别和爱好分组统计人数按照城市和性别还有…

阅读更多...

【Qt开发】创建并打开子窗口（QWidget）的注意事项禁止其他窗口点击、隐藏窗口、子窗口不退出的配置和解决方案

【Qt开发】创建并打开子窗口（QWidget）的注意事项禁止其他窗口点击、隐藏窗口、子窗口不退出的配置和解决方案

【Qt开发】创建并打开子窗口（QWidget）的注意事项禁止其他窗口点击、隐藏窗口、子窗口不退出的配置和解决方案文章目录新建QWidget测试注意事项不要用多线程方式运行子窗口不要在打开子窗口后用阻塞死等不要用临时变量定义子窗口禁止其他窗口的点击隐…

阅读更多...

【Qt】常用控件QPushButton

【Qt】常用控件QPushButton

常用控件QPushButton QWidget中涉及的各种属性/函数/使用方法，对Qt中的各种控件都是有效的。 QPushButton继承自QAbstractButton。这个类是抽象类，是其他按钮的父类。 QAbstractButton中和QPushButton相关性比较大的属性。属性说明 text 按钮中的⽂本…

阅读更多...

Vue中下载内容为word文档

Vue中下载内容为word文档

1.使用 html-docx-js：这是一个将 HTML 转换为 Word 文档的库。 2. 利用 Blob 和 FileSaver.js：创建并下载生成的 Word 文档。在 Vue.js 中实现步骤如下: 1. npm 安装 html-docx-js 和 file-saver npm install html-docx-js npm install file-saver2.…

阅读更多...

CAS-ViT：面向高效移动应用的卷积加性自注意力视觉Transformer

CAS-ViT：面向高效移动应用的卷积加性自注意力视觉Transformer

摘要 https://arxiv.org/pdf/2408.03703 视觉转换器（Vision Transformers，ViTs）以其标记混合器强大的全局上下文能力，在神经网络领域取得了革命性的进展。然而，尽管以往的工作已做出相当大的努力，但成对标…

阅读更多...

终于来了！中国首个接入大模型的Linux开源操作系统正式发布！

终于来了！中国首个接入大模型的Linux开源操作系统正式发布！

在AI飞速发展的今天，谁不希望自己的电脑里住着一个AI助手，我们动动嘴皮子就能指挥电脑干活，省时省力？但是Windows Copilot锁了区，很多用户只能“望洋兴叹”。而现在，国产站出来了，说我们也有A…

阅读更多...

推荐文章

最新文章