天池Better Synth 官方赛事链接:天池Better Synth多模态大模型数据合成挑战赛_算法大赛_天池大赛-阿里云天池的赛制
一、内容提要
天池Better Synth多模态大模型数据合成挑战赛 是 Datawhale 2024 年 AI 夏令营第四期的学习活动——
-
适合想 入门并实践 多模态大模型、数据处理、模型训练 的学习者参与
学习内容提要:使用已有大模型和技术,在限定的计算资源下合成高质量训练数据,以增强多模态大模型的图像理解能力。
二、资源总结
本人baseline运行所使用的资源:
- PAI-DSW 试用 ,获得 5000算力时!有效期3个月!
-
+ 额外扩充磁盘空间,至少需要增加50G,需0.1元每小时,
-
+ 模型训练和评测阶段,需要跑大概3小时,购置阿里云188G内存的GPU规格,大概需要15元每小时
训练完成总共消费了 63.56 大洋 , 环境总共运行时间 为 9小时38分,配置环境 确实很繁琐、也遇到了一些配置上的问题,就在这里总结一下,希望能帮助到大家。
三、问题总结
附上 Datawhale提供的 300 分钟 跑通baseline指南:
Datawhalehttps://linklearner.com/activity/14/13/27
Step2里 下载多模态base模型及数据集 部分(大概50分钟) 因为网速 和 欠费的 原因 ,失败了2次。
下载BLIP图片描述模型 部分(约20分钟左右) ,需要执行 python download_blip.py 命令,但我之前拉取得git仓库资料里还没有,当时我就懵了,后面在文档里 看到最新得git仓库有,就去下载这个文件。
附上 仓库链接:魔搭社区汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。https://www.modelscope.cn/datasets/Datawhale/better_synth_challenge_baseline/files
数据处理与合成 部分(约1小时左右) ,运行 dj-process --config solution/image_captioning.yaml 代码时,
感觉自己的(后面这张)和教程提供的不一样,这里应该是因为,之前运行过一次, 10k的样本应该已经处理好了。
后面就是 执行模型训练 & 推理测评(3-4小时左右) 、打包zip文件、提交zip文件 ,跟着教程走就行。