kaggle新赛:谷歌AI模型运行时间预测赛题解析【数据挖掘】

news2024/11/25 13:25:08

赛题名称:Google - Fast or Slow? Predict AI Model Runtime

赛题链接:https://www.kaggle.com/competitions/predict-ai-model-runtime

赛题背景

Alice 是一名 AI 模型开发人员,但她的团队开发的一些模型运行速度非常慢。她最近发现了编译器的配置,这些配置改变了编译器编译和优化模型的方式,从而使模型运行得更快(或更慢)。参赛者的任务是帮助 Alice 找到每个模型的最佳配置。

赛题方向

数据挖掘

赛题任务

根据训练数据集中提供给参赛者的运行时数据训练机器学习模型,并进一步预测测试数据集中图形和配置的运行时。

数据描述

我们的数据集称为TpuGraphs,这是在XLA HLO图上运行在张量处理单元(TPUs) v3上的性能预测数据集。

总共有5个数据集集合:layout:xla:randomlayout:xla:defaultlayout:nlp:randomlayout:nlp:defaulttile:xla

最终得分将是所有数据集的平均值。要下载整个数据集并查看更多信息,参赛者可以导航到数据选项卡。

基准模型

我们在https://github.com/google-research-datasets/tpu_graphs上提供了基准模型和训练设置。请参阅我们的数据集论文(https://arxiv.org/abs/2308.13490),了解基准模型的详细信息。

评价指标

根据实际需求,我们使用两种评估指标,并对其取平均。

具体来说,对于数据集“tile:xla”,我们使用top-K预测产生的“(1-slowdown)”来反映模型预测的top-K配置相对于实际最快配置的速度降低情况,计算如下:

其中 K 是top-K预测,A 是数据集中给定图的所有配置,y 是测量的执行时间。

对于 layout:* 数据集,我们使用肯德尔秩相关系数(一种排名评估指标:模型预测的配置排序与运行时间排序的实际对应程度)。

提交文件

参赛者的提交文件必须是一个带有标题ID、TopConfigscsv文件。每个npz/**/test/*.npz文件(请参阅数据)在csv文件中必须有一行。

  • ID是{collection}:{test_filename_without_extension},其中collection是tile:xla、layout:xla:random、layout:xla:default、layout:nlp:random和layout:nlp:default之一。

  • TopConfigs应该根据参赛者的模型预测,按照从最快(运行时间最短)到最慢(运行时间最长)的顺序,用“;”分隔列出配置的索引。

    • 对于集合tile:xla,只有前5个条目将被考虑,其余的将被忽略。

    • 对于layout:*集合,所有条目将被考虑

  • 有关样本提交文件,请从数据选项卡下载sample_submission.csv。

时间安排

  • 2023年8月29日 - 开始日期。

  • 2023年11月10日 - 报名截止日期。

  • 2023年11月17日 - 最终提交截止日期。

赛题奖金

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 8,000美元

  • 第四名 - 7,000美元

  • 第五名 - 5,000美元

  • 第六名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/959584.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务容错 Resilience4j 接口服务-容错原理

微服务容错 Resilience4j 容错原理 4.1 微服务容错简介 在⾼并发访问下,⽐如天猫双11,流量持续不断的涌⼊,服务之间的相互调⽤频率突然增加,引发系统负载过⾼,这时系统所依赖的服务的稳定性对系统的影响⾮常⼤&#…

1.频偏估计算法

目录 整数倍频偏估计方法 小数倍频偏估计方法 使用CP进行频偏估计 使用SSB进行频偏估计 OFDM对频偏比较敏感,频偏会影响子载波的正交性,造成载波间干扰。频偏对PRACH相关计算峰值的影响本质上是子载波间干扰导致的。时域检测:首先对接收…

10年经验之谈 —— 如何从0开始做自动化测试?

自动化测试是使用软件工具在应用程序上自动运行测试的过程,无需任何人为干预。这可以通过减少手动测试的需要来保存时间并提高软件开发过程的效率。由于人为错误或不一致性,手动测试可能容易出错,这可能导致错误未被检测到。自动化测试通过提…

HTTP协议概述

HTTP 协议定义 HTTP协议,直译为超文本传输协议,是一种用于分布式、协作、超媒体的信息系统的应用协议。HTTP协议是万维网数据通信的基础。HTTP协议在客户端-服务器计算模型中充当请求-响应协议。客户端向服务器提交HTTP请求消息。服务器提供HTML文件和其…

IDEA正则替换

需求:将cloud.vlan这种字符串替换为cloud.vlan \([a-zA-Z])\.\([a-zA-Z])\$1.$2 解释: \[a-zA-Z]\.\[a-zA-Z]\:匹配字母.字母格式字符串; \([a-zA-Z])\.\([a-zA-Z])\:匹配字母.字母格式字符串,并使用()捕…

睿趣科技:抖音小店初期怎么运营

随着社交媒体的兴起,抖音成为了一个广泛受欢迎的社交平台,越来越多的创业者开始在抖音上开设小店。然而,抖音小店的初期运营并不容易,需要合理的策略和方法来吸引目标受众,提升知名度和销售额。 首先,明确定…

CMU15445 fall 2022/spring 2023 项目环境搭建+选择合适的版本

前言 CMU15445是一门关于数据库管理系统(DBMS)的设计和实现的优秀课程。由数据库领域大佬Andy主讲,同时还有迟策大佬所设计和维护的BusTub,其名声在外之处更是有着极高质量的作业(HOMEWORKS)和项目&#x…

C语言每日一练--Day(17)

本专栏为c语言练习专栏,适合刚刚学完c语言的初学者。本专栏每天会不定时更新,通过每天练习,进一步对c语言的重难点知识进行更深入的学习。 今日练习题关键字:数对 截取字符串 💓博主csdn个人主页:小小unico…

如何在访问一个页面时,将访问时刻的时间显示在页面上

1.如何在访问一个页面时,将访问时刻的时间显示在页面上 GetMapping("/append") public ModelAndView append() {ModelAndView mvnew ModelAndView("expense/append");String date LocalDate.now().toString();mv.addObject("date",d…

OTFS-ISAC雷达部分最新进展(含matlab仿真+USRP验证)

OTFS基带参数设置 我将使用带宽为80MHz的OTFS波形进行设计,对应参数如下: matlab Tx仿真 Tx导频Tx功率密度谱 帧结构我使用的是经典嵌入导频帧结构,Tx信号波形的带宽从右图可以看出约为80Mhz USRP验证 测试环境 无人机位于1m处 Rx导频Rx…

Python爬取京东商品评论

寻找数据真实接口 打开京东商品网址查看商品评价。我们点击评论翻页,发现网址未发生变化,说明该网页是动态网页。 API名称:item_review-获得JD商品评论 公共参数 获取API测试key&secret 名称类型必须描述keyString是调用key&#xff…

source insight 宏 MakeBufClip

趁着工作间隙在搞一些source insight 的宏,当在使用这个 MakeBufClip 的时候,出现了问题,如: 居然是未知的命令,可是这个是从官方文档里参考的啊:MakeBufClip (hbuf, fClip) 然后我也是尝试一下发邮件给 s…

Ansible自动化运维工具(三)

目录 Ansible 的脚本 --- playbook 剧本 ​编辑2.vars模块实战实例 3.指定远程主机sudo切换用户 4.when模块实战实例 5.with_items迭代模块实战实例 6.Templates 模块实战实例 (1)先准备一个以 .j2 为后缀的 template 模板文件,设置引用…

Linux 常见命令操作

一、目录管理 1.1 列出目录 ls # ls 命令 # -a 参数,查看全部的文件,包括隐藏的文件 # -l 参数,列出所有的文件,包括文件的属性和权限,不显示隐藏文件 [rootlocalhost /]# ls bin boot dev etc home lib lib64…

<数据结构>AVL树详解

目录 AVL是什么? 平衡因子 旋转 左单旋 右单旋 左右双旋 右左双旋 全部的代码 AVL树又叫平衡树(Balance_Tree),笔者认为这个名字非常不错,中国嘛,就是在意阴阳平衡,之前小编还拿这个当过自己网络IP&#xff0c…

计算机组成原理之计算机系统概述(补充)

目录 一、引入二、计算机发展历程2.1 什么是计算机系统2.2 硬件的发展2.3 软件的发展2.4 目前的发展趋势2.5 小结 三、计算机硬件的基本组成3.1 早期冯诺依曼机的结构3.2 现代计算机的结构3.3 小结 四、各个硬件的工作原理4.1 主存储器的基本构成4.2 小结 五、计算机系统的层次…

常见项目管理中npm包操作总结

前言 我们在日常工作中,可能需要下载包、创建包、发布包等等。本篇推文将记录日常项目中关于npm包的操作。 引用包 npm仓库公开的包我们都可以通过npm install的命令进行引用下载。 而我们开发的业务公共组件需要在公司内部项目公共引用,而不希望公开为外…

Java“牵手”京东店铺所有商品API接口数据,通过店铺ID获取整店商品详情数据,京东店铺所有商品API申请指南

京东平台店铺所有商品数据接口是开放平台提供的一种API接口,通过调用API接口,开发者可以获取京东整店的商品的标题、价格、库存、月销量、总销量、库存、详情描述、图片、价格信息等详细信息 。 获取店铺所有商品接口API是一种用于获取电商平台上商品详…

狂神汇编原理

1.汇编(可以破解软件,写外挂…) ------计算器语言----- 2.机器语言 0和1 c>汇编—>二进制 INC --抽象-->编译器 0100 0000DECMULDIV3.进制 10进制(10个手指) 可以自己定义进制,作为进制加密解密,查数 1进制 一进一 写出2 ->1 1 2进制 0 1 10 11 100 101 110…

使用Arrays.asList生成的List集合,操作add方法报错

早上到公司,刚到工位,测试同事就跑来说"功能不行了,报服务器异常了,咋回事";我一脸蒙,早饭都顾不上吃,要来了测试账号复现了一下,然后仔细观察测试服务器日志,发现报了一个…