[比赛简介]BirdCLEF-2023

news2024/11/9 9:38:06

比赛链接:BirdCLEF 2023 | Kaggle

比赛简介

鸟类是生物多样性变化的极好指标,因为它们具有高度流动性并且具有不同的栖息地要求。因此,物种组合和鸟类数量的变化可以表明恢复项目的成败。然而,经常在大面积地区进行传统的基于观察员的鸟类生物多样性调查既昂贵又在后勤上具有挑战性。相比之下,被动声学监测(PAM)与基于机器学习的新分析工具相结合,使保护主义者能够以更高的时间分辨率对更大的空间尺度进行采样,并深入探索恢复干预措施与生物多样性之间的关系。

在本次比赛中,您将使用机器学习技能通过声音识别东非鸟类。具体来说,您将开发计算解决方案来处理连续的音频数据并通过它们的呼叫识别物种。最好的条目将能够在有限的训练数据下训练可靠的分类器。如果成功,你将帮助推进保护非洲鸟类生物多样性的持续努力,包括由肯尼亚保护组织NATURAL STATE领导的努力。

NATURAL STATE正在肯尼亚北部山周围的试点地区开展工作,以测试各种管理制度和退化状态对牧场系统中鸟类生物多样性的影响。通过使用在本次竞赛范围内开发的机器学习算法,NATURAL STATE将能够证明这种方法在衡量恢复项目的成功和该方法的成本效益方面的功效。此外,具有成本效益地监测恢复工作对生物多样性的影响的能力将使NATURAL STATE能够测试和建立一些首批以生物多样性为重点的财务机制,以将急需的投资用于恢复和保护许多人所依赖的这一景观。这些工具对于经济高效地将其扩展到项目区域之外并实现我们大规模恢复和保护地球的愿景是必要的。

由于您的创新,研究人员和保护从业人员将更容易准确地调查鸟类种群趋势。因此,他们将能够评估威胁并定期更有效地调整其保护行动。

评估方法

 本场比赛的评估标准是 padded cmAP 的指标,它是基于 scikit-learn 实现的宏平均准确率的一个变体。为了支持对没有真正正例标签的物种的预测,以及减少正例标签很少的物种的影响,评分之前会在每个提交和答案中加入五行真正正例。这意味着即使是一个基本的提交也会得到一个相对较高的分数。

chatgpt来介绍一下sklearn.metrics.average_precision_score

提交格式
提交格式是对每个 row_id,预测给定的鸟类物种是否存在的概率。每个鸟类物种有一列,所以每行需要提供 264 个预测。

import pandas as pd
import sklearn.metrics

def padded_cmap(solution, submission, padding_factor=5):
    solution = solution.drop(['row_id'], axis=1, errors='ignore')
    submission = submission.drop(['row_id'], axis=1, errors='ignore')
    new_rows = []
    for i in range(padding_factor):
        new_rows.append([1 for i in range(len(solution.columns))])
    new_rows = pd.DataFrame(new_rows)
    new_rows.columns = solution.columns
    padded_solution = pd.concat([solution, new_rows]).reset_index(drop=True).copy()
    padded_submission = pd.concat([submission, new_rows]).reset_index(drop=True).copy()
    score = sklearn.metrics.average_precision_score(
        padded_solution.values,
        padded_submission.values,
        average='macro',
    )
    return score

 数据描述

您在本次比赛中面临的挑战是在肯尼亚制作的长录音中识别哪些鸟类在鸣叫。对于出于保护目的监测鸟类种群的科学家来说,这是一项重要任务。更准确的解决方案可以实现更全面的监控。今年,您的笔记本还必须在更受限的时间范围内完成推理。这将使在效率非常高的地面保护工作中更容易部署获胜模型。
本次比赛采用隐藏式测试。当您提交的笔记本被评分时,实际测试数据(包括样本提交)将提供给您的笔记本。

train_audio/训练数据包括 xenocanto.org 用户慷慨上传的单个鸟叫声的简短记录。这些文件在适用的情况下已缩减采样至 32 kHz,以匹配测试集音频并转换为 ogg 格式。训练数据应包含几乎所有相关文件;我们预计在 xenocanto.org 上寻找更多内容没有任何好处。

test_soundscapes/提交笔记本时,test_soundscapes目录中将填充大约 200 个用于评分的录制文件。它们长达 10 分钟,采用 ogg 音频格式。文件名是随机的。提交笔记本大约需要五分钟来加载所有测试音景。

train_metadata.csv为训练数据提供了广泛的元数据。最直接相关的字段是:

  • primary_label- 鸟类代码。您可以通过将代码附加到 来查看有关鸟类代码的详细信息,例如美国乌鸦的代码。https://ebird.org/species/https://ebird.org/species/amecro
  • latitude & longitude:录制位置的坐标。某些鸟类可能具有本地称为“方言”的鸟类,因此您可能希望在训练数据中寻找地理多样性。
  • author- 提供录音的用户。
  • filename:关联音频文件的名称。

sample_submission.csv有效的示例提交。

  • row_id:用于预测的辅助信息区。[soundscape_id]_[end_time]
  • [bird_id]:有 264 个鸟类 ID 列。您需要预测每行每只鸟存在的概率。

eBird_Taxonomy_v2021.csv - 关于不同物种之间关系的数据。

提交要求

  • CPU 笔记本 <= 120 分钟运行时间
  • 允许免费和公开的外部数据,包括预先训练的模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/443190.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

你的车有通风座椅吗?新款奔驰S400升级原厂主副驾座椅通风

大家好&#xff0c;我是奔之升小志&#xff08;bzs878&#xff09;&#xff0c;专注名车原厂升级&#xff0c;欢迎戳戳右上角“”号关注一下&#xff0c;持续为您带来精彩改装案例。 座椅通风有什么用&#xff1f;能改善身体与座椅接触面空气流通&#xff0c;达到不出汗的效果…

Linux网络服务----SSH

文章目录 一 、SSH服务1.1 什么是SSH服务器&#xff1f;1.2 常用的SSH软件的介绍 二 、ssh的运用2.1 存放ssh服务端的配置文件2.2 ssh在Linux中的密码登录2.3 利用ssh协议传输文件和获取文件2.4 sftp远程访问操作 三 、 ssh密钥登录操作四 、TCP_wapper的原理和运用4.1 TCP_wap…

IP-GUARD能否实现打印指定文件时需经过管理员审批后才能打印?

支持。先设置禁止打印文档的策略,然后设置相关审批流程,再给到客户端相应的申请权限: 1、在控制台-高级-打印控制策略中,给需要进行打印管控的客户端设置以下策略: 动作:禁止 2、在控制台-申请管理-桌面申请管理-审批流程管理中,添加申请类型为打印的审批流程,指定审批人…

通过ADB实现移动端h5项目无线真机调试(超级简单!)

前言 做移动端h5项目的时候&#xff0c;电脑浏览器调试样式和效果&#xff0c;可能和真机展示出来的效果有差距&#xff0c;比如有的手机开启了home键&#xff0c;比如文字大小等样式有偏差。虽然可以通过手机扫描网页二维码在手机上看样式&#xff0c;但是和真机还是有区别。…

每天一道大厂SQL题【Day23】华泰证券真题实战(五)

每天一道大厂SQL题【Day23】华泰证券真题实战(五) 大家好&#xff0c;我是Maynor。相信大家和我一样&#xff0c;都有一个大厂梦&#xff0c;作为一名资深大数据选手&#xff0c;深知SQL重要性&#xff0c;接下来我准备用100天时间&#xff0c;基于大数据岗面试中的经典SQL题&…

Veritas 与星辰天合的官方一体化方案来了

11&#xff1e;2&#xff0c;XSKY星辰天合联手 Veritas 贡献企业数据管理最佳实践。 近日&#xff0c;XSKY星辰天合以“科技联盟伙伴”身份亮相 2023 Veritas Solution Day&#xff0c;并宣布与 Veritas 推出联合解决方案。双方将携手为大型企业客户带来业界领先的数据存储与保…

CDH中的MySQL升级(RPM包方式)

CDH中的MySQL升级&#xff08;RPM包方式&#xff09; 1.下载官网的5.7中最新的版本&#xff0c;地址&#xff1a;MySQL 5.7.41 rpm下载地址 2.解压下载的tar包&#xff1a;tar -xvf mysql-5.7.41-1.el7.x86_64.rpm-bundle.tar 3.备份数据库 3.1 先停止MySQL服务&#xff1a;sy…

【测试开发】第一节.测开入门(附常考面试题)

文章目录 前言 一、什么是测试开发 1.1 常考面试题 二、软件测试的基础概念 2.1 需求 2.2 测试用例 3、BUG 三、生命周期 3.1 软件的生命周期 3.2 软件测试的生命周期 四、软件工程中的几种常见的开发模型 4.1 瀑布模型 4.2 螺旋模型 4.3 增量模型和迭代模型 4.4 敏捷…

【Windows10】〖问题〗Win10默认应用Web浏览器设置里出现两个Microsoft Edge图标,如何删掉空白图标?

〖问题〗Win10默认应用Web浏览器设置里出现两个Microsoft Edge图标&#xff0c;如何删掉空白图标&#xff1f; 问题 出现原因&#xff1a; 空白那个应该是旧版edge&#xff0c;可能是因为你曾经升级最新版Chromium的edge时&#xff0c;旧版本的edge并没有被系统清除干净所…

spring security (史上最全)

认证与授权&#xff08;Authentication and Authorization&#xff09; 一般意义来说的应用访问安全性&#xff0c;都是围绕认证&#xff08;Authentication&#xff09;和授权&#xff08;Authorization&#xff09;这两个核心概念来展开的。 即&#xff1a; 首先需要确定用…

计算机组成原理——第七章输入输出系统(下)

还君明珠双泪目&#xff0c;恨不相逢未嫁时 文章目录 前言7.3.2 中断的作用和原理7.3.3 多重中断7.3.4 程序中断方式7.3.5 DMA 方式 前言 本节除了对时间的计算考察比较多之外&#xff0c;其他的方面也有考察&#xff0c;同时中断的考点在操作系统中也有考察&#xff0c;机组里…

〖Python网络爬虫实战⑯〗- 网页解析利器parsel

订阅&#xff1a;新手可以订阅我的其他专栏。免费阶段订阅量1000 python项目实战 Python编程基础教程系列&#xff08;零基础小白搬砖逆袭) 说明&#xff1a;本专栏持续更新中&#xff0c;目前专栏免费订阅&#xff0c;在转为付费专栏前订阅本专栏的&#xff0c;可以免费订阅付…

【hello Linux】进程控制

目录 1. 进程创建 2. 进程终止 3. 进程常见的退出方法 4. 进程等待 5. 进程等待的方法 6. 获取子进程status Linux&#x1f337; 1. 进程创建 fork 函数初识 在 linux 中 fork 函数是非常重要的函数&#xff0c;它可以从已存在进程中创建一个新进程。 新进程便是我们所说的子进…

从0到1搭建react 工程化前端项目

一、npm init 初始化包管理 1.在使用该命令之前&#xff0c;创建一个文件夹&#xff0c;例如&#xff1a;reactDemo2.使用在电脑终端命令行工具中&#xff0c;找到1创建的文件夹&#xff0c;并转到改文件夹指定目录&#xff1b;3.执行 npm init4.如图所示&#xff1a; 5.执行命…

云看消博会:政策、技术、玩家造就的数字化革命

配图来自Canva可画 会展作为展示地域经济、文化、技术等软硬实力的最佳舞台&#xff0c;在塑造城市品牌形象、加速地域经济发展中发挥着重要的促进作用。近几年&#xff0c;在数字经济浪潮的推动下&#xff0c;会展产业走上了网联化、数字化、智能化的道路&#xff0c;催生了不…

上货避坑指南 私域上货选品工具 无货源选品上货 采集商品详情数据API分享 详情图 sku信息

电商开店之后&#xff0c;第一件事就是上货了&#xff0c;上货其实也是有技巧的。 上传商品时我们一定要注意细节&#xff0c;不可忽略一些重要细节&#xff0c;所以商家们在上传商品前&#xff0c;不可忽略是否预售、标题、主图、详情页、保证金、上架时间这几个细节。 详情…

PHP实现输入数值计算幂次,输入工资,判断个人所得税的金额这两个程序的代码

目录 前言 一、输入数值计算幂次 1.1运行流程&#xff08;思想&#xff09; 1.2代码段 1.3运行截图 二、输入工资&#xff0c;判断个人所得税的金额 2.1运行流程&#xff08;思想&#xff09; 2.2代码段 2.3运行截图 前言 1.因多重原因&#xff0c;本博文有两个代码程…

【动手学深度学习】使用块的网络(VGG)

使用块的网络&#xff08;VGG&#xff09; 本文为李沐老师《动手学深度学习》一书的学习笔记&#xff0c;原书地址为&#xff1a;Dive into Deep Learning。 另&#xff0c;给自己练习时没有gpu资源的小伙伴推荐下kaggle数据科学网站&#xff0c;每周免费训练时长30h。 1 网络结…

Compose TextField

TextField​ Composable fun TextField(value: String,onValueChange: (String) -> Unit,modifier: Modifier Modifier,enabled: Boolean true,readOnly: Boolean false,textStyle: TextStyle LocalTextStyle.current,label: Composable (() -> Unit)? null,place…

unity,物理材质2d

介绍 2D物理材质(Physics Material 2D)是Unity中用于设置2D游戏对象的物理特性的一种方式。2D物理材质可以控制2D游戏对象的摩擦力、弹性系数等物理属性&#xff0c;从而影响其在物理引擎中的运动行为。以下是2D物理材质的详细介绍&#xff1a; 方法 摩擦力 2D物理材质的主要…