AI「鸟口普查」,康奈尔大学利用深度学习分析北美林莺分布

news2025/1/18 11:42:32

据世界自然基金会统计,1970-2016 年,全球代表物种种群数量减少了 68%,生物多样性不断下降。
保护生物多样性,需要对当地生态情况进行准确分析,制定合理的生态保护政策。然而,生态数据太过庞杂,统计标准又难以统一,大规模的生态分析很难开展。
近期,康奈尔大学的研究者们利用深度学习,分析了 900 万组鸟类数据,得到了林莺在北美洲的分布数据,开启了生态数据分析的新篇章。

作者 | 雪菜

编辑 | 三羊、铁塔

据世界自然基金会 (WWF) 统计,1970 年至 2016 年,全球 4,392 个代表物种、20,811 个种群的平均数量降低了 68% ,全球生物多样性正在下降。

在这里插入图片描述

图 1:1970-2016 年,全球 4,392 个代表物种、20,811 个种群的平均数量变化

保护生物多样性,需要对相关地区的物种分布进行准确的大规模分析。 然而,由于数据量过于庞大,且缺乏统一的统计方法,研究者们暂无法准确统计特定区域的生物多样性(物种丰富度、种群数量等)和生物组成数据(在当地生态系统中某一个物种的地位)。

传统的物种丰富度统计,需要将不同物种的分布地图叠加,进行建模预测,或是直接通过宏观生态学模型进行预测。无论哪种方法,推断结果都会受到模型精度的影响,前者还会受到地图精度的影响。

而且,这种预测方法的时间分辨率很差,无法对物种分布的季节性变化作出准确判断,更无法对物种间的联系进行研究,不利于生态保护政策的制定。

深度学习为生物多样性的大规模时空研究提供了有效手段。美国康奈尔大学的研究者们结合深度推理网络 (DRN, Deep Reasoning Network) 和深度多元 Probit 模型 (DMVP, Deep Multivariate Probit Model) 开发了 DMVP-DRNets 模型,从 9,206,241 组 eBird 数据中分析出了林莺 (Warbler) 在北美洲的时空分布,并对林莺与环境、其他物种之间的联系作出了推断。相关成果已发表于「Ecology」。

在这里插入图片描述

这一成果已发表于 「Ecology」

论文链接:

https://esajournals.onlinelibrary.wiley.com/doi/10.1002/ecy.4175

实验过程

数据集:eBird 与协变量

研究人员使用 2004 年 1 月 1 日至 2019 年 2 月 2 日, 170°-60° W,20°-60° N 之间的 eBird 数据作为本研究的数据集。排除重复数据后,共有 9,206,241 组 eBird 数据,每组 eBird 数据包括时间、日期、地点及观察到的所有鸟类物种。

图 2:一组银喉长尾山雀的 eBird 数据

研究人员还引入了 72 个协变量,包括 5 个与观察者相关的协变量,如活动状态、观察人数、观察时间等;3 个与时间相关的协变量,主要用于弥合不同时区之间的偏差;64 个与地形地貌相关的变量,如海拔、海岸线、岛屿等。

模型框架解码器 + 潜在空间

本研究使用基于 DMVP 的 DRN 进行数据分析和预测。这一模型包含 3 层全连接 (fully-connected) 的网络解码器,用于分析输入特征的相关性,还有两个结构化潜在空间 (structured latent space) ,用以表示物种之间和物种-环境间的关联。

在这里插入图片描述

图 3:DMVP-DRNets 模型结果示意图

最终,DMVP-DRNets 模型通过一个可解释的潜在空间,输出 3 个生态相关的结果:

1、环境相关特征:反映了不同环境协变量之间的联系和相互作用;

2、物种相关特征:通过残差相关矩阵反映不同物种间的联系;

3、生物多样性相关特征:如某一物种的丰度和分布等。

模型评估:与 HLR-S 对比

将 DMVP-DRNets 模型投入大规模使用前,研究人员首先将其与基于空间高斯过程的 HLR-S 模型进行了对比。HLR-S 是生态学中研究多物种联合分布最常用的模型之一。

首先用 10,000 组 eBird 数据对两个模型进行训练。HLR-S 模型训练用时超过 24 小时,而 DMVP-DRNets 模型耗时不足 1 分钟。

在这里插入图片描述

表 1:DMVP-DRNets 模型和 HLR-S 模型性能对比

随后,对不同规模的 eBird 数据进行分析,DMVP-DRNets 模型在 11 个评价标准中优于 HLR-S 模型,仅在物种丰富度校准损失中落后于 HLR-S 模型。

实验结果

分布区域阿巴拉契亚山脉

在对 eBird 的数据进行分析后,DMVP-DRNets 模型输出了空间分辨率为 2.9 km2 的北美林莺各月分布图。不同品种林莺在北美的分布动态性很强,每个月都有不同的分布热点。在对各月分布图进行叠加后,研究人员发现阿巴拉契亚山脉是林莺物种多样性最高的区域。

图 4:北美洲的林莺分布图

a:林莺在北美洲各地的最大物种丰富度分布

b:林莺在北美洲的主要分布区域

同时,研究人员还发现了不同迁徙期的林莺分布热点。在繁殖前迁徙期,林莺主要分布在俄亥俄州、西弗吉尼亚州和宾夕法尼亚州的阿巴拉契亚山脉附近。而在繁殖后,北阿巴拉契亚山脉是林莺分布最多的区域。

在这里插入图片描述

图 5:繁殖前迁徙期 (a) 和繁殖后迁徙期 (b) 的林莺分布

林莺-环境水陆与季节偏好

进一步的,研究人员利用 DMVP-DRNets 模型对美国东北部的林莺-环境间的相互作用进行了分析。

首先,研究人员能够大致分辨出不同林莺对水生环境和陆地环境的偏好。 随后,他们发现在繁殖期不同品种林莺对于环境的喜好不同。 喜好水生环境的蓝翅黄森莺、北森莺和黄喉林莺在繁殖期栖息较近,而松林莺会和其他与松林相关的物种走得更近,如棕头鳾和红头啄木鸟。

随着季节的变化,不同林莺的分布也有变化。 在繁殖后迁徙期,大多数林莺会抱团栖息,而棕榈林莺会选择在稍晚的秋天迁徙。松林莺和黄腰白喉林莺则会整年栖息在美国东北部。

在这里插入图片描述

图 6:繁殖期林莺与环境、其他物种之间的关联性

在这里插入图片描述

图 7:繁殖后迁徙期林莺与环境、其他物种之间的关联性

物种间关联:竞争与合作

在繁殖期、非繁殖期和迁徙期,林莺与其他物种之间展现出了不同的关系。

在繁殖期,林莺主要在防御自己的栖息地,与其他物种关联较弱。 在栖息地相近且进攻性较强的品种之间,甚至是负关联,如黑枕威森莺和橙尾鸲莺。

在迁徙期,大多数林莺之间展现出了较强的正相关,与森林中的其他物种也有强关联性。 这与观察的结果一致,林莺会与红眼绿鹃、黑冕山雀等其他物种组成混合迁徙队伍。

在此期间,林莺与巨翅鵟、条纹鹰、鸡鹰、赤肩鵟等捕食者关系较差,二者负相关系数较高。

在这里插入图片描述

图 8:繁殖期 (a) 和繁殖后迁徙期 (b) 林莺与其他物种的相关系数

上述结果说明,DMVP-DRNets 模型可以对不同时期的林莺分布作出准确的判断,并能够推断出林莺与环境、其他物种之间的联系,为制定生态政策提供依据。

AI 「鸟口普查」

除了数据分析,数据采集也是生态研究的重要部分。 与植物不同,鸟类的警觉性很高,动作迅速,且有些品种个体较小,很难进行准确观测。

传统方法依赖长焦相机、高倍望远镜和静止摄像头从远距离对鸟类进行观测。 这种方法虽然避免了对鸟类的干扰,但需要投入大量的人力物力,还需要观察者有相当的生态学、分类学知识。

通过深度神经网络,AI 可以进行高效的图像识别和声音识别,为鸟类观测提供了新方法。 在鸟类主要活动地部署音视频记录设备,设备可以将记录到的数据上传到服务器,随后通过 AI 对这些数据进行分析,提取出音视频中的信息,最终得到鸟类在这一区域的分布。这一方法已被国家林业和草原局广泛应用于公园、湿地和生态保护区中。

在这里插入图片描述

图 9:部署在黄河三角洲的鸟类智慧监测系统

同时,AI 的这一技能还可以减轻科研人员的工作负担。AI 可以排除背景和噪音的干扰,专注于图像的特征,迅速解决生态学者难以做出判断的问题。 比如下图中的照片,如果没有任何鸟类知识,很难从纷繁的羽毛中迅速判断出雏鸟的数量。

在这里插入图片描述

图 10:一窝雏鸟的照片,你能分辨出图中有多少只雏鸟吗 AI 正广泛应用于鸟类活动监测和鸟类分布分析中,自下而上搭建起鸟类研究的全系统,实现特定区域的「鸟口普查」。**相信在 AI 的帮助下,我们能够对生态系统有更透彻的认识,制定出更加符合当地情况的生态政策,逐渐恢复地球的生物多样性,保护我们的地球家园。**

参考链接:

[1]https://www.worldwildlife.org/publications/living-planet-report-2020

[2]https://phys.org/news/2023-09-ai-birds-easier.html

[3]https://www.forestry.gov.cn/main/586/20230118/094644604451331.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1079600.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

淘宝官方开放平台API接口获取淘宝商品详情信息(价格、销量、优惠价等)

淘宝、天猫商品详情API接口实现可以获取详情页面上面的标题,价格,优惠券,优惠价,促销活动,库存,sku规格属性,sku属性图片,产品图片,详情属性,详情主图&#x…

Java架构师异步架构设计

目录 1 导学2 为何需要异步消息架构3 消息发送失败该如何处理4 mq接收到消息过后又丢失了消息怎么办5 消费者弄丢了消息该如何处理6 消息重复消费了该怎么处理7 消息的有序处理8 消息堆积该如何处理9 如何提高消息消费的速度10 消息应用的可插拔11 如何设计消息的统一id12 异步…

手把手教你从webpack迁移到vite,仅6步~!

文章目录 启动耗时对比操作步骤1. 修改 index.html2. 修改 package.json3. 重新安装依赖4. 创建vite.config.js5. 修改require导入6. 修改环境变量判断 Vite优点 Vite 开发快速入门 启动耗时对比 webpack 启动耗时23s左右: vite 启动耗时0.5s左右: 优…

9-AJAX-上-原理详解

一、定义 1、什么是Ajax Ajax:即异步 JavaScript 和XML。Ajax是一种用于创建快速动态网页的技术。通过在后台与进行少量数据交换,Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新。而传统的…

堆专题1 向下调整构建大顶堆

题目: 样例: 输入 6 3 2 6 5 8 7 输出 8 5 7 3 2 6 思路: 堆,是一颗完全二叉树,树中每个节点的值都不小于(或不大于)其左右孩子结点的值。 其中, 父结点大于或者等于孩子结点的值…

8+纯生信,多组机器学习+分型探讨黑色素瘤发文思路。

今天给同学们分享一篇泛癌多组机器学习分型的生信文章“Comprehensive characterisation of immunogenic cell death in melanoma revealing the association with prognosis and tumor immune microenvironment”,这篇文章于2022年9月23日发表在Front Immunol 期刊…

国际数学教材扫盲知识(持续更新中)

缩写 A-LEVEL(大学预科):General Certificate of Education Advanced Level AP:Advanced Placement(美国地区:美高AP) GCSE:General Certificate of Secondary Education&#xf…

ubuntu下使用gcc编译c程序: “error: stray ‘\357’ in program“

现象&#xff1a; ubuntu下使用gcc编译c程序: “error: stray ‘\357’ in program“ 尝试查找原因&#xff1a;打开从windos直接粘贴c程序到ubuntu的c代码&#xff0c;发现多了 <200b>&#xff1a; 方案&#xff1a;尝试在vim编辑器删除&#xff0c;多出来的字符后编译…

如何实现前端缓存管理?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

【MTK】【WIFI】手机和综测仪器误差在5db左右误差

在测试的时候发现CMU设置的信号强度和工程模式差异过大 原因分析是因为5G Rx Feloss没有填写导致 如下设置5G WF0 Tx/Rx Feloss; 指的是chipout 到测试座处的loss; 5*0.52.5dB 这样测下来误差就会在3db之内了&#xff0c;达到测试标准了

B 开组会(可持久线段树+树剖) 武汉大学2023年新生程序设计竞赛(同步赛)

其实题目就是每次询问一个节点 在这个节点的基础上往下继续遍历t的深度&#xff0c;在这个遍历的过程中找一个最大值就行了 其实这个题目数据非常水&#xff0c;直接暴力就可以过了 下面是别人过的代码 #include<bits/stdc.h> using namespace std; const int mxn5e…

C# 超好用的自定义异形窗体

1 功能介绍 项目上要用到圆形的按钮打开界面,类似于什么加速球,内存清理球,点击圆形按钮打开界面等等功能,通过这个例子就可以简单实现,图片是什么样的,他就是什么窗体,无锯齿,很好用,工程文件代码放在末尾2 效果图片 3 代码测试 1 创建.netframework winform项目,引…

分库分表Springboot-Starter源码解析

在网上看到一个开源的分库分表组件&#xff0c;并且通过SPI机制做成了springboot的starter&#xff0c;觉得挺有意思的&#xff0c;给大家介绍一下。** 首先有两个mapper对象&#xff0c;一个是普通的mapper&#xff0c;一个是分库分表的mapper&#xff0c;分别往数据库插入数据…

MES系统安灯管理:实时可视化生产线状态

一、MES系统安灯管理的意义&#xff1a; 安灯管理是指通过使用不同颜色的灯光信号来表示生产线的状态&#xff0c;以便生产人员能够直观地了解生产线的运行情况。MES系统安灯管理的意义在于提供一个实时可视化的工具&#xff0c;使制造企业能够及时发现生产线异常和潜在问题&a…

用TRIZ创新方法理论指导产品研发学习笔记

事物的矛盾法则 事物的矛盾法则&#xff0c;也称为辩证法的矛盾法则&#xff0c;是马克思主义哲学中的一个基本概念&#xff0c;用于描述事物内部矛盾的本质和发展规律。这个法则强调&#xff0c;事物内部存在着矛盾&#xff0c;而矛盾是事物发展的动力和源泉。 TRIZ理论解决…

代码随想录算法训练营第五十六天 |1143.最长公共子序列、1035.不相交的线、53. 最大子序和动态规划

一、1143.最长公共子序列 题目链接/文章讲解&#xff1a;代码随想录 视频讲解&#xff1a;动态规划子序列问题经典题目 | LeetCode&#xff1a;1143.最长公共子序列_哔哩哔哩_bilibili 思考&#xff1a; 1.确定dp数组&#xff08;dp table&#xff09;以及下标的含义 dp[i][j]…

Jenkins对应java版本

官网地址&#xff1a;Java Support Policy 运行jenkins时,需要使用下列Java版本:

UEFI基础——测试用例Hello Word

Hello 测试用例 硬件环境&#xff1a;龙芯ls3a6000平台 软件环境&#xff1a;龙芯uefi固件 GUID获取网址&#xff1a;https://guidgen.com 一、创建工程 mkdir TextPkg/三个文件 Hello.c 、 Hello.inf 、HelloPkg.dsc 1.1 Hello.c /** fileThe application to print hello …

【踩坑】hive脚本笛卡尔积严重降低查询效率问题

前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…

TCP/IP(五)TCP的连接管理(二)

一 ISN序列号探究 本文主要探究三次握手建立TCP连接的细节备注&#xff1a; 某些问题探究的比较深入,当前用不到,暂时通过链接引入进来吃水不忘挖井人&#xff1a; 小林 coding ① 初始序列号 ISN 是如何随机产生的 ISN: 初始化序列号 Initial Sequence Number 接收方和…