2024-10-11,由Mila – Quebec AI Institute和McGill University等机构创建了首个大规模油井检测数据集,这个数据集的意义在于提供了一个工具,能够通过卫星图像识别和定位全球数以百万计的废弃油气井,这对于减少温室气体排放和保护环境具有重大意义。
一、研究背景:
废弃油气井在全球范围内对环境造成了严重影响,它们泄露甲烷等强效温室气体,同时对地下水造成污染。然而,许多废弃井的位置未知,这使得它们无法被有效封堵,从而无法避免其对环境的破坏。
目前遇到困难和挑战:
1、废弃油气井的定位困难,许多井的位置未知,导致无法进行有效的封堵和污染控制。
2、现有的遥感技术在废弃油气井检测方面的应用还相对未被充分探索。
3、缺乏大规模、高质量的数据集来训练和评估用于油井检测的计算机视觉算法。
数据集地址:Alberta Wells Dataset|环境监测数据集|计算机视觉数据集
二、让我们一起来看一下Alberta Wells数据集:
Alberta Wells Dataset 是一个开创性的大规模基准数据集,旨在通过分析中等分辨率的多光谱卫星图像来识别和定位阿尔伯塔省的油气井。这个数据集包含了超过213,000个油气井的详细信息,涵盖了废弃、暂停和活跃三种状态,为环境监测和气候变化研究提供了宝贵的资源。
加拿大阿尔伯塔省,这里是全球第三大石油储备地区,拥有大量的油气井。
数据集构建:
1、阿尔伯塔能源监管机构(Alberta Energy Regulator),并结合了Planet Labs提供的高分辨率卫星图像。
2、通过领域专家进行数据的质量控制和过滤,以确保井位状态的准确性。
3、利用Planet Labs提供的卫星图像,覆盖了超过213,000个单独的井。
4、将数据集划分为训练集、验证集和测试集,以支持机器学习模型的训练和评估。
数据集可以用于训练和评估油井检测算法,包括目标检测和二元分割任务。提供了相应的图像分割标签和边界框注释,以支持这些任务。
基准测试 :
论文中评估了一系列深度学习算法在油井检测和分割任务上的性能,包括U-Net、PAN、DeepLabV3+等模型,为后续研究提供了基准。
应用遥感算法检测油气井的先前数据集。“N/A”是指不表示数据集中单个孔数的数据集。
有关数据集中不同状态(暂停、废弃和活跃)的井数量的信息。它还包括特定于领域的元数据,例如操作模式和提取的化石燃料类型,这些元数据用于过滤和质量控制。
AER ST37 数据集清洗和质量控制
应用数据集拆分算法的结果图示:在图 (a) 到 (c) 中,不同的颜色表示不同的集群 ID。在图 (d) 中,蓝色表示训练集,橙色表示验证集,绿色表示测试集。
数据集中的示例图像块包括无孔、双孔和多孔的示例。此外,我们还通过分割 U-Net (EfficientNet-B6) 和对象检测 FCOS 模型生成的预测提供了定性结果。
三、让我们一起展望Alberta Wells数据集应用场景:
比如,我是一个环境监测员。
在阿尔伯塔省的一片广袤的土地上,有成千上万的油气井。其中,一些油气井已经废弃多年,就像一个个沉默的哨兵,隐藏在大地的肌肤之下。但是,这些废弃的油气井并不是完全安静的,它们中的一些会悄悄地泄露甲烷,这种温室气体对气候变化的影响是二氧化碳的几十倍。同时,这些泄露还可能污染地下水,威胁到当地的生态环境和居民的健康。 我经常需要驾驶着车辆,穿越崎岖的山路,穿梭在阿尔伯塔省那些荒无人烟的地方,就为了找到那些废弃的油气井。有时候,我得拿着地图和指南针,徒步走进森林或者草原,就为了确认那些油气井是不是还在泄露甲烷,或者有没有污染地下水。这工作不仅辛苦,常常也吓个半死。关键效率低的让人抓狂,常常处在崩溃的状态下。毕竟,阿尔伯塔省那么大,油气井又那么多。活真的是干不完,干不完。
自从开始用Alberta Wells 数据集训练的系统,给我的工作带来很大的改变。
现在,我可以坐在办公室里,用电脑就能看到那些卫星图像,系统会帮我找出那些可能在泄露的废弃油气井。这就像是有了超能力,我不用到处跑,也能知道哪里有问题。
就拿上周来说,系统提示我,有一个废弃的油气井可能在泄露甲烷。那个井位于一个我从来没听说过的地方,要是在以前,我可能得花上好几天的时间去找它。但现在,我只需要打开系统,输入坐标,就能找到那个井的精确位置。我立刻组织了一个小队,直接开车到了那个井的位置。果不其然,那个井真的在泄露甲烷,我们立刻进行了处理。随后,我们还对这个区域的其他油气井进行了检查,确保没有其他的泄露风险。
这就像是给了我们一个超级工具,让我们在保护环境的战斗中变得更加强大。这种感觉,真的很棒!