python -- 实现路径的匹配,剔除掉指定路径,并保存路径

news2025/1/1 15:05:34

python – 实现路径的匹配,剔除掉指定路径,并保存路径

  • 在处理nc数据时,由于部分数据在插值的过程中,存在过多的0值,使得在制作标签时该时刻的数据出现报错,但是对于一年的数据量来说,无关紧要,所以只是记录了出现报错的时刻的路径,方面在后续变量读取过程中进行剔除,报错后续文件的处理。
  • 下面记录一下主要的代码过程,包含以下部分
  • 1、记录报错的文件路径
  • 2、剔除原始路径中报错的路径
  • 3、匹配其他数据剔除后的路径并保存

1、记录保存的文件路径

	skipped_files = []  # 记录跳过的文件路径
	cloud_label = []
    start = time.time()
    for filename in data:
        print(filename)
        try:
        	cloud_data = process_cloud(filename)
            cloud_label.append(cloud_data)
        except Exception as e:
            print(f"Error occurred while processing {filename}: {str(e)}")
            skipped_files.append(filename)
            
    cloud_label = np.array(cloud_label)    
    np.savez_compressed('cloud_label',cloud_label=cloud_label)
    if skipped_files:
        with open("skipped_files.txt", "w") as f:
            f.write("\n".join(skipped_files))

2、剔除原始路径中报错的路径

  • 原始路径中包含出现报错的路径
import pandas as pd        
import pickle
def read_pickle_file(file_path):
    
    with open(file_path, 'rb') as file:
        
        data = sorted(pickle.load(file))
        
    return data

sate_path  = read_pickle_file(r'./match_sate_list_2018_2018.pkl')
gpm_path   = read_pickle_file(r'./match_gpm_list_2018_2018.pkl')
skip_path  = pd.read_csv('./skipped_files.txt',header=None, squeeze=True)


removed_indices = []

for index, path in enumerate(sate_path):
    print(index,path)
    if any(skip in path for skip in skip_path):
        removed_indices.append(index)
        
remaining_sate_path = [path for index, path in enumerate(sate_path) if index not in removed_indices]

remaining_gpm_path  = [path for index, path in enumerate(gpm_path) if index not in removed_indices]

# 打印删除后剩余的路径
print("删除后剩余的 sate_path:", remaining_sate_path)
print("删除后剩余的 sate_path:", remaining_gpm_path)
  • 保存后的索引显示如下:
    在这里插入图片描述
  • 检查记录的索引是否与原始路径对的上,可以发现是对的上的。skip-path的第一个对于原始路径中的第12个索引位置,结果是没有问题的
    在这里插入图片描述

上述代码思路为:

  • 1、 读取目标文件的路径,包含两个原始路径sate和gpm,以及一个记录出现报错的路径skip
  • 2、通过循环,记录出现报错的路径在原始路径中的索引位置
  • 3、再次通过循环,剔除掉在原始路径中出现报错信息对应索引位置的路径,并保存剔除后的路径

保存处理后的路径

  • 保存方式1:
def save_paths_to_file(file_path, data):
    with open(file_path, 'w') as file:
        for path in sorted(data):
            file.write(path + '\n')

save_paths_to_file( remaining_sate_path,'seafog_sate_path.pkl')
save_paths_to_file( remaining_gpm_path,'seafog_gpm_path.pkl',)
  • 保存方式2:
def save_to_pickle(data, file_path):
    with open(file_path, 'wb') as f:
        pickle.dump(data, f)
        print(file_path, 'saved.')
        
save_to_pickle( remaining_sate_path,'2018_seafog_sate_path.pkl')
save_to_pickle( remaining_gpm_path,'2018_seafog_gpm_path.pkl')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/958731.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

剑指 Offer 66. 构建乘积数组(中等)

题目: class Solution { public:vector<int> constructArr(vector<int>& a) {int len a.size();if(len0) return {};vector<int> b(len, 1);for(int i1;i<len;i){ //先计算b[i]下三角的乘积。由图可看出b[1]乘的是a[0]b[i]b[i-1]*a[i-1];}int t…

【数据结构】 二叉树面试题讲解->壹

文章目录 &#x1f30f;引言&#x1f340;[相同的树](https://leetcode.cn/problems/same-tree/description/)&#x1f431;‍&#x1f409;题目描述&#xff1a;&#x1f431;‍&#x1f453;示例&#xff1a;&#x1f4cc;示例一&#x1f4cc;示例二&#x1f4cc;示例三 &…

趣解开闭原则之《我发誓!再也不买一体机了》

〇、小故事 小王大学毕业后&#xff0c;找了一份像样的工作&#xff0c;早八晚五轻松自在&#xff0c;并且收入也不错。自从大学毕业后&#xff0c;家里用的电脑还是他上大学的时候用了四年的电脑&#xff0c;配置性能早已跟不上现在的时代了。他决定用自己赚的工资买一台家用…

计算机毕设之基于python+django+mysql的影片数据爬取与数据分析(包含源码+文档+部署教程)

影片数据爬取与数据分析分为两个部分&#xff0c;即管理员和用户。该系统是根据用户的实际需求开发的&#xff0c;贴近生活。从管理员处获得的指定账号和密码可用于进入系统和使用相关的系统应用程序。管理员拥有最大的权限&#xff0c;其次是用户。管理员一般负责整个系统的运…

三步完成echers展示离线地图

1.首先要去阿里云提供的地图选择器网站选择你需要下载的地图矢量数据。链接 以湖北省为例&#xff1a; 2.复制上图中的JSON API&#xff0c;在浏览器输入json api链接&#xff0c;可以看到数据格式是很规整的json数据&#xff0c;在浏览器中右键保存为json格式数据&#xff0c…

python实现pdf双页文档转png图片,png图片裁剪为左右两等分,再合并为新的pdf单页文档

一、问题引入 现有pdf双页文档如下&#xff1a; 现按照以下页码次序对pdf双页文档进行裁剪和拼接&#xff0c;其中有两点需要特别注意&#xff0c;一是封面页只裁剪中间部分&#xff0c;二是文档是从右往左的顺序排版的 二、python程序 import os import office from PIL …

vue3 组合式api中 ref 和$parent 的使用

ref 的使用 vue3中&#xff0c; 在 组件中添加一个 component ref“xxx” &#xff0c;就可以在父组件中得到 子组件的 dom 对象&#xff0c; 以及 虚拟的 dom 对象&#xff0c; 有了虚拟 dom, 我们就可以在父组件中控制子组件的显示了 ref 的使用方法 vue3中ref 的特点 以上…

h5 ws 客户端 监听ws服务器广播的信息

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>AI智能写作</title><!-- Bootstrap CSS --><meta charset"utf-8"><meta name"viewport" content"widt…

常用Web漏洞扫描工具汇总(持续更新中)

常用Web漏洞扫描工具汇总 常用Web漏洞扫描工具汇总1、AWVS&#xff0c;2、OWASP Zed&#xff08;ZAP&#xff09;&#xff0c;3、Nikto&#xff0c;4、BurpSuite&#xff0c;5、Nessus&#xff0c;6、nmap7、X-ray还有很多不是非常知名&#xff0c;但可能也很大牌、也较常见的。…

气传导耳机品牌推荐哪些?2023气传导耳机排行榜分享

​气传导耳机的出现&#xff0c;为我们带来了更加便捷和舒适的使用体验&#xff0c;同时也让我们能够更加自由地享受音乐和其他娱乐内容。因此&#xff0c;如果你正在寻找一款高品质的气传导耳机&#xff0c;不妨考虑一下以下气传导耳机的推荐&#xff01; Top1&#xff1a;南…

【斗破苍穹】天府联盟成立,三大势力加入,美杜莎缺席副盟主

Hello,小伙伴们&#xff0c;我是小郑继续为大家深度解析【斗破苍穹】 在斗破苍穹中&#xff0c;身为主角的萧炎可以说建立了不少势力&#xff0c;最开始是磐门&#xff0c;这算是一个很小的势力&#xff0c;成员都是迦南学院的学生&#xff0c;而且战力普遍不高&#xff0c;全靠…

从零开始的Hadoop学习(六)| HDFS读写流程、NN和2NN工作机制、DataNode工作机制

1. HDFS的读写流程&#xff08;面试重点&#xff09; 1.1 HDFS写数据流程 1.1.1 剖析文件写入 &#xff08;1&#xff09;客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件&#xff0c;NameNode检查目标文件是否已存在&#xff0c;父目录是否存在。 &#x…

持续集成与持续交付(CI/CD):探讨在云计算中实现快速软件交付的最佳实践

文章目录 持续集成&#xff08;CI&#xff09;的最佳实践持续交付&#xff08;CD&#xff09;的最佳实践云计算环境下的特别注意事项 &#x1f388;个人主页&#xff1a;程序员 小侯 &#x1f390;CSDN新晋作者 &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 ✨收录专栏&am…

基于微信小程序的反诈科普平台

任何系统都要遵循系统设计的基本流程&#xff0c;本系统也不例外&#xff0c;同样需要经过市场进行调研&#xff0c;论文需求进行分析&#xff0c;概要设计&#xff0c;系统详细设计&#xff0c;测试和编码等步骤&#xff0c;设计并实现了反诈科普平台。系统选用java语言&#…

带量采购药品数据查询集采分析平台(建议收藏!)

药品集采常态化下对不同中标企业的影响不尽相同&#xff0c;对于市场份额较大且拥有多款重要药品的大型企业来说&#xff0c;集采能够保持其市场份额&#xff0c;尽管被集采的药品可能会面临销售下降的局面&#xff0c;但该企业还有其他产品可以填补&#xff0c;整体影响不大。…

学习Bootstrap 5的第一天

目录 Bootstrap 简介 什么是 Bootstrap 5&#xff1f; Bootstrap5 与3 & 4的对比 总体对比&#xff1a; 具体对比&#xff1a; 起源 为什么要使用 Bootstrap&#xff1f; Bootstrap 5 包含的内容 Bootstrap5 实例 Bootstrap5 安装使用 使用 Bootstrap5 CDN 国内…

有名管道FIFO

目录 1、概述2、通过命令创建有名管道3、通过函数创建有名管道4、有名管道读写操作5、有名管道注意事项 1、概述 管道&#xff0c;由于没有名字&#xff0c;只能用于亲缘关系的进程间通信。为了克服这个缺点&#xff0c;提出了命名管道&#xff08;FIFO&#xff09;&#xff0…

风向变了!全域电子架构争夺战打响,玩家如何抢夺“软”黄金?

进入2023年&#xff0c;智能汽车已经进入了硬件快速革新的全新周期。从分布式架构到功能集成的域控制架构&#xff0c;再到如今的中央集中式电子架构&#xff0c;新一轮的产业链格局重塑已经启动。 在8月30日举办的2023年度&#xff08;第十五届&#xff09;高工智能汽车开发者…

Web3 社交平台如何脱颖而出?我们和 PoPP 聊了聊

能够颠覆 Web2 传统模式的社交产品有着怎样的特征&#xff1f;PoPP 作为专注于 Web3 的私域流量变现平台&#xff0c;为开发者和用户提供了社交产品发展的新路径&#xff0c;让社区用户充分实现互动交流&#xff0c;着力于创作内容的激励与变现。事实上&#xff0c;面对 Web3 社…

沐风老师3DMAX厨房橱柜生成器KitchenCabinetGenerator教程

3DMAX厨房橱柜生成器插件使用方法 3DMAX橱柜生成器KitchenCabinetGenerator是一个在3dMax中自动创建三维橱柜模型的高效脚本。它有多种风格的台面、门和橱柜&#xff0c;可以灵活地应用于Archviz项目&#xff0c;同时为3D艺术家节省大量时间。 【适用版本】 1.3dMax2018 – 20…