Python轻松匹配文件:详解文件匹配和搜索技巧

news2025/1/10 0:11:00

更多资料获取

📚 个人网站:ipengtao.com


文件匹配和搜索是日常编程中不可避免的任务,Python 提供了多种强大的工具来轻松应对这些需求。本文将深入探讨 Python 中文件匹配的不同方法,并通过丰富的示例代码演示如何灵活应用这些技巧,以提高文件操作的效率。

使用 glob 模块进行简单文件匹配

glob 模块提供了一种简单而直观的文件匹配方式,支持通配符。

示例代码

import glob

# 匹配当前目录下所有的 .txt 文件
files = glob.glob('*.txt')
print("匹配的文件:", files)

正则表达式匹配文件名

正则表达式是一个更加灵活的工具,允许定义更复杂的文件名匹配规则。

示例代码

import re
import os

# 匹配以 _pattern.txt 结尾的文件名
pattern = re.compile(r'.*_pattern\.txt')
files = [file for file in os.listdir() if pattern.match(file)]
print("匹配的文件:", files)

使用 fnmatch 模块进行模糊匹配

fnmatch 模块提供了一种简洁的通配符匹配方式,类似于 shell 中的语法。

示例代码

import fnmatch

# 匹配当前目录下所有以 .csv 结尾的文件
files = [file for file in os.listdir() if fnmatch.fnmatch(file, '*.csv')]
print("匹配的文件:", files)

文件搜索和递归匹配

有时需要递归地搜索目录下的文件,包括所有子目录中的文件。

示例代码

def search_files(directory, pattern):
    matches = []
    for root, _, files in os.walk(directory):
        for file in fnmatch.filter(files, pattern):
            matches.append(os.path.join(root, file))
    return matches

# 递归匹配当前目录下所有以 .log 结尾的文件
search_result = search_files('.', '*.log')
print("递归匹配的文件:", search_result)

文件匹配的高级应用:pathlib 模块

Python 3.4+ 引入的 pathlib 模块为路径操作提供了面向对象的接口,更加直观和方便。

示例代码

from pathlib import Path

# 高级匹配:匹配当前目录及其所有子目录下所有以 .txt 结尾的文件
path = Path('.')
files = list(path.glob('**/*.txt'))
print("高级匹配的文件:", files)

文件过滤和操作的实际场景

在实际项目中,文件匹配通常不仅仅是找到文件名,还涉及到筛选和处理文件内容。以下是一些实际场景的高级用法:

读取匹配文件的内容

有时,需要读取匹配到的文件的内容,进行进一步的处理或分析。

示例代码

import glob

# 匹配当前目录下所有的 .txt 文件
txt_files = glob.glob('*.txt')

# 读取每个文件的内容
for file in txt_files:
    with open(file, 'r') as f:
        content = f.read()
        # 进行进一步的处理
        # ...

# 或者使用列表推导式一次性读取所有文件的内容
contents = [open(file, 'r').read() for file in txt_files]

批量重命名匹配文件

在某些情况下,可能需要对匹配到的文件进行批量重命名。

示例代码

import os
import glob

# 匹配当前目录下所有的 .jpg 文件
jpg_files = glob.glob('*.jpg')

# 批量重命名文件
for i, file in enumerate(jpg_files, start=1):
    new_name = f"image_{i}.jpg"
    os.rename(file, new_name)
    print(f"文件 {file} 重命名为 {new_name}")

文件筛选和统计

有时候,需要根据文件内容进行筛选和统计。

示例代码

import os
import glob

# 匹配当前目录下所有的 .log 文件
log_files = glob.glob('*.log')

# 根据关键词筛选文件
keyword = 'error'
error_logs = [file for file in log_files if keyword in open(file, 'r').read()]

# 统计错误日志数量
error_count = len(error_logs)
print(f"包含关键词 '{keyword}' 的错误日志数量:{error_count}")

扩展:使用 pandas 进行数据分析

如果匹配到的文件是结构化数据,例如 CSV 文件,可以使用 pandas 进行数据分析。

示例代码

import glob
import pandas as pd

# 匹配当前目录下所有的 .csv 文件
csv_files = glob.glob('*.csv')

# 读取所有 CSV 文件并合并
dfs = [pd.read_csv(file) for file in csv_files]
merged_df = pd.concat(dfs, ignore_index=True)

# 进行数据分析
# ...

总结

在本文中,深入研究了Python中文件匹配和操作的多种强大技巧,涵盖了glob模块、正则表达式、fnmatch模块、递归搜索、pathlib模块等多种工具。通过丰富的示例代码,详细展示了如何灵活运用这些技巧,从而高效处理文件的筛选、读取、重命名等操作。

从简单的文件名匹配到高级的数据分析,介绍了不同场景下的实际应用,包括读取文件内容、批量重命名、文件筛选和统计,甚至结合pandas库进行数据分析。这使得大家能够更全面地理解如何在实际项目中运用这些技术,提高文件操作的灵活性和效率。

总体而言,文件匹配和操作是编程中不可或缺的一部分,而Python提供的工具和库为这些任务提供了简单而强大的解决方案。通过深入学习并实际应用这些技术,能够更高效地处理各种文件操作,提升编程技能。


Python学习路线

在这里插入图片描述

更多资料获取

📚 个人网站:ipengtao.com

如果还想要领取更多更丰富的资料,可以点击文章下方名片,回复【优质资料】,即可获取 全方位学习资料包。

在这里插入图片描述
点击文章下方链接卡片,回复【优质资料】,可直接领取资料大礼包。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1322240.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Apache Doris 在奇富科技的统一 OLAP 场景探索实践

导读:随着消费信贷规模快速增长,个人信贷市场呈现场景化、体验感强的特征,精准营销、精细化风险管理以及用户使用体验的优化愈发重要。作为中国卓越的由人工智能驱动的信贷科技服务平台,奇富科技选择将 Apache Doris 作为整体 OLA…

Arcgis中利用模型构建器统一栅格数据的行列号

1、统一(X,Y) 方法:"数据管理工具箱"→"Projections and Transformations"→"Raster"→"Project Raster" 构建模型 这里以行列号最小的栅格(X,Y)为准(其实也就是栅格数据的空…

2024年【金属非金属矿山(地下矿山)安全管理人员】考试题及金属非金属矿山(地下矿山)安全管理人员考试内容

题库来源:安全生产模拟考试一点通公众号小程序 金属非金属矿山(地下矿山)安全管理人员考试题是安全生产模拟考试一点通总题库中生成的一套金属非金属矿山(地下矿山)安全管理人员考试内容,安全生产模拟考试…

Opencv C++ 绘制中文

零、源码 GitHub - ITC-AI/Opencv_Chinese: C 的 Opencv绘制中文 一、代码编写 参考 https://blog.csdn.net/long630576366/article/details/131440684 1、cvxFont.h #ifndef OPENCVUNICODE_CVXFONT_H #define OPENCVUNICODE_CVXFONT_H#include <ft2build.h> #inclu…

windows安装conda小环境 windows安装anaconda python jupyter anaconda

windows安装anaconda之后&#xff0c;再安装本地的jupyter 1 如果想体验在线版的jupyter&#xff0c;可以访问anaconda在Anaconda Cloud&#xff0c;需要注册github&#xff1a; 1 下载anaconda &#xff0c;并安装 1.1 下载 或者去清华镜像下载 Free Download | Anacondah…

黑马头条--day03--2.文章发布

一.发布文章 1.表结构分析 wm_material 素材表 wm_news_material 文章素材关系表 2.关联表实体类 package com.heima.model.wemedia.pojos;import com.baomidou.mybatisplus.annotation.IdType; import com.baomidou.mybatisplus.annotation.TableField; import com.baomido…

postman和代码里面如何增加鉴权

postman配置toekn: 方法1&#xff1a; 方法2&#xff1a; get请求在postman中使用的时候&#xff0c;authorization中带bearer token&#xff0c;那么使用Python构造get请求时&#xff0c;该token应该怎么带入呢&#xff1f; 解决方法如下&#xff1a; url_user "htt…

Linux Docker本地部署WBO在线协作白板结合内网穿透远程访问

文章目录 前言1. 部署WBO白板2. 本地访问WBO白板3. Linux 安装cpolar4. 配置WBO公网访问地址5. 公网远程访问WBO白板6. 固定WBO白板公网地址 前言 WBO在线协作白板是一个自由和开源的在线协作白板&#xff0c;允许多个用户同时在一个虚拟的大型白板上画图。该白板对所有线上用…

大数据机器学习-梯度下降:从技术到实战的全面指南

大数据机器学习-梯度下降&#xff1a;从技术到实战的全面指南 文章目录 大数据机器学习-梯度下降&#xff1a;从技术到实战的全面指南一、简介什么是梯度下降&#xff1f;为什么梯度下降重要&#xff1f; 二、梯度下降的数学原理代价函数&#xff08;Cost Function&#xff09;…

明理信息科技打造专属个人或企业知识付费平台,核心功能设计

在当今信息爆炸的时代&#xff0c;知识管理已经成为了每个人必须面对的问题。然而&#xff0c;市面上的知识付费平台大多数都是通用的&#xff0c;无法满足个性化需求。 因此&#xff0c;明理信息科技提供了一款专属定制的适合个人的知识付费平台。核心产品能力如下&#xff1…

TikTok获客怎么做?可以定制一个获客工具!

随着社交媒体的兴起&#xff0c;越来越多的企业开始将目光投向了短视频平台&#xff0c;TikTok作为其中的佼佼者&#xff0c;凭借其独特的算法和内容推荐机制&#xff0c;吸引了大量用户的关注。 那么&#xff0c;如何在TikTok上获取更多的客户呢?本文将为您揭秘TikTok获客的…

基于JAVA的海南旅游景点推荐系统 开源项目

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 用户端2.2 管理员端 三、系统展示四、核心代码4.1 随机景点推荐4.2 景点评价4.3 协同推荐算法4.4 网站登录4.5 查询景点美食 五、免责说明 一、摘要 1.1 项目介绍 基于VueSpringBootMySQL的海南旅游推荐系统&#xff…

Codeforces Round 915(Div.2) A~C(D,E更新中...)

A.Constructive Problems(思维) 题意&#xff1a; 给出一个 n m n \times m nm的网格&#xff0c;你需要将网格上所有点均填满水&#xff0c;当一个格子同时满足以下两个条件时&#xff0c;格子中也会被填满水&#xff1a; 该格子的左边或右边已经被填满水了 该格子的上面或…

什么是低代码(Low-code) 低代码开发平台特点-优势介绍

随着数字化转型的加速&#xff0c;越来越多的企业开始认识到应用开发的重要性。然而&#xff0c;传统的应用开发方式往往需要耗费大量的时间和资源&#xff0c;而且开发周期长&#xff0c;难以满足企业的快速需求。在这样的背景下&#xff0c;Low Code Platform(低代码平台)应运…

算法分析与设计课后练习26

单源最短路径问题 第一组测试参数 const int n = 6; //图顶点个数加1 int c[n][n] = {{0,0,0,0,0,0}, {0,0,2,3,5000,5000}, {0,5000,0,1,2,5000}, {0,5000,5000,0,9,2}, {0,5000,5000,5000,0,2}, {0,5000,5000,5000,5000,0}}; // 图的邻接矩阵 第二组测试参数 const int n =…

HuatuoGPT模型介绍

文章目录 HuatuoGPT 模型介绍LLM4Med&#xff08;医疗大模型&#xff09;的作用ChatGPT 存在的问题HuatuoGPT的特点ChatGPT 与真实医生的区别解决方案用于SFT阶段的混合数据基于AI反馈的RL 评估单轮问答多轮问答人工评估 HuatuoGPT 模型介绍 HuatuoGPT&#xff08;华佗GPT&…

JavaSE 排序

目录 1 概念1.1 排序1.2 稳定性 2 常见基于比较排序算法总览3 插入排序3.1 直接插入排序3.1.1 思想3.1.2 实现3.1.3 性能分析 3.2 折半插入排序3.2.1 思想3.2.2 实现3.2.3 性能分析 3.3 希尔排序3.3.1 思想3.3.2 实现3.3.3 性能分析 4 选择排序4.1 选择排序4.1.1 思想4.1.2 实现…

构建可扩展的网校平台:在线教育系统源码设计与架构最佳实践

随着科技的不断发展&#xff0c;在线教育系统在教育领域扮演着越来越重要的角色。本文将深入探讨如何构建一个可扩展的网校平台&#xff0c;重点关注在线教育系统的源码设计和架构最佳实践。 一、引言 在当前信息时代&#xff0c;教育已经超越了传统的教学方式&#xff0c;转…

cleanmymac有必要买吗 macbook空间不足怎么办 清理macbook磁盘空间

大家早上好&#xff0c;中午好&#xff0c;下午好&#xff0c;晚上好。 文章有点长&#xff0c;建议先收藏。 macbook是一款非常受欢迎的笔记本电脑&#xff0c;它拥有优秀的性能和设计&#xff0c;但是也有一个常见的问题&#xff0c;就是磁盘空间不足。如果你的macbook经常…

意外之喜!5款小巧工具助你轻松面对繁忙生活

​ 在繁忙的日常中&#xff0c;简单而巧妙的小工具能够带来意外的惊喜。这五款工具或许正是你所需要的&#xff0c;不妨一试。 1.图片背景移除——PhotoScissors ​ PhotoScissors是一款图片背景移除工具&#xff0c;可以使用人工智能技术自动识别图片的前景和背景&#xff0…