照片EXIF数据统计与可视化

news2025/1/13 15:28:48

拍的照片越来越多,想要了解一下日常拍摄的习惯,便于后面换镜头、调整参数等操作,所以写了这个脚本来统计照片的EXIF数据。该脚本用于统计指定文件夹下所有JPG图片的EXIF数据,包括快门速度、ISO、焦距、光圈和拍摄时间,并生成相应的分布图。在使用时,需要将文中的代码段都粘贴到同一个文件中,然后修改folder_path变量为你要处理的文件夹路径,运行脚本即可。以下是脚本的详细说明。

依赖

  • Python 3.x
  • exifread库:用于读取图片的EXIF数据
  • matplotlib库:用于绘制分布图
  • numpy库:用于处理数值数据
  • pathlib库:用于处理文件路径
  • collections.Counter:用于统计频率

安装依赖

使用以下命令安装所需的Python库:

pip install exifread matplotlib numpy

使用方法

  1. 将脚本保存为photo_statistic.py
  2. 修改脚本中的folder_path变量,设置为你要处理的文件夹路径。
  3. 运行脚本:
python photo_statistic.py

代码说明

导入依赖

from pathlib import Path
import exifread
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import numpy as np
from collections import Counter

获取EXIF数据

get_exif_data函数用于读取图片的EXIF数据,并提取快门速度、ISO、焦距、光圈和拍摄时间。

def get_exif_data(image_path):
    with open(image_path, 'rb') as f:
        tags = exifread.process_file(f)
        shutter_speed = tags.get('EXIF ExposureTime') or tags.get('EXIF ShutterSpeedValue')
        iso = tags.get('EXIF ISOSpeedRatings')
        focal_length = tags.get('EXIF FocalLength')
        aperture = tags.get('EXIF FNumber') or tags.get('EXIF ApertureValue')
        datetime = tags.get('EXIF DateTimeOriginal') or tags.get('Image DateTime')
        return {
                    'file': image_path,
                    'shutter_speed': shutter_speed,
                    'iso': iso,
                    'focal_length': focal_length,
                    'aperture': aperture,
                    'datetime': datetime
                }

处理文件夹中的图片

process_images_in_folder函数遍历指定文件夹下的所有JPG图片,并调用get_exif_data函数获取每张图片的EXIF数据。

def process_images_in_folder(folder_path):
    results = []
    folder = Path(folder_path)
    for image_path in folder.rglob('*.jpg'):
        results.append(get_exif_data(image_path))
    return results

绘制统计图

plot_statistics函数用于绘制快门速度、ISO、焦距和光圈的分布图,并统计指定焦距的时间分布。

def plot_statistics(results):
    shutter_speeds = [float(result['shutter_speed'].values[0]) for result in results if result['shutter_speed']]
    isos = [int(result['iso'].values[0]) for result in results if result['iso']]
    focal_lengths = [float(result['focal_length'].values[0].num) / float(result['focal_length'].values[0].den) for result in results if result['focal_length']]
    apertures = [float(result['aperture'].values[0].num) / float(result['aperture'].values[0].den) for result in results if result['aperture']]
    dates = [result['datetime'].values.split(' ')[0].replace(':', '.') for result in results if result['datetime']]
    
    # 删除快门速度大于阈值的数据
    shutter_speeds_thres = 0.1
    shutter_speeds = [speed for speed in shutter_speeds if speed <= shutter_speeds_thres]
    
    fig, axs = plt.subplots(2, 1)
    # 将快门速度转换为分数格式
    def format_shutter_speed(speed):
        return (f"1/{(1/speed):.0f}" if speed != 0 else "0") if speed < 1 else str(speed)
    # 绘制快门速度分布图并将x轴刻度标签设置为分数格式
    axs[0].hist(shutter_speeds, bins=100, color='blue', edgecolor='black')
    axs[0].set_title('Shutter Speed Distribution' + f' (Threshold: {shutter_speeds_thres}s)')
    axs[0].set_xlabel('Shutter Speed (s)')
    # 使用分数表示快门速度
    axs[0].xaxis.set_major_formatter(ticker.FuncFormatter(lambda x, _: format_shutter_speed(x)))
    axs[0].set_ylabel('Frequency')
    axs[1].hist(focal_lengths, bins=100, color='red', edgecolor='black')
    axs[1].set_title('Focal Length Distribution')
    axs[1].set_xlabel('Focal Length (mm)')
    axs[1].set_ylabel('Frequency')
    plt.tight_layout()
    # 标出频率最高的N个焦距
    N = 6
    focal_length_counts = np.bincount(focal_lengths)
    most_common_focal_lengths = np.argsort(focal_length_counts)[-N:][::-1]
    for focal_length in most_common_focal_lengths:
        axs[1].text(focal_length, focal_length_counts[focal_length], str(focal_length), color='black')
        
    # 统计所有时间的频率
    dates_freq = Counter(dates)
    # 统计指定焦距的时间分布
    def get_focal_length_time_distribution(results, focal_length):
        date_of_focal_length = []
        for result in results:
            if result['focal_length'] and result['focal_length'].values[0].num / result['focal_length'].values[0].den == focal_length:
                date_of_focal_length.append(result['datetime'].values)
        date_of_focal_length.sort()
        # 以空格分隔时间字符串,只保留日期部分
        date_of_focal_length = [time.split(' ')[0].replace(':', '.') for time in date_of_focal_length]
        # 统计相同时间的频率
        return Counter(date_of_focal_length)
    prefix_focal_length = 50
    focal_length_200mm_freq = get_focal_length_time_distribution(results, prefix_focal_length)

    fig, ax = plt.subplots()
    # dates_freq排序
    dates_freq = dict(sorted(dates_freq.items()))
    ax.barh(list(dates_freq.keys()), list(dates_freq.values()), alpha=0.5, label='All')
    ax.barh(list(focal_length_200mm_freq.keys()), list(focal_length_200mm_freq.values()), label='Focal Length ' + str(prefix_focal_length) + 'mm')
    ax.legend()
    ax.set_xlabel('Frequency')
    ax.set_ylabel('Date')
    plt.show()

主函数

main函数设置文件夹路径,并调用process_images_in_folderplot_statistics函数。

def main():
    folder_path = 'c:/Users/25503/Desktop/照片合集'
    results = process_images_in_folder(folder_path)
    plot_statistics(results)

if __name__ == "__main__":
    main()

运行结果

在这里插入图片描述
在这里插入图片描述

注意事项

  • 确保文件夹路径正确,并且文件夹中包含JPG格式的图片。
  • 脚本会读取图片的EXIF数据,如果图片没有EXIF数据,相关统计信息将无法获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2155009.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络资源模板--Android Studio 仿WeChat聊天App

目录 一、项目演示 二、项目测试环境 三、项目详情 四、完整的项目源码 一、项目演示 网络资源模板--仿微信聊天App 二、项目测试环境 三、项目详情 登陆注册 ### 登录功能&#xff08;LoginActivity&#xff09; 1. **界面初始化**&#xff1a;设置界面元素&#xff0c;包…

二叉树---java---黑马

二叉树 遍历 遍历分两种 广度优先遍历 尽可能先访问距离根节点最近的节点&#xff0c;也称之为层序遍历。 深度优先遍历 对于二叉树&#xff0c;进一步分为三种 pre-order前序遍历&#xff0c;对于每一颗子树&#xff0c;先访问该节点&#xff0c;然后是左子树&#xf…

银河麒麟桌面操作系统如何添加WPS字体

银河麒麟桌面操作系统如何添加WPS字体 1、使用场景2、操作方法步骤一&#xff1a;下载字体文件步骤二&#xff1a;打开终端步骤三&#xff1a;进入字体文件所在目录步骤四&#xff1a;拷贝字体文件到WPS字体目录步骤五&#xff1a;更新字体缓存步骤六&#xff1a;重启WPS Offic…

C++ 把字符串转换成整数 (atoi) - 力扣(LeetCode)

点击链接即可查看&#xff1a;LCR 192. 把字符串转换成整数 (atoi) - 力扣&#xff08;LeetCode&#xff09; 一、题目 请你来实现一个 myAtoi(string s) 函数&#xff0c;使其能将字符串转换成一个 32 位有符号整数&#xff08;类似 C/C 中的 atoi 函数&#xff09;。 函数 my…

基于协同过滤算法的商品推荐系统

系统展示 用户前台界面 管理员后台界面 商家后台界面 系统背景 随着互联网技术的飞速发展&#xff0c;用户每天面临的信息量呈爆炸式增长&#xff0c;如何有效地筛选出用户感兴趣的内容成为一大挑战。在此背景下&#xff0c;基于协同过滤算法的商品推荐系统应运而生。该系统通过…

Th:1.1 建立连接

基础讲解 1.TCP通信流程 基于TCP通信的Socket基本流程: 1.1 Socket 函数返回值&#xff1a;一个文件描述符&#xff1a; 特别的两个队列。 #include <sys/types.h> #include <sys/socket.h> //create an endpoint for communication int socket(int …

【Mysql】Centos 安装 Mysql8.0

官网下载安装包 官网地址&#xff1a;MySQL :: Download MySQL Community Server 查看服务器的名称和版本号 lsb_release -a 查看服务的架构 uname -m 下载对应的版本&#xff0c;这里操作系统选择 Red Hat 就可以了。&#xff08;CentOS 就是将 RHEL 发行的源代码从新编译…

基于redis的HyperLogLog数据结构实现的布隆过滤器在信息流中历史数据的应用

一、基于redis的HyperLogLog数据结构实现的布隆过滤器在信息流中历史数据的应用 做信息流服务端的左发一定会遇到用户历史数据的集合&#xff0c;对于一些有限信息流&#xff08;因DT数据中心的推荐数据变化较慢&#xff0c;推荐量不大&#xff09;&#xff0c;历史数据可以使用…

Abaqus 2024百度云下载:附中文安装包+教程

正如大家所熟知的&#xff0c;Abaqus是一款有限元分析软件&#xff0c;能够高效的配合工程师完成创作。它可以高精度地实现包括金属、橡胶、高分子材料、复合材料、钢筋混凝土、可压缩超弹性泡沫材料以及土壤和岩石等地质材料的工程仿真计算。 “Abaqus”不仅具有出色的仿真计…

TomCat乱码问题

TomCat控制台乱码问题 乱码问题解决&#xff1a; 响应乱码问题 向客户端响应数据&#xff1a; package Servlet;import jakarta.servlet.ServletException; import jakarta.servlet.annotation.WebServlet; import jakarta.servlet.http.HttpServlet; import jakarta.servl…

【pyVista】在三维模型中的网格属性

一&#xff0c;什么是属性&#xff1f; 属性是存在于 一个网格。在 PyVista 中&#xff0c;我们同时使用点数据和单元数据&#xff0c;并且 允许轻松访问数据字典以保存属性数组 它们位于网格的所有点或所有单元上。 点数据 点数据是指值数组&#xff08;标量、向量等&#x…

https的连接过程

根证书: 内置在操作系统和浏览器中,可手动添加,下级是中间证书或服务器证书,只有当中间证书或服务器证书关联到已存在的根证书时,中间证书或服务器证书才视为有效 中间证书: 位于根证书和服务器证书之间,他们之间也可以没有中间证书,作用是对根证书增加一个下级,方便管理,由根…

一款批量下载 B 站动态页图片的脚本

在逛 B 站的时候&#xff0c;总能看到不少 UP 会发很多图片&#xff0c;此时一个一个保存非常麻烦&#xff0c;而且文件名都是随机的字符串&#xff0c;还得手工重命名。 为此&#xff0c;特地搜索了下有没相关的浏览器插件或油猴脚本&#xff0c;还真给我找到一个。 脚本地址…

Kafka 下载安装及使用总结

1. 下载安装 官网下载地址&#xff1a;Apache Kafka 下载对应的文件 上传到服务器上&#xff0c;解压 tar -xzf kafka_2.13-3.7.0.tgz目录结果如下 ├── bin │ └── windows ├── config │ └── kraft ├── libs ├── licenses └── site-docs官方文档…

专注并不意味只做一件事

原创内容第658篇&#xff0c;专注量化投资、个人成长与财富自由。 财务自由本身就是一个很有争议的领域。 有谁能靠别人实现财富自由呢&#xff1f; 这个逻辑起点本身就有问题。 如果预期正确&#xff0c;那这些自媒体还是有用处的。 好比我现在对于阅读和书籍的预期&…

深入解析 Apache Doris架构、应用场景与最佳实践

一、Doris 简介 Apache Doris 是一款现代化的 MPP&#xff08;Massively Parallel Processing&#xff09;数据库&#xff0c;专注于解决大规模数据分析和实时查询的需求。它最初源自百度的 Palo 项目&#xff0c;随后贡献给了 Apache 基金会&#xff0c;并在开源社区的共同努…

『功能项目』QFrameWork框架重构OnGUI【63】

我们打开上一篇62QFrameWork背包框架的项目&#xff0c; 上文将功能实现在一个脚本中 本章要做的事情让脚本实现背包框架思想 首先按照图示创建脚本&#xff1a; 创建脚本&#xff1a;Item.cs namespace QFramework {public class Item{//道具public string Key;public string …

【CSS in Depth 2 精译_033】5.4 Grid 网格布局的显式网格与隐式网格(中)

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第一章 层叠、优先级与继承&#xff08;已完结&#xff09; 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结 第二章 相对单位&#xff08;已完结&#xff09; 2.1 相对…

C++速通LeetCode中等第18题-删除链表的倒数第N个结点(最简单含注释)

绝妙&#xff01;快慢指针法,快指针先走n步&#xff08;复杂度O(n),O(1))&#xff1a; /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(n…

GS-SLAM论文阅读笔记--TAMBRIDGE

前言 本文提出了一个自己的分类方法&#xff0c;传统的视觉SLAM通常使用以帧为中心的跟踪方法&#xff0c;但是3DGS作为一种高效的地图表达方法好像更侧重于地图的创建。这两种方法都有各自的优缺点&#xff0c;但是如果能取长补短&#xff0c;互相结合&#xff0c;那么就会是…