深入解析 KMZ 文件的处理与可视化:从数据提取到地图展示项目实战

news2025/1/16 14:52:38

文章目录

      • 1. KMZ 文件与 KML 文件简介
        • 1.1 KMZ 文件
        • 1.2 KML 文件
      • 2. Python 环境配置与依赖安装
      • 3. 代码实现详解
        • 3.1 查找 KMZ 文件
        • 3.2 解压 KMZ 文件
        • 3.3 解析 KML 文件
        • 3.4 可视化 KMZ 数据
      • 4. 项目实战
        • 4.1. 数据采集
        • 4.2. 项目完整代码
      • 5. 项目运行与结果展示
      • 6. 总结与展望

在处理地理空间数据时,KMZ 文件是一种常见的格式,用于存储地图和地理信息数据。KMZ 文件是 KML 文件的压缩版本,其中 KML(Keyhole Markup Language)用于描述地理数据的格式。本文将详细介绍如何使用 Python 处理 KMZ 文件,提取其中的地理数据,并将其可视化到地图上。本文的核心代码将涉及文件的解压、KML 文件的解析、GPS 数据的提取以及如何使用 Folium 库将数据展示到地图上。

1. KMZ 文件与 KML 文件简介

1.1 KMZ 文件

KMZ 文件是 KML 文件的压缩版本,通常用于存储 Google Earth 或 Google Maps 中使用的地理信息数据。KMZ 文件可以包含一个或多个 KML 文件以及其他资源文件(如图片、图标等)。KML 文件是基于 XML 的格式,用于描述地理数据的标记、路径、区域等信息。

1.2 KML 文件

KML 文件由 XML 构成,用于存储地理数据,如地点标记、线条、区域、图像叠加等。KML 的基本结构包括:

  • Placemark:标记点
  • Point:点类型
  • LineString:线条
  • Polygon:多边形
  • TimeStamp:时间戳

2. Python 环境配置与依赖安装

在开始之前,确保你的 Python 环境中已经安装了以下依赖:

  • folium:用于地图可视化
  • xml.etree.ElementTree:用于解析 XML 文件
  • zipfile:用于解压 KMZ 文件
  • glob:用于文件路径匹配

可以使用以下命令安装所需的库:

pip install folium

3. 代码实现详解

3.1 查找 KMZ 文件
import os
import glob

def find_kmz_files(directory):
    # 使用 glob 模块查找指定目录下的所有 .kmz 文件
    kmz_files = glob.glob(os.path.join(directory, '*.kmz'))
    return kmz_files
  • 功能:遍历指定目录,查找所有以 .kmz 结尾的文件。
  • 实现:使用 glob 模块和通配符模式来匹配所有 KMZ 文件。
3.2 解压 KMZ 文件
import zipfile

def extract_kml_from_kmz(kmz_file_path):
    # 解压 KMZ 文件
    with zipfile.ZipFile(kmz_file_path, 'r') as kmz:
        # 查找 KML 文件
        kml_files = [name for name in kmz.namelist() if name.lower().endswith('.kml')]
        if kml_files:
            kml_file_path = kml_files[0]
            kmz.extract(kml_file_path, os.path.dirname(kmz_file_path))
            return os.path.join(os.path.dirname(kmz_file_path), kml_file_path)
    return None
  • 功能:解压 KMZ 文件,并提取其中的 KML 文件。
  • 实现:使用 zipfile 模块打开 KMZ 文件,查找并解压 KML 文件。
3.3 解析 KML 文件
import xml.etree.ElementTree as ET

def parse_kml(kml_file_path):
    gps_data = []
    tree = ET.parse(kml_file_path)
    root = tree.getroot()
    
    # KML 的 XML namespace
    namespace = {'kml': 'http://earth.google.com/kml/2.2'}
    print(f"Root element: {root.tag}")
    
    # 查找所有 Placemark 元素
    for placemark in root.findall('.//kml:Placemark', namespace):
        coordinates = placemark.find('.//kml:Point/kml:coordinates', namespace)
        
        if coordinates is not None:
            coords = coordinates.text.strip().split(',')
            if len(coords) >= 3:
                try:
                    longitude = float(coords[0])
                    latitude = float(coords[1])
                    altitude = float(coords[2])
                    gps_data.append({
                        'latitude': latitude,
                        'longitude': longitude,
                        'altitude': altitude
                    })
                except ValueError as e:
                    print(f"Error parsing coordinates: {e}")
    return gps_data
  • 功能:解析 KML 文件,提取 GPS 数据(经纬度和高度)。
  • 实现:使用 xml.etree.ElementTree 解析 XML 格式的 KML 文件,通过查找 Placemark 元素和 coordinates 元素来获取地理数据。
3.4 可视化 KMZ 数据
import folium
from folium.features import CustomIcon

def visualize_multiple_kmz_data(kmz_data_list):
    if not kmz_data_list:
        print("No GPS data available to visualize.")
        return

    # 计算所有经纬度的平均值,作为地图的中心
    all_latitudes = []
    all_longitudes = []
    
    for kmz_data in kmz_data_list:
        latitudes = [data['latitude'] for data in kmz_data['gps_data']]
        longitudes = [data['longitude'] for data in kmz_data['gps_data']]
        all_latitudes.extend(latitudes)
        all_longitudes.extend(longitudes)

    avg_latitude = sum(all_latitudes) / len(all_latitudes)
    avg_longitude = sum(all_longitudes) / len(all_longitudes)
    
    map_center = [avg_latitude, avg_longitude]
    
    gps_map = folium.Map(location=map_center, zoom_start=14, tiles='OpenStreetMap')

    folium.TileLayer(
        tiles='https://mt1.google.com/vt/lyrs=s&x={x}&y={y}&z={z}',
        name='Google Satellite',
        attr='© Google'
    ).add_to(gps_map)

    folium.LayerControl().add_to(gps_map)

    # 为每个 KMZ 文件使用不同的颜色
    colors = ['red', 'blue', 'green', 'purple', 'orange', 'darkred', 'lightred', 
              'beige', 'darkblue', 'darkgreen', 'cadetblue', 'darkpurple', 'white', 
              'pink', 'lightblue', 'lightgreen', 'gray', 'black', 'lightgray']

    for idx, kmz_data in enumerate(kmz_data_list):
        color = colors[idx % len(colors)]
        
        for data in kmz_data['gps_data']:
            folium.CircleMarker(
                [data['latitude'], data['longitude']],
                radius=0.5,  # 半径大小
                color=color,  # 边框颜色
                fill=True,
                fill_color=color,  # 填充颜色
                fill_opacity=0.8
            ).add_to(gps_map)
        
        # 绘制路径线并添加箭头
        for i in range(1, len(kmz_data['gps_data'])):
            start_point = kmz_data['gps_data'][i-1]
            end_point = kmz_data['gps_data'][i]

            # 绘制线条
            folium.PolyLine(
                locations=[(start_point['latitude'], start_point['longitude']),
                           (end_point['latitude'], end_point['longitude'])],
                color=color,
                weight=2
            ).add_to(gps_map)

            # 添加箭头
            folium.Marker(
                location=[(start_point['latitude'] + end_point['latitude']) / 2,
                          (start_point['longitude'] + end_point['longitude']) / 2],
                icon=CustomIcon('https://upload.wikimedia.org/wikipedia/commons/e/e5/Black_triangle_pointing_right.svg',
                                icon_size=(10, 10), icon_anchor=(5, 5))
            ).add_to(gps_map)
        
    gps_map.save('multiple_kmz_map.html')
    print("GPS map saved as 'multiple_kmz_map.html'.")
  • 功能:将多个 KMZ 文件的数据可视化到一个地图上,使用不同的颜色表示不同的 KMZ 文件。
  • 实现
    • 计算所有点的平均经纬度作为地图的中心。
    • 使用 folium.Map 创建地图,并添加地图图层。
    • 对每个 KMZ 文件使用不同的颜色,并将其 GPS 数据以 CircleMarker 的形式添加到地图上。

绘制路径线,并在路径中添加箭头指示方向。

4. 项目实战

4.1. 数据采集

两个kmz文件:
在这里插入图片描述
其中一个kmz文件解压,会看到有一个kml文件:
在这里插入图片描述
kml文件打开,会看到一些关键信息,以下是部分信息截图:
在这里插入图片描述

4.2. 项目完整代码
import os
import glob
import folium
import zipfile
import xml.etree.ElementTree as ET
from folium.features import CustomIcon

def find_kmz_files(directory):
    kmz_files = glob.glob(os.path.join(directory, '*.kmz'))
    return kmz_files

def extract_kml_from_kmz(kmz_file_path):
    with zipfile.ZipFile(kmz_file_path, 'r') as kmz:
        kml_files = [name for name in kmz.namelist() if name.lower().endswith('.kml')]
        if kml_files:
            kml_file_path = kml_files[0]
            kmz.extract(kml_file_path, os.path.dirname(kmz_file_path))
            return os.path.join(os.path.dirname(kmz_file_path), kml_file_path)
    return None

def parse_kml(kml_file_path):
    gps_data = []
    tree = ET.parse(kml_file_path)
    root = tree.getroot()
    namespace = {'kml': 'http://earth.google.com/kml/2.2'}
    
    for placemark in root.findall('.//kml:Placemark', namespace):
        coordinates = placemark.find('.//kml:Point/kml:coordinates', namespace)
        
        if coordinates is not None:
            coords = coordinates.text.strip().split(',')
            if len(coords) >= 3:
                try:
                    longitude = float(coords[0])
                    latitude = float(coords[1])
                    altitude = float(coords[2])
                    gps_data.append({
                        'latitude': latitude,
                        'longitude': longitude,
                        'altitude': altitude
                    })
                except ValueError as e:
                    print(f"Error parsing coordinates: {e}")
    return gps_data

def visualize_multiple_kmz_data(kmz_data_list):
    if not kmz_data_list:
        print("No GPS data available to visualize.")
        return

    all_latitudes = []
    all_longitudes = []
    
    for kmz_data in kmz_data_list:
        latitudes = [data['latitude'] for data in kmz_data['gps_data']]
        longitudes = [data['longitude'] for data in kmz_data['gps_data']]
        all_latitudes.extend(latitudes)
        all_longitudes.extend(longitudes)

    avg_latitude = sum(all_latitudes) / len(all_latitudes)
    avg_longitude = sum(all_longitudes) / len(all_longitudes)
    
    map_center = [avg_latitude, avg_longitude]
    
    gps_map = folium.Map(location=map_center, zoom_start=14, tiles='OpenStreetMap')

    folium.TileLayer(
        tiles='https://mt1.google.com/vt/lyrs=s&x={x}&y={y}&z={z}',
        name='Google Satellite',
        attr='© Google'
    ).add_to(gps_map)

    folium.LayerControl().add_to(gps_map)

    colors = ['red', 'blue', 'green', 'purple', 'orange', 'darkred', 'lightred', 
              'beige', 'darkblue', 'darkgreen', 'cadetblue', 'darkpurple', 'white', 
              'pink', 'lightblue', 'lightgreen', 'gray', 'black', 'lightgray']

    for idx, kmz_data in enumerate(kmz_data_list):
        color = colors[idx % len(colors)]
        
        for data in kmz_data['gps_data']:
            folium.CircleMarker(
                [data['latitude'], data['longitude']],
                radius=0.5,
                color=color,
                fill=True,
                fill_color=color,
                fill_opacity=0.8
            ).add_to(gps_map)
        
        for i in range(1, len(kmz_data['gps_data'])):
            start_point = kmz_data['gps_data'][i-1]
            end_point = kmz_data['gps_data'][i]

            folium.PolyLine(
                locations=[(start_point['latitude'], start_point['longitude']),
                           (end_point['latitude'], end_point['longitude'])],
                color=color,
                weight=2
            ).add_to(gps_map)

            folium.Marker(
                location=[(start_point['latitude'] + end_point['latitude']) / 2,
                          (start_point['longitude'] + end_point['longitude']) / 2],
                icon=CustomIcon('https://upload.wikimedia.org/wikipedia/commons/e/e5/Black_triangle_pointing_right.svg',
                                icon_size=(10, 10), icon_anchor=(5, 5))
            ).add_to(gps_map)
        
    gps_map.save('multiple_kmz_map.html')
    print("GPS map saved as 'multiple_kmz_map.html'.")

if __name__ == '__main__':
    directory_path = "F:\\notebookComputer\\20240723"
    
    kmz_files = find_kmz_files(directory_path)
    
    if kmz_files:
        kmz_data_list = []
        for kmz_file_path in kmz_files:
            kml_file_path = extract_kml_from_kmz(kmz_file_path)
            if kml_file_path:
                parsed_gps_data = parse_kml(kml_file_path)
                print(f"Parsed GPS data: {parsed_gps_data}")
                kmz_data_list.append({
                    'file_name': os.path.basename(kmz_file_path),
                    'gps_data': parsed_gps_data
                })
        
        if kmz_data_list:
            visualize_multiple_kmz_data(kmz_data_list)
        else:
            print("No GPS data available to visualize.")
    else:
        print(f"No .kmz files found in directory: {directory_path}")

5. 项目运行与结果展示

在代码执行完毕后,将会生成一个名为 multiple_kmz_map.html 的文件,该文件可以用浏览器打开以查看地图上的标记点和路径。地图将会显示所有 KMZ 文件中提取的 GPS 数据,每个文件的标记点使用不同的颜色表示。
multiple_kmz_map.html文件不好截图如下:
在这里插入图片描述
浏览器打开multiple_kmz_map.html文件效果图如下:
在这里插入图片描述

6. 总结与展望

本文详细介绍了如何使用 Python 处理 KMZ 文件,提取其中的 GPS 数据,并通过 Folium 库将其可视化。通过将 KMZ 文件中的地理数据转换为地图标记点和路径线,我们可以更直观地分析和展示地理数据。未来的工作可以包括支持更多的地理数据格式、添加更多的地图样式和功能、以及优化代码的性能和可读性。根据需求,文章可以继续扩展,以包含更多的技术细节、优化建议和实际应用场景的分析。

欢迎点赞|关注|收藏|评论,您的肯定是我创作的动力

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1977432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2007-2023年上市公司国内外专利申请获得情况数据

2007-2023年上市公司国内外专利申请获得情况数据 1、时间:2007-2023年 2、来源:上市公司年报 3、指标:证券代码、统计截止日期、报表类型、地区、申请类型编码、申请类型、专利(件)、发明专利(件&#x…

动态路由协议基础

一、动态路由协议简介 动态路由协议:路由器用来计算和维护路由信息的协议;通俗的说,就算路由器用来学习路由的协议。 二、动态路由与静态路由的区别 静态路由动态路由路由表手工配置自动生成路由维护人工维护自动收敛资源消耗路由表生成不占网络资源路哟表生成占用网络资源…

学习Java的日子 Day59 学生管理系统 web1.0版本

Day59 学生管理系统 web1.0 1.项目需求 有两个角色,老师和学生,相同的功能提取到父类用户角色 2.数据库搭建 设计学生表 设计老师表 插入数据 (超级管理员) 设计学科表 3.项目搭建 处理基础页面,分包,实体类,导入数据…

微软AI业务最新营收数据情况(2024年7月)

Azure AI 年度经常性收入 (ARR):达到50亿美元客户数量:60,000家平均客户价值 (ACV) 中位数:83,000美元同比增长率:达到了惊人的900% GitHub Copilot 年度经常性收入 (ARR):达到3亿美元客户数量:77,000家…

每日两题8

买卖股票的最佳时机 III class Solution { public:int maxProfit(vector<int>& prices) {int n prices.size();int INF 0x3f3f3f3f;vector<vector<int>> f(n, vector<int>(3, -INF));auto g f;g[0][0] 0;f[0][0] -prices[0];for (int i 1; i…

Leetcode3227. 字符串元音游戏

Every day a Leetcode 题目来源&#xff1a;3227. 字符串元音游戏 解法1&#xff1a;博弈论 分类讨论&#xff1a; 如果 s 不包含任何元音&#xff0c;小红输。如果 s 包含奇数个元音&#xff0c;小红可以直接把整个 s 移除&#xff0c;小红赢。如果 s 包含正偶数个元音&am…

10.Redis类型SortedSet

介绍 Redis的SortedSet是一个可排序的set集合。与java的TreeSet有些类似&#xff0c;但底层数据结构却差别很大。 SortedSet中的每个元素都带有一个score属性&#xff0c;可以基于score属性对元素排序&#xff0c;底层实现是一个跳表SkipList加hash表。 特点 可排序 元素不…

“银狐”团伙再度出击:利用易语言远控木马实施钓鱼攻击

PART ONE 概述 自2023年上半年“银狐”工具被披露以来&#xff0c;涌现了多个使用该工具的黑产团伙。这些团伙主要针对国内的金融、教育、医疗、高新技术等企事业单位&#xff0c;集中向管理、财务、销售等从业人员发起攻击&#xff0c;窃取目标资金和隐私信息。该团伙惯用微信…

多旋翼+四光吊舱:5Kg负载无人机技术详解

多旋翼无人机是一种具有三个及以上旋翼轴的无人驾驶飞行器。它通过每个轴上的电动机转动&#xff0c;带动旋翼&#xff0c;从而产生升推力。旋翼的总距固定&#xff0c;不像一般直升机那样可变。通过改变不同旋翼之间的相对转速&#xff0c;可以控制飞行器的运行轨迹。多旋翼无…

Js在线Eval加密混淆及解密运行

具体请前往&#xff1a;Js在线Eval加密混淆及解密运行

自动打电话软件的效果怎么样?

​​使用这个系统&#xff0c;机器人自动拨打电话&#xff0c;真人录制的语音与客户对话&#xff0c;整个过程非常顺畅。而且系统可以每天外呼数千乃至数万通电话&#xff0c;是人工的5-10倍&#xff0c;这样就不需要招聘大量员工来外呼&#xff0c;只需要留下一些优秀的销售人…

动视封禁超过6.5万名《战区》和《MW3》作弊者

动视已经在《使命召唤&#xff1a;战区》和《使命召唤&#xff1a;现代战争3》中封禁了超过65000名玩家。这些封禁在过去的几小时内实施&#xff0c;清除了数千名在排名赛和非排名赛中“作弊和代练”的玩家。 Ricochet反作弊团队现已清理了《使命召唤&#xff1a;战地》和《现代…

【PyTorch】神经风格迁移项目

神经风格迁移中&#xff0c;取一个内容图像和一个风格图像&#xff0c;综合内容图像的内容和风格图像的艺术风格生成新的图像。 目录 准备数据 处理数据 神经风格迁移模型 加载预训练模型 定义损失函数 定义优化器 运行模型 准备数据 创建data文件夹&#xff0c;放入…

人工智能与大数据的融合:驱动未来的力量

人工智能与大数据的融合&#xff1a;驱动未来的力量 一、人工智能与大数据的概述二、人工智能与大数据在数据库中的融合三、实际应用案例四、未来发展方向总结 【纪录片】中国数据库前世今生 在数字化潮流席卷全球的今天&#xff0c;数据库作为IT技术领域的“活化石”&#xff…

16进制转换-系统架构师(三十九)

1、&#xff08;软件架构设计->构件与中间件技术->构件标准&#xff09;对象管理组织&#xff08;OMG&#xff09;基于CORBA基础设施定义了四种构件标准。其中&#xff0c;&#xff08;&#xff09;状态信息是构件自身而不是由容器维护的。 A实体构件 B加工构件 C服务…

C++中lambda使用mutable关键字详解

C中lambda使用mutable关键字详解 在《C初学者指南-5.标准库(第二部分)–更改元素算法》中&#xff0c;讲“generate”算法时有下面这段代码&#xff1a; auto gen [i0]() mutable { i 2; return i; }; std::vector<int> v; v.resize(7,0); generate(begin(v)1, begin…

(南京观海微电子)——LCD OTP(烧录)介绍

OTP OTP只是一种存储数据的器件&#xff0c;全写:ONETIMEPROGRAM。 OTP目的&#xff1a;提高产品的一致性 客户端的接口不支持和我们自己的产品IC之间通信&#xff0c;即不支持写初始化&#xff0c;所以产品的电学功能以及光学特性需要固化在IC中&#xff0c;所以需要我们来进行…

青甘环线游记|day(1)|兰州

出发 下午1点&#xff0c;登机。航班经停万州&#xff0c;再到兰州。下图为飞机上拍的照片&#xff0c;不知道为什么窗户上有结晶的东西&#xff08;&#xff1f;&#xff09; 在飞机上拍的航线图&#xff0c;但是有点模糊。飞机上有提供午餐。4点左右到达万州 在飞机上好像…

08 Redis Set类型操作与使用场景

Redis Set类型操作与使用场景 一、Set类型操作 ​ Redis的Set结构与Java中的HashSet类似&#xff0c;可以看做是一个value为null的HashMap。因为也是一个hash表&#xff0c;因此具备与HashSet类似的特征&#xff1a; ​ 无序 ​ 元素不可重复 ​ 查找快 ​ 支持交集、并集…

Tomcat 8.5 下载、安装、启动及各种问题

&#x1f970;&#x1f970;&#x1f970;来都来了&#xff0c;不妨点个关注叭&#xff01; &#x1f449;博客主页&#xff1a;欢迎各位大佬!&#x1f448; 本期内容主要介绍 Tomcat 8 的安装&#xff0c;以及可能会遇到的问题 文章目录 1. Tomcat 安装2. 可能会遇到的问题2.…