【Python文本处理】基于运动路线记录GPX的文件解析,GPX转SRT字幕文件(不需要安装三方库)

news2025/1/13 19:45:15

【Python文本处理】基于运动路线记录GPX的文件解析,GPX转SRT字幕文件(不需要安装三方库)

解析和转换

GPX文件格式

GPX文件本身其实就是坐标、海拔、时间、心率等综合性的xml文件
如图:
在这里插入图片描述
海拔:ele
时间:time
心率:heartrate
功率:power
踏频:cadence
距离:distance
一般不用距离distance 但可以根据距离求瞬时速度(前提是时间间隔均匀 最小精度不低于1s) 不过如果距离和坐标之差相差太远 则不太好确定 Strava等软件通过这个来计算瞬时速度和距离 但不用于计算赛段速度(赛段时间)

某一时刻的数据就看trkpt部分
以trkpt 为始 到 /trkpt 为止
比如:

<trkpt lat="30.3940883" lon="112.2400167">
        <ele>34</ele>
        <time>2023-05-12T12:26:13Z</time>
        <extensions>
          <heartrate>167</heartrate>
          <distance>26698</distance>
        </extensions>
      </trkpt>

SRT基本格式

SRT字幕通常以srt作为后缀,作为外挂字幕,多数主流播放器都支持直接加载并显示SRT字幕,具体细节看参考SubRip (.SRT) subtitles support in players。
该格式是基于纯文本的格式,使用CR+LF作为换行符(Windows下常用换行符,*nix使用LF作为换行符)。每个SRT文件包含至少一个字幕段。
每个字幕段有四部分构成:

字幕序号
字幕显示的起始时间
字幕内容(可多行)
空白行(表示本字幕段的结束)
其中字幕序号一般是顺序增加的,表示字幕是一系列连续的序列。但该数值在字幕显示中不起任何作用,只是起着标记和标识的作用,方便分配翻译行数用。字幕序号的值可以随意,1和100都一样,并不会影响字幕的显示。但字幕序号也是字幕段的一部分,所以不能没有或者删去,否则在播放时,将出现错误。

字幕显示起始时间的格式如下:
hour:minute:second.millisecond --> hour:minute:second.millisecond 或
hour:minute:second,millisecond --> hour:minute:second,millisecond
后面还可以附加用于指定字幕显示位置的信息,以像素为单位,格式如下: X1:number Y1:number X2:number Y2:number。

一个典型的SRT文件如下(截取自阿凡达中英字幕):

3
00:00:39,770 --> 00:00:41,880
在经历了一场人生巨变之后
When I was lying there in the VA hospital ...
 
4
00:00:42,550 --> 00:00:44,690
我被送进了退伍军人管理局医院
... with a big hole blown through the middle of my life,
 
5
00:00:45,590 --> 00:00:48,120
那段时间我经常会梦到自己在飞翔
... I started having these dreams of flying.
 
6
00:00:49,740 --> 00:00:51,520
终获自由
I was free.
 
7
00:00:54,620 --> 00:00:55,830
而不幸的是
Sooner or later though, ...

SRT格式化设置

多数SRT支持一些特定格式化,比如斜体、粗体、下划线以及字体颜色。使用时需要基于HTML的标签,具体用法如下:

颜色
字体斜体
字体下加划线

换行
字体加粗
这些HTML可嵌套。

<font color=red>颜色</font>
<i>字体斜体</i>
<u>字体下加划线</u>
<br>换行
<b>字体加粗</b>

当然某些播放器还对SRT做了扩展,可以支持ASS/SSA中部分格式化代码。

代码实现

首先需要获取第一次开始的时间参数:

		try:
            ti=str((gpx[i].split("<time>")[1]).split("</time>")[0])
            now_time = time.mktime(time.strptime(ti, "%Y-%m-%dT%H:%M:%SZ"))
            first_time=now_time                
            srt_time=0
            str_now_time=time.strftime("<i>%Y-%m-%d %H:%M:%S</i>\n",time.localtime(now_time))  
            srt=str(j)+"\n00:00:00,000 --> 00:00:01,000\n"+str_now_time+"<u>BEGIN</u>\n\n"
            srt_list.append(srt)
            break
        except:
            pass

以及每个时刻的时间参数:

			try:
                ti=str((gpx[i].split("<time>")[1]).split("</time>")[0])
                now_time = time.mktime(time.strptime(ti, "%Y-%m-%dT%H:%M:%SZ"))                
                srt_time=now_time-first_time
                
                h=int(srt_time/3600)
                m=int(srt_time/60)
                s=int(srt_time%60)
                s2=s+1
                h=trans_time(h)
                m=trans_time(m) 
                s=trans_time(s)
                s2=trans_time(s2)
                srt_str_time=str(h+":"+m+":"+s+",000 --> "+h+":"+m+":"+s2+",000\n")
                str_now_time=time.strftime("<i>%Y-%m-%d %H:%M:%S</i>\n",time.localtime(now_time))  
                srt=srt+str_now_time
            except:
                pass

这里用到了一个时间格式转换:

def trans_time(st):
    if st<10 and st>=0:
        st="0"+str(st)
    else:
        st=str(st)
    return str(st)

在解析时 用trkpt_flag状态机表示某一时刻的数据有效性状态:

if gpx[i].count('<trkpt'):
	trkpt_flag=1
	trkpt_first_flag=1
	j=j+1

同理 还有trkpt_first_flag 表示第一次获取到trkpt

检测到/trkpt时表示该时刻数据获取结束

if gpx[i].count('</trkpt>'):
	trkpt_flag=0

检测到/trkseg时 表示所有数据获取结束

        if gpx[i].count('</trkseg>'):
            j=j+1
            trkpt_first_flag=2

当trkpt_first_flag 为1 trkpt_flag为0时 进行数据保存:

		if trkpt_first_flag==1 and trkpt_flag==0:
            if not srt=="":                
                last_srt_time=int(srt_time)
                last_distance=int(dat)
                srt=str(j)+"\n"+srt_str_time+srt+"\n"
                srt_list.append(srt)
                srt=""

last_distance 和 last_srt_time用于配合distance计算瞬时速度

了解这些以后 我们再来进行数据解析

经纬度获取:

			if gpx[i].count('<trkpt'):
                srt=srt+"lat:"+gpx[i].split('"')[1]+" lon:"+gpx[i].split('"')[3]+"\n"

海拔

			try:
                el=str((gpx[i].split("<ele>")[1]).split("</ele>")[0]) 
                srt=srt+"ele:"+el+"\n"
            except:
                pass

关键词获取 其中 当获取到distance时 进行瞬时速度计算

			for key in keywords_list:                
                try:
                    dat=str((gpx[i].split("<"+key+">")[1]).split("</"+key+">")[0]) 
                    srt=srt+"<i>"+key+":"+dat+"</i>\n"
                    if key=="distance":    
                        velocity_time=srt_time-last_srt_time
                        velocity=(int(dat)-last_distance)/velocity_time*3.6                        
                        srt=srt+"<b>"+"velocity"+":"+str(velocity)+"</b>\n"                        
                except:
                    pass

最后一个时刻后 再加一行字幕

		if trkpt_first_flag==2:
            h=int((last_srt_time+1)/3600)
            m=int((last_srt_time+1)/60)
            s=int((last_srt_time+1)%60)
            s2=s+1
            h=trans_time(h)
            m=trans_time(m) 
            s=trans_time(s)
            s2=trans_time(s2)
            srt_str_time=str(h+":"+m+":"+s+",000 --> "+h+":"+m+":"+s2+",000\n")
            srt=str(j)+"\n"+srt_str_time+"<u>END</u>\n"+"\n"
            srt_list.append(srt)
            srt=""
            break

整体代码:

# -*- coding: utf-8 -*-
"""
Created on Thu Jun  1 14:23:10 2023

@author: ZHOU
"""
import time

'''data keywords
心率 "heartrate"
踏频 "cadence"
距离 "distance"
功率 "power"
'''

def trans_time(st):
    if st<10 and st>=0:
        st="0"+str(st)
    else:
        st=str(st)
    return str(st)
    
def gpx_to_srt(gpx):     
    keywords_list=["heartrate","cadence","power","distance"]
    srt_list=[]
    first_time=0
    srt_time=0
    srt=""
    j=1
    trkpt_flag=0
    trkpt_first_flag=0
    for i in range(len(gpx)):        
        try:
            ti=str((gpx[i].split("<time>")[1]).split("</time>")[0])
            now_time = time.mktime(time.strptime(ti, "%Y-%m-%dT%H:%M:%SZ"))
            first_time=now_time                
            srt_time=0
            str_now_time=time.strftime("<i>%Y-%m-%d %H:%M:%S</i>\n",time.localtime(now_time))  
            srt=str(j)+"\n00:00:00,000 --> 00:00:01,000\n"+str_now_time+"<u>BEGIN</u>\n\n"
            srt_list.append(srt)
            break
        except:
            pass
    
    srt=""
    srt_str_time=""
    last_distance=0
    srt_time=0
    last_srt_time=0
    for i in range(len(gpx)):
        if gpx[i].count('<trkpt'):
            trkpt_flag=1
            trkpt_first_flag=1
            j=j+1

        if trkpt_flag==1:
            try:
                ti=str((gpx[i].split("<time>")[1]).split("</time>")[0])
                now_time = time.mktime(time.strptime(ti, "%Y-%m-%dT%H:%M:%SZ"))                
                srt_time=now_time-first_time
                
                h=int(srt_time/3600)
                m=int(srt_time/60)
                s=int(srt_time%60)
                s2=s+1
                h=trans_time(h)
                m=trans_time(m) 
                s=trans_time(s)
                s2=trans_time(s2)
                srt_str_time=str(h+":"+m+":"+s+",000 --> "+h+":"+m+":"+s2+",000\n")
                str_now_time=time.strftime("<i>%Y-%m-%d %H:%M:%S</i>\n",time.localtime(now_time))  
                srt=srt+str_now_time
            except:
                pass
            
            if gpx[i].count('<trkpt'):
                srt=srt+"lat:"+gpx[i].split('"')[1]+" lon:"+gpx[i].split('"')[3]+"\n"

            try:
                el=str((gpx[i].split("<ele>")[1]).split("</ele>")[0]) 
                srt=srt+"ele:"+el+"\n"
            except:
                pass
            
            for key in keywords_list:                
                try:
                    dat=str((gpx[i].split("<"+key+">")[1]).split("</"+key+">")[0]) 
                    srt=srt+"<i>"+key+":"+dat+"</i>\n"
                    if key=="distance":    
                        velocity_time=srt_time-last_srt_time
                        velocity=(int(dat)-last_distance)/velocity_time*3.6                        
                        srt=srt+"<b>"+"velocity"+":"+str(velocity)+"</b>\n"                        
                except:
                    pass
        
        if gpx[i].count('</trkpt>'):
            trkpt_flag=0
        
        if trkpt_first_flag==1 and trkpt_flag==0:
            if not srt=="":                
                last_srt_time=int(srt_time)
                last_distance=int(dat)
                srt=str(j)+"\n"+srt_str_time+srt+"\n"
                srt_list.append(srt)
                srt=""
        
        if gpx[i].count('</trkseg>'):
            j=j+1
            trkpt_first_flag=2
            
        if trkpt_first_flag==2:
            h=int((last_srt_time+1)/3600)
            m=int((last_srt_time+1)/60)
            s=int((last_srt_time+1)%60)
            s2=s+1
            h=trans_time(h)
            m=trans_time(m) 
            s=trans_time(s)
            s2=trans_time(s2)
            srt_str_time=str(h+":"+m+":"+s+",000 --> "+h+":"+m+":"+s2+",000\n")
            srt=str(j)+"\n"+srt_str_time+"<u>END</u>\n"+"\n"
            srt_list.append(srt)
            srt=""
            break
   
    return srt_list

def save_lines(lines,path):
    try:
        f=open(path, 'w', encoding="utf-8")
    except:
        f=open(path, 'a', encoding="utf-8")
    for i in lines:
        f.write(i)
    f.close()
    
if __name__ == '__main__':
    path="./1.gpx"
    
    f=open(path, 'r', encoding="utf-8")
    gpx=f.readlines()
    f.close()    
    
    gpx=gpx_to_srt(gpx)

    save_lines(gpx,"srt_test.srt")

若有不明白的 可以联系上下文一起看

GUI界面编程

py打包

Pyinstaller打包exe(包括打包资源文件 绝不出错版)

依赖包及其对应的版本号

PyQt5 5.10.1
PyQt5-Qt5 5.15.2
PyQt5-sip 12.9.0

pyinstaller 4.5.1
pyinstaller-hooks-contrib 2021.3

Pyinstaller -F setup.py 打包exe

Pyinstaller -F -w setup.py 不带控制台的打包

Pyinstaller -F -i xx.ico setup.py 打包指定exe图标打包

打包exe参数说明:

-F:打包后只生成单个exe格式文件;

-D:默认选项,创建一个目录,包含exe文件以及大量依赖文件;

-c:默认选项,使用控制台(就是类似cmd的黑框);

-w:不使用控制台;

-p:添加搜索路径,让其找到对应的库;

-i:改变生成程序的icon图标。

如果要打包资源文件
则需要对代码中的路径进行转换处理
另外要注意的是 如果要打包资源文件 则py程序里面的路径要从./xxx/yy换成xxx/yy 并且进行路径转换
但如果不打包资源文件的话 最好路径还是用作./xxx/yy 并且不进行路径转换

def get_resource_path(relative_path):
    if hasattr(sys, '_MEIPASS'):
        return os.path.join(sys._MEIPASS, relative_path)
    return os.path.join(os.path.abspath("."), relative_path)

而后再spec文件中的datas部分加入目录
如:

a = Analysis(['cxk.py'],
             pathex=['D:\\Python Test\\cxk'],
             binaries=[],
             datas=[('root','root')],
             hiddenimports=[],
             hookspath=[],
             hooksconfig={},
             runtime_hooks=[],
             excludes=[],
             win_no_prefer_redirects=False,
             win_private_assemblies=False,
             cipher=block_cipher,
             noarchive=False)

而后直接Pyinstaller -F setup.spec即可

如果打包的文件过大则更改spec文件中的excludes 把不需要的库写进去(但是已经在环境中安装了的)就行

这些不要了的库在上一次编译时的shell里面输出
比如:
在这里插入图片描述

在这里插入图片描述
然后用pyinstaller --clean -F 某某.spec

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/601625.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【GTest】使用CMakeLitsts.txt构建Windows和Linux的跨平台GoogleTest项目(非常详细+亲测有效)

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化 &#x1f449;专__注&#x1f448;&#xff1a;专注主流机器人、人工智能等相关领域的开发、…

00): Can‘t connect to MySQL server on ‘localhost:3306‘ (10061)

好久没有使用数据库&#xff0c; 连接数据库报上面的错误&#xff0c;尝试了网上的方法还是没有成功&#xff0c;思索之后想起之前手动关闭了mysql的服务&#xff0c;Windows启动时mysql服务不会自动启动&#xff0c;成功启动mysql服务后再次连接数据库&#xff0c;正常连接。 …

keil 使用问题总结

1. 编译报错 1.1 …\USER\stm32f10x.h(428): error: #67: expected a “}” ADC1_2_IRQn 18, /*!< ADC1 and ADC2 global Interrupt */*** Using Compiler V5.06 update 4 (build 422), folder: D:\keil_v537\install\ARM\ARM…

滴滴和华为5年,分享一下真实的划水经验....

先简单交代一下背景吧&#xff0c;某不知名 985 的本硕&#xff0c;17 年毕业加入华为&#xff0c;之后跳槽到了滴滴&#xff0c;一直从事软件测试的工作。之前没有实习经历&#xff0c;算是5年的工作经验吧。 这5年之间完成了一次晋升&#xff0c;换了一家公司&#xff0c;有…

朋友圈九宫格照片怎么做?一键图片分割

相信朋友们都看过这样发朋友圈的方式&#xff0c;一张图片发出九宫格的效果&#xff1a; 或者是在各大社交平台、引流平台&#xff0c;这种发图的方法已经屡见不鲜了&#xff0c;可当自己上网搜【图片分割】、【宫格切图】等等&#xff0c;要么就是要注册账号登录才能操作&…

大数据---聚类分析概述及聚类评估

聚类概述: 什么是聚类&#xff1f; 是把数据对象集合按照相似性划分成多个子集的过程。每个子集是一个簇&#xff08;cluster&#xff09;&#xff0c;分类的最终效果&#xff1a;使得簇中的对象彼此相似&#xff0c;但与其他簇中的对象相异。聚类是无监督学习&#xff0c;因…

ses价签墨水屏折腾-01

前言 一直想玩玩墨水屏&#xff0c;这次咸鱼找了全新的ses价签&#xff0c;而且价格还很便宜&#xff0c;于是买了一个2.66寸三色&#xff0c;和一个4.2寸三色的墨水屏幕&#xff0c;经过几天的折腾终于能正常显示了。 显示效果如下&#xff1a; 折腾来折腾去&#xff0c;发…

DMES-2023第十三届数字营销与电商峰会大会 火热报名中

2023第十三届数字营销与电商峰会将于7月6-7日在上海召开&#xff01; 本次峰会线上线下同步举行&#xff0c;将通过七大热点主题帮助品牌主突破模式能力&#xff0c;回归初心、精耕细作&#xff0c;实现可持续增长&#xff1b;提升产品能力&#xff0c;实现可持续长期增长&…

智能名片如何缓解社交商务时的尴尬场景?

2023年微信月活用户已超过13.1亿&#xff0c;而小程序也成为了一个神奇的窗口。透过这个窗口&#xff0c;越来越多的人发现了微信生态内的巨大商机&#xff0c;通过小程序也涌现出许多新颖的玩法。 智能名片小程序&#xff0c;基于微信与 AI 技术开发&#xff0c;将企业名片系…

强化学习基础篇【1】:基础知识点、马尔科夫决策过程、蒙特卡洛策略梯度定理、REINFORCE 算法

【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应用项目实现 专栏详细介绍:【强化学习原理+项目专栏】必看系列:单智能体、多智能体算法原理+项目实战、相关技巧(调参、画图等、趣味项目实现、学术应…

MKS SERVO4257D 闭环步进电机_系列6 串口(RS485)通讯示例

第1部分 产品介绍 MKS SERVO 28D/35D/42D/57D 系列闭环步进电机是创客基地为满足市场需求而自主研发的一款产品。具备脉冲接口和RS485/CAN串行接口&#xff0c;支持MODBUS-RTU通讯协议&#xff0c;内置高效FOC矢量算法&#xff0c;采用高精度编码器&#xff0c;通过位置反馈&a…

CAR-T药物|疗法适应症|市场销售-上市药品前景分析

对患有癌症的人来说&#xff0c;能够幸运地度过5年大关是一种成功&#xff0c;而能够成功地度过10年大关则是一种奇迹。Emily作为全球第一个接受CAR-T治疗成功的白血病儿童患者&#xff0c;至今已成功摆脱癌症11年之久。 ①CAR-T细胞治疗&#xff08;Emily Whitehead治疗案例时…

Benewake(北醒) 中距 TF40 40m介绍以及资料整理

目录 1 前言2 产品介绍3 产品快速测试3.1 产品规格书及使用说明书3.2 通用上位机测试说明3.3 通用指令串口助手使用说明3.4 产品快速测试说明 4 基于开源硬件的运用整理4.1 在开源Arduino上的运用 1 前言 本文包含【Benewake(北醒) 】中距 TF40 40m介绍以及资料整理 详细请参考…

Arduino软件+ ESP8266 MCU开发项目之一键式配网操作(有掉电保护),可继续开发成为--WIFI放大器项目。

下载本次ESP8266 MCU开发项目之一键式配网 代码文件 (11条消息) 配网ESP8266MUC.rar资源-CSDN文库 流程图讲解 视频展示效果 配网ESP8266 项目可待 改进/升级 的地方 1&#xff1a;配网流程UI界面单调&#xff0c;可搭配复杂UI配网界面 2&#xff1a;配网流程可看作是WIFI放…

NSS周常刷密码(2)

[GWCTF 2019]babyRSA 解答过程在脚本内 from Crypto.Util.number import * import gmpy2 import sympy import z3e 0x10001 N63658514959457474690903016018269086622290925646484729178300065183722792133723789965128794359777327094438403485892529574488072710160684141…

移动云镜像配置BC-Linux --配置centos 6-7-8版本参考

移动云BC linux 也是一个非常不错的镜像站. 可以加速国内下载. 非常好用, 速度比阿里 等那些流行的镜像站快一些. 下面介绍详解操作配置, 供参考 移动云开源镜像站-Linux系统订阅服务 移动云开源镜像站&#xff0c;包含BC-Linux各版本的软件仓库&#xff0c;对外提供软件升级…

Apache Kudu入门学习

目录 一、概念 二、背景 三、特点 四、架构 五、应用场景 六、kudu的模式设计 1、列设计 2、主键设计 3、分区设计 1.范围分区Range Partitioning 2.哈希分区Hash Partitioning 3.多级分区Multilevel Partitioning 一、概念 官方概念&#xff1a; Apache Kudu i…

​细说websocket - php篇 ​

下面我画了一个图演示 client 和 server 之间建立 websocket 连接时握手部分&#xff0c;这个部分在 node 中可以十分轻松的完成&#xff0c;因为 node 提供的 net 模块已经对 socket 套接字做了封装处理&#xff0c;开发者使用的时候只需要考虑数据的交互而不用处理连接的建立…

代码随想录算法训练营day59 | 503.下一个更大元素II,42. 接雨水

代码随想录算法训练营day59 | 503.下一个更大元素II&#xff0c;42. 接雨水 503.下一个更大元素II解法一&#xff1a;单调栈&#xff08;两次遍历解决环状问题&#xff09; 42. 接雨水解法一&#xff1a;单调栈&#xff08;横向累计&#xff09;解法二&#xff1a;暴力解法解法…

听说今年 “金9银10” 变成 金七银八 了...

眼下虽然才6月份&#xff0c;但真正的金9银10已经悄然开始。从认识的HR那得知&#xff0c;有些公司甚至在6月就开始布局了。。而年前偃旗息鼓的&#xff0c;年后也势必加速进入这波抢人大战&#xff01; 因此&#xff0c;真的要等到9、10月份再做准备的话&#xff0c;就晚了。…