数据集笔记: Porto

news2025/1/1 23:37:28

数据来源:Taxi Trajectory Data_数据集-阿里云天池 (aliyun.com)

1 数据介绍

  • 葡萄牙波尔图市运行的所有442辆出租车的全年轨迹(从2013年7月1日至2014年6月30日)

2  读取数据

import  pandas as pd

tra=pd.read_csv('C:/Users/16000/Downloads/train/train(1).csv')
tra

170万条轨迹

2.1 数据每一列的意义

TRIP_ID每次行程的唯一标识符
CALL_TYPE标识要求此服务的方式。可能包含三个可能的值之一:
  • ‘A’ 如果此行程是从中心调度的;
  • ‘B’ 如果此行程是直接要求特定站点的出租车司机的;
  • ‘C’ 其他(即在随机街道上要求的行程)。
ORIGIN_CALL

包含用于要求至少一项服务的每个电话号码的唯一标识符

如果CALL_TYPE='A',它标识行程的客户。否则,它假定为NULL值

ORIGIN_STAND

包含出租车站点的唯一标识符。

如果CALL_TYPE='B',它标识行程的起始点。否则,它假定为NULL值;

TAXI_ID包含执行每次行程的出租车司机的唯一标识符;
TIMESTAMP

Unix时间戳(以秒为单位)

标识行程的开始

DAYTYPE

标识行程开始的天类型。它假定三个可能的值之一:

  • ‘B’ 如果此行程开始于假日或任何其他特殊日子(即延长假期、浮动假期等);
  • ‘C’ 如果行程开始于类型B天的前一天;
  • ‘A’ 其他(即正常日子,工作日或周末)。
MISSING_DATA

当GPS数据流完整时为FALSE

当一个(或多个)位置缺失时为TRUE;

POLYLINE

以字符串形式映射的GPS坐标列表(即WGS84格式)

此列表包含行程每15秒的一对坐标。

最后一个列表项对应行程的目的地,而第一个代表其开始

 行程的总行驶时间定义为(点的数量-1)x 15秒。

例如,POLYLINE中有101个数据点的行程长度为(101-1)* 15 = 1500秒

3 python可视化一条轨迹

loc=tra.at[0,'POLYLINE']
loc
'''
'[[-8.618643,41.141412],[-8.618499,41.141376],[-8.620326,41.14251],[-8.622153,41.143815],[-8.623953,41.144373],[-8.62668,41.144778],[-8.627373,41.144697],[-8.630226,41.14521],[-8.632746,41.14692],[-8.631738,41.148225],[-8.629938,41.150385],[-8.62911,41.151213],[-8.629128,41.15124],[-8.628786,41.152203],[-8.628687,41.152374],[-8.628759,41.152518],[-8.630838,41.15268],[-8.632323,41.153022],[-8.631144,41.154489],[-8.630829,41.154507],[-8.630829,41.154516],[-8.630829,41.154498],[-8.630838,41.154489]]'
'''
#提取第一条轨迹的geometry




loc_lst=json.loads(loc)
loc_lst = [[lat, lon] for lon, lat in loc_lst]
loc_lst
'''
[[41.141412, -8.618643],
 [41.141376, -8.618499],
 [41.14251, -8.620326],
 [41.143815, -8.622153],
 [41.144373, -8.623953],
 [41.144778, -8.62668],
 [41.144697, -8.627373],
 [41.14521, -8.630226],
 [41.14692, -8.632746],
 [41.148225, -8.631738],
 [41.150385, -8.629938],
 [41.151213, -8.62911],
 [41.15124, -8.629128],
 [41.152203, -8.628786],
 [41.152374, -8.628687],
 [41.152518, -8.628759],
 [41.15268, -8.630838],
 [41.153022, -8.632323],
 [41.154489, -8.631144],
 [41.154507, -8.630829],
 [41.154516, -8.630829],
 [41.154498, -8.630829],
 [41.154489, -8.630838]]
'''

import numpy as np
loc_lst=np.array(loc_lst)
lat,lon=np.mean(loc_lst,axis=0)
lat,lon
#(41.14919347826088, -8.62801630434783)


import folium

m=folium.Map(location=(lat,lon),
            zoom_start=15)

folium.PolyLine(locations=loc_lst,
               weight=10).add_to(m)
m
#画图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1049880.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言中动态内存管理

前言:为什么存在动态内存分配,为什么要用动态内存分配,动态内存分配的意义。鸡汤:有了坚持不一定成功,但没有坚持,就注定失败,各位也要努力坚持提升自己! 动态内存分配 动态内存函数&#xff1a…

【Linux】 du 命令使用

问题 No space left on device 请求接口返回 java.io.IOException: No space left on device 设备上没有剩余空间 怎么解决问题: 查看这篇文章:一次 linux 服务器磁盘使用情况排查 我们提到命令:du -sh * 到底这个命令是干什么的咱们…

EXPLAIN 语句输出的各个列解释

title: “EXPLAIN 语句输出的各个列解释” createTime: 2022-03-06T15:52:4108:00 updateTime: 2022-03-06T15:52:4108:00 draft: false author: “ggball” tags: [“mysql”] categories: [“db”] description: “” EXPLAIN 语句输出的各个列解释 列名描述id在一个大的查…

多线程(基础)

文章目录 1. 线程的声明周期1.1 JDK 中用 Thread.State 枚举表示了线程的几种状态1.2 线程状态转换图 2. 线程的同步2.1 Synchronized 线程同步机制 3. 互斥锁3.1 注意事项和细节3.2 守护线程 setDaemon()方法 4. 线程的死锁5. 释放锁6. 课后练习 1. 线程的声明周期 1.1 JDK 中…

四通道信息融合下的齿轮箱故障诊断(Python代码,SVM模型和CNN模型进行对比实验,解压缩即可运行,有详细中文注释)

1.效果运行视频:四通道信息融合下的齿轮箱故障诊断(Python代码,SVM模型和CNN模型进行对比实验)_哔哩哔哩_bilibili 用到的库: 2.数据集介绍:数据免费下载链接(不要积分)&#xff1a…

什么是跨站请求伪造(CSRF)攻击?如何防止它?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 什么是跨站请求伪造(CSRF)攻击?⭐ 如何防止CSRF攻击?⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 欢迎来到前端入门之旅!感兴趣的可以订阅本专栏哦…

xxl-job 2.2之后版本高版本executor未授权访问漏洞

xxl-job 低版本executor未授权访问 低版本的executor未授权访问漏洞是 POST /run HTTP/1.1 Host: your-ip:9999 Accept-Encoding: gzip, deflate Accept: */* Accept-Language: en User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like G…

26663-2011 大型液压安全联轴器 课堂随笔

声明 本文是学习GB-T 26663-2011 大型液压安全联轴器. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了大型液压安全联轴器的分类、技术要求、试验方法及检验规则等。 本标准适用于联接两同轴线的传动轴系,可起到限制…

基于Linux 系统聊天室登录与注册实现(03)

上一篇我们已经讲了如何搭建一个多线程的服务器模型,可以支持多个客户端同时连接服务器,本篇我们来实现多个客户端,如何实现向服务器注册信息,并实现登录的功能。 数据结构 接着上一篇的实例代码继续增加功能。要实现注册和登录…

(Java)关于easyExcel合并单元格

今天过客遇到一个需要合并单元格的业务,但是之前过客用的一直是easyExcel框架,所以这次也不想去使用其他的框架,今天就跟大家讲讲easyExcel怎么进行单元格的合并。 首先使用easyExcel进行导出的实体类一样是依据之前那样写,之后在…

宠物玩具在欧洲销售CE认证EN71测试标准

CE认证的EN71测试宠物玩具办理: 宠物玩具是用来给宠物玩耍,基于将宠物作为人类伙伴关系而诞生的一种玩具类型,这种玩具的存在就是让人类和自己的宠物真正的互动起来,在情感上面得到更大的交流和互动。 那么宠物玩具出口到欧盟市场…

支付宝电脑网站支付,异步通知

一:异步通知是支付宝回调商户的服务器,所以这个地址需要通过外网访问,在真实项目中都会有对应的服务器,但是在测试中只有使用内网穿透工具 推荐使用NATAPP-内网穿透 基于ngrok的国内高速内网映射工具 配置好内网穿透之后不要忘记…

目标检测如何演变:从区域提议和 Haar 级联到零样本技术

目录 一、说明 二、目标检测路线图 2.1 路线图(一般) 2.2 路线图(更传统的方法) 2.3 路线图(深度学习方法) 2.4 对象检测指标的改进 三、传统检测方法 3.1 维奥拉-琼斯探测器 (2001) 3.2 HOG探测器…

最大内切圆算法计算裂缝宽度

本文这里是对CSDN上另一位博主的代码进行了整理: 基于opencv的裂缝宽度检测算法(计算轮廓最大内切圆算法) 我觉得这位博主应该是上传了一个代码草稿,我对其进行了重新整理,并添加了详细的注释。 import cv2 import …

产业园区中工业厂房的能源综合配置

安科瑞 崔丽洁 园区工业地产中能源综合配置存在的问题 我国园区工业地产建设已历经近40年的发展, 园区在区域经济发展、产业集聚方面发挥了重要的载体和平台作用, 有力推动了我国社会经济的高质量发展。园区工业地产是国民经济的发展的重要载体, 但同时也是集中的环境污染源。…

大数据Doris(一):Doris概述篇

文章目录 Doris概述篇 一、前言 二、Doris简介

Norms and Inner Products

See https://ai.stanford.edu/~gwthomas/notes/norms-inner-products.pdf

Jenkins 权限管理

关于Role-based Authorization Strategy 使用Jenkins自身的权限管理过于粗糙,无法对单个、一类项目做管理,我们可以使用 Role-based Authorization Strategy插件来管理项目、角色。 首先安装该插件:在Jenkins查看该插件有无安装 在Jenkins-…

C++ 类和对象 (5) 析构函数

用构造函数创建对象后,程序负责跟踪该对象,直到对象过期为止。对象过期时,程序将自动调用一个特殊的成员函数,该函数的名称——析构函数。析构函数完成清理工作,实际上还是很有用的。例如,用new来分配一个构…

八、【漏洞复现】jupyter-notebook 命令执行(CVE-2019-9644)

8.0、基础知识 1、测试功能点 (这种情况基本上很难遇到) 8.1、漏洞原理 ​Jupyter Notebook是一套用于创建、共享代码和说明性文本文档的开源Web应用程序。 Jupyter Notebook可直接使用命令行执行任意命令。​ 8.2、影响范围 未授权开启终端权限的…