数据集笔记:Telecom Shanghai Dataset

news2024/11/25 17:19:45

0 数据地址

📱Telecom Shanghai Dataset (kaggle.com)

1 数据描述

  • 该数据集由上海电信提供,包含超过720万条记录,记录了9481部手机通过3233个基站访问互联网的情况,时间跨度为六个月。
  • 例如,下图显示了基站的分布情况。每个节点代表中国上海的一个基站。
  • 这个数据集可以帮助研究人员评估他们在移动边缘计算主题上的解决方案,如边缘服务器部署、服务迁移、服务推荐等。

2 数据介绍

  • 电信数据集展示了6个参数,例如月份、数据、开始时间、结束时间、基站位置、手机ID。
  • 通过数据集可以找到用户的轨迹。

每15天一个表

3 python读取+可视化

3.1 读取数据

import pandas as pd

data=pd.read_excel('Downloads/Telecom Shanghai Dataset/data_10.110.15.xlsx',names=['Data','start time','end time','cell station lon','cell station lat','user id'])

3.2 剔除经纬度为NaN的record 

data1=data.dropna()
data1

3.3 选择某一天的数据

import datetime
data2=data1[(data1['start time']>=datetime.datetime(2014,10,15)) & (data1['start time']<datetime.datetime(2014,10,16))]
data2

 

3.4 根据user id和时间排序

data2=data2.sort_values(by=['user id','start time'])
data2

 

3.5 停留的记录只保留第一条

 3.5.1 首先确定哪些时刻在移动

记录当前位置和前一时刻的位置

data2['location']=data2['cell station lon'].astype(str)+'_'+data2['cell station lat'].astype(str)
data2

data2['prev_location']=data2['location'].shift(1)
data2

 

data2['location_changed']=(data2['location']!=data2['prev_location'])
data2

 

3.5.2 保留当前时刻在移动的记录 

data3=data2[data2['location_changed']==True]
data3

 

data3=data3[[ 'start time', 'end time', 'cell station lon',
       'cell station lat', 'user id']]
data3

 

3.6 保留轨迹长度大于10的轨迹

计算每一个用户id出现的次数

iid=data3.groupby('user id').size().reset_index(name='count')
iid

iid['count'].describe()
'''
count    2956.000000
mean        4.675237
std         4.769128
min         1.000000
25%         2.000000
50%         3.000000
75%         6.000000
max        69.000000
Name: count, dtype: float64
'''
iid=iid[iid['count']>10]
iid

data4=data3[data3['user id'].isin(iid['user id'])]
data4

3.7 绘制一条轨迹(使用folium)

import numpy as np
tmp=data4[data4['user id']=='00a05a4f2b937fd38888c03213c4deb2'].reset_index()
tra_lst=[]
for j in range(tmp.shape[0]):
        tra_lst.append([tmp.at[j,'cell station lon'],tmp.at[j,'cell station lat']])
tra_lst=np.array(tra_lst)
m=folium.Map(location=tra_lst.mean(axis=0),zoom_start=13)
for i in tra_lst:
    folium.Marker(location=i).add_to(m)
folium.PolyLine(locations=tra_lst).add_to(m)
    
m

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1188999.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Primavera P6 Calendars 全局日历和项目日历Calendar

Primavera P6 日历基本介绍 Primavera P6 日历特性和功能是项目和进度管理的强大工具。在这里我们将讨论 Primavera P6 中三种最常见的日历类型中的两种&#xff1a;全局日历和项目日历。 Primavera P6 日历的第三种类型是资源日历&#xff0c;它非常专业&#xff0c;在项目中…

数字时代的法律前沿:TikTok与政府监管的博弈

在当今数字化时代&#xff0c;社交媒体已经成为了人们生活的一部分&#xff0c;扮演着沟通、娱乐和信息获取的重要角色。TikTok&#xff0c;作为一款短视频分享应用&#xff0c;在全球范围内迅速崭露头角&#xff0c;吸引了数亿用户。 然而&#xff0c;随着TikTok的崛起&#…

【C++】单例模式【两种实现方式】

目录 一、了解单例模式前的基础题 1、设计一个类&#xff0c;不能被拷贝 2、设计一个类&#xff0c;只能在堆上创建对象 3、设计一个类&#xff0c;只能在栈上创建对象 4、设计一个类&#xff0c;不能被继承 二、单例模式 1、单例模式的概念 2、单例模式的两种实现方式 …

低代码平台,业务开发的“银弹”

目录 一、为什么需要低代码平台 二、低代码平台的搭建能力 三、低代码其他能力 四、写在最后 随着互联网和信息技术的快速发展&#xff0c;各行各业都在积极拥抱数字化转型。在这个过程中&#xff0c;软件开发成为企业实现数字化转型的关键环节。然而&#xff0c;传统的软件开发…

交流信号继电器 DX-31BJ/AC220V JOSEF约瑟 电压启动 面板嵌入式安装

DX系列信号继电器由矩形脉冲激磁&#xff0c;磁钢保持。本继电器为双绕组。工作线圈可为电压型&#xff0c;亦可为电流型。复归线圈为电压型。继电器的工作电流或工作电压为长脉冲&#xff0c;亦可为脉冲不小于20mS的短脉冲。 系列型号 DX-31B信号继电器DX-31BJ信号继电器 D…

【VS2019 Qt5 VTK9.2】临时解决配置相关问题的简单方法

配置报错 编译报错提示&#xff08;LNK2019或LNK2001&#xff09; 严重性 代码 说明 项目 文件 行 禁止显示状态 错误 LNK2019 无法解析的外部符号 “__declspec(dllimport) public: __cdecl QVTKOpenGLNativeWidget::QVTKOpenGLNativeWidget(class QWidget *,class QFlags)(_i…

华为gre over ipsec配置案例

除了物理口加入安全域zone外&#xff0c;tunnel也得加入到安全域 一定记得tunnel也得加入zone&#xff0c;这个总爱忘记。 [fw1]firewall zone dmz [fw1-zone-dmz]add interface Tunnel 1 [fw2]firewall zone dmz [fw2-zone-dmz]add interface Tunnel 1

前端Vue 页面滑动监听 拿到滑动的坐标值

前言 前端Vue 页面滑动监听 拿到滑动的坐标值 实现 Vue2写法 mounted() {// 监听页面滚动事件window.addEventListener("scroll", this.scrolling);}, methods: { scrolling() {// 滚动条距文档顶部的距离let scrollTop window.pageYOffset ||document.documentE…

Python爬虫-获取汽车之家车家号

前言 本文是该专栏的第9篇,后面会持续分享python爬虫案例干货,记得关注。 地址:aHR0cHM6Ly9jaGVqaWFoYW8uYXV0b2hvbWUuY29tLmNuL0F1dGhvcnMjcHZhcmVhaWQ9MjgwODEwNA== 需求:获取汽车之家车家号数据 笔者将在正文中介绍详细的思路以及采集方法,废话不多说,跟着笔者直接往…

Spring Boot自动配置原理、实战、手撕自动装配源码

Spring Boot自动配置原理 相比较于传统的 Spring 应用&#xff0c;搭建一个 SpringBoot 应用&#xff0c;我们只需要引入一个注解 SpringBootApplication&#xff0c;就可以成功运行。 前面四个不用说&#xff0c;是定义一个注解所必须的&#xff0c;关键就在于后面三个注解&a…

竞赛选题 深度学习猫狗分类 - python opencv cnn

文章目录 0 前言1 课题背景2 使用CNN进行猫狗分类3 数据集处理4 神经网络的编写5 Tensorflow计算图的构建6 模型的训练和测试7 预测效果8 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习猫狗分类 ** 该项目较为新颖&a…

系统的讲解 - PHP 接口签名验证

概览 工作中&#xff0c;我们时刻都会和接口打交道&#xff0c;有的是调取他人的接口&#xff0c;有的是为他人提供接口&#xff0c;在这过程中肯定都离不开签名验证。 在设计签名验证的时候&#xff0c;一定要满足以下几点&#xff1a; 可变性&#xff1a;每次的签名必须是不…

Linux环境下安装人大金仓数据库

人大金仓产品简介 金仓数据库管理系统[简称:KingbaseES]是北京人大金仓信息技术股份有限公司&#xff08;简称人大金仓&#xff09;自主研发的、具有自主知识产权的商用关系型数据库管理系统&#xff08;DBMS&#xff09;。该产品面向事务处理类应用&#xff0c;兼顾各类数据分…

JAVA反射机制中获取字节码文件对象的三种方式

1&#xff0c;&#xff08;常用&#xff09;源代码阶段&#xff0c;Class.forName("全类名") 2&#xff0c;&#xff08;传参&#xff09;加载阶段 类名.class 3&#xff0c;&#xff08;前提有对象&#xff09;运行阶段 对象.getClass()

FPGA UDP RGMII 千兆以太网(1)

1 RGMII 接口 PHY 的 MII 接口有很多种, 例如 MII、 GMII、 RGMII、 SGMII、 XGMII、 TBI、 RTBI 等。其中 RGMII的主要优势在于,它可同时适用于 1000M、 100M、 10M 三种速率,而且接口占用引脚数较少。但也存在缺点,其一, PCB 布线时需要尽可能对数据、控制和时钟线迚行…

Banana Pi BPI-M6(Raspberry Pi 5 替代品)初始设置及固件烧录

Banana Pi BPI-M6&#xff1a;初始设置和镜像烧录 Banana Pi BPI-M6 的首次测试 在上一篇文章中&#xff0c;我比较了Banana Pi BPI-M6和Raspberry Pi 5的硬件特性。两者都拥有出色的硬件技术&#xff0c;在性能方面应该不会有太大的问题。 今天我想测试一下 Banana Pi。作为…

微信小程序使用阿里巴巴矢量图标

一&#xff0c;介绍 微信小程序使用图标有两种方式&#xff0c;一种是在线获取&#xff0c;一种是下载到本地使用&#xff0c; 第一种在线获取的有个缺点就是图标是灰色的&#xff0c;不能显示彩色图标&#xff0c;而且第一种是每次请求资源的&#xff0c;虽然很快&#xff0…

Git 分支管理流程探讨

为了确保项目稳定性&#xff0c;满足项目迭代与项目开发人员的增长&#xff0c;需要尽快制定一个规范的 Git 分支管理流程。此分支管理流程是在 Git-Flow 的基础上做了一些改变。 环境区分 环境分为以下四种&#xff1a; 测试 1 服&#xff08;开发自测&#xff0c;查看效果等…

使用c++17std库varaint替代varaint开源库报错处理

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、pandas是什么&#xff1f;二、使用步骤 1.引入库2.读入数据总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 例如&#xff1a;…

GCC + Vscode 搭建 nRF52xxx 开发环境

在 Windows 下使用 GCC Vscode 搭建 nRF52xxx 开发环境 ...... by 矜辰所致前言 最近有遇到项目需求&#xff0c;需要使用到 Nordic 的 nRF52xxx 芯片&#xff0c;还记得当初刚开始写博文的时候的写的 nRF52832 学习笔记&#xff0c;现在看当时笔记毫无逻辑可言&#xff0c…