本篇文章将视角聚焦于共享单车的出行距离和时间分布,为了更好地理解共享单车在特定时间段内的使用情况及用户行为特征,本文基于2020年12月21日上午06:00至10:00期间收集的共享单车订单数据进行了详细的分析,旨在探索共享单车在该时间段内的出行时长及距离分布特征。
除去了订单数据中用时为0的部分,同时把最远订单时长设置为1个小时30分钟,我们来统计一下这个范围内的订单时长分布,统计周期还是2020年12月21日 上午06:00-10:00,范围内的共享单车用时分布,可以看出来,5分钟以内的订单占比19.3%,5-10分钟的订单比例来到最高值22.4%,随后开始快速下滑,在15-20分钟这个区间的订单量仅占比6.5%,伴随着订单时间的拉长,后续形成了长尾效应。
这里解释一下计算方法,计算逻辑是获取一个订单的最早的记录时间和最晚记录时间,然后时间进行相减,就可以得到订单耗时多少秒,然后除以60秒即可得到分钟尺度的结果,接着再筛选出0<x≤120分钟这个范围内的数据;
我们再来统计一下这个范围内的订单距离分布,统计周期还是2020年12月21日 上午06:00-10:00,这里除去了订单数据中距离为0的部分,同时把最远订单距离设置为10公里,我们可以看出来,在这个统计维度下,500m以内的订单距离占比一半以上,在一公里开始断崖式下降,接着订单距离同样形成了长尾效应,
这里解释一下计算方法,上篇文章也说到了打点时间尺度就是15秒一次,基本上可以认为距离是沿路网通行的距离,计算步骤是先将首先按BICYCLE_ID排序,然后对于每个BICYCLE_ID内的记录,再按照LOCATING_TIME排序,然后把数据导出csv,并导入arcgis进行【点集成线】,然后计算一下几何长度,再筛选出0<x≤10公里这个范围即可,这个范围可以根据你想要的范围进行调整。
SELECT * FROM (表名) ORDER BY BICYCLE_ID, LOCATING_TIME;
这里也会存在一些漂移点而影响数据质量,这个需要自己对数据进行精细化处理,删除这部分值,另外,这里通过一个比较粗的去出除极端出行距离的方法,就是统计出行距离,如果超过某一个值比如20公里,就可以看一下这条数据是否存在漂移点;
- 出行时间
根据共享单车出行时间的统计分析结果,可知厦门岛共享单车出行时间的变化较显著,其中,5~10min 是最主要的共享单车出行时间,约占22.4%,10min 以下的单车出行距离约占 41.0%,表明共享单车更适合短时间出行需求。
- 出行距离
从厦门岛共享单车出行距离分布看,500m以内的出行距离最集中,占统计时段的 56%,1km以内的约占66%,表明短距离是共享单车最主要的出行需求。
文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。