1.数据来源
数据来源:MetroWatch地铁观察 | 地铁客流量数据
在做城市地铁客流数据的整理及可视化这块其实国内已经有很多大牛一直在做无偿免费的更新,其中覆盖多城市且每日更新数据的主要有两个:一个是地铁数据库 | 地铁客流量查询 (metrodb.org),另一个是微博用户@地铁客流及运输研究阿牛 的个人主页 - 微博 (weibo.com),这里提到是另一位''地铁观察''的作者,他的数据来源是均来自这些城市的地铁官微,这是也是我想做的事情,但是作者已经着手实现了并进行相当漂亮的可视化;
并且数据的尺度和统计角度也很丰富,我们就在此数据基础上略做分析,老规矩,我们打开开发者模式检索数据''data'' ,根据 JSON 数据,我们可以提取出每日客流量的具体数值。这里是从 2024 年 5 月 25 日到 2024 年 8 月 2 日的每日客流量数据,以下是数据的结构: 每日数据: x: 日期列表 y: 每日客流量列表 周同比变化: x: 日期列表 y: 周同比变化百分比列表 7日移动平均: x: 日期列表 y: 7日移动平均客流量列表;
2.基础数据
这部分数据我们以深圳为例,这里我只保留了客运量这个标签作为基础数据分析;
3.客流特征
因为现有客流的局限性,这里主要是提数据分析的角度和方法,首先我们可以看到周内的客流特征,以六月周内均值数据为例,总结下来我们可以看到前四天客流属于波动且略带上升的趋势,于星期五到达客流高峰,周六客流陡降,周天进一步下降;
3.1周变系数
这里提一个周变系数的概念通常用来描述一周内不同日子之间的变化程度,以某一天为锚定基数,计算其他同尺度的日期变化程度的系数值,这里以星期一为锚定基数,可计算其他星期变化程度,可以用来做预测;
我们先看看我们选取6月和7月其中四个完整的星期的均值,总均值差异在80万人次左右,这部分增量是主要因素是叠加了暑假的出行客流;
3.2月变系数
这里提一个月变系数的概念通常用来描述一月内不同日子之间的变化程度,以某一月为锚定基数,计算其他同尺度的日期变化程度的系数值,这里以6月为锚定基数,可计算其他月份变化程度,可以用来做预测,并且把月变系数可以进一步细化为,工作日月变系数和周末越变系数;
阶段性总结一下,这里由于数据时间尺度的限制,我们更多的是提供一个思路去研究客流的变化特征,并基于这个特征可以用来推测客流的变化。
4.看不到的数据
这部分有些主观,看个乐子就好;
这里我们把六月周内均值的工作日再求均值减去周末的均值,得到约153万人次,占比工作日均值的18.6%,什么意思呢,地铁常发出行的这部分人中有18.6%的人周末不会选择地铁出行,这部分人的特征是什么,工作日选择地铁作为主要通勤方式,周末休息,哪些人符合这些特征呢,答案就是我们以地铁这种交通方式作为主要出行方式的铁血打工人,且这个值是最低值,因为有一定比例的人群选择周末地铁出游、聚餐逛街的人从而提高总客运量,形成对冲;
我们再来分析一些看不到且有意思的数据,那看不到的是什么呢 ,这18.6%是均值,那我们再拆开来看呢,我们可以发现周六客运量相对于工作日均值下降了16.1%,而周天则下降了25.3%,这意味着这部分铁血打工人至少有9.2%的人单休,为什么是至少呢,叠加前面说到的周末选择地铁出游的人这个数据仍然减少这么多出行人次,另外一个原因,因为消费通常是有惯性的,大部分以地铁为出行的人群,选择打车出行的比例确实还是少数,虽然没有数据论证,但是这里还有一个数据佐证,来自《深圳市2023年国民经济和社会发展统计公报》,公报显示,2023年末,深圳市常住人口为1779.01万人其中,常住户籍人口606.14万人,占常住人口比重34.1%;常住非户籍人口1172.87万人,占比重65.9%意味着深漂的,还是大多数人,出行还是能省就省吧,不然真就深圳赚钱深圳花了,最后在大的人口基数面前任何一类人群都会随基数而放大,所以这部分全是我一家之言。
文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。