上海市职住关系和通勤特征分析研究

封面图.jpg


    本文基于2015年4月上海市公共交通卡刷卡数据,创建一般出行及虚拟换乘规则,建立上海轨道交通出行数据模型,并结合轨道交通网络空间数据模型,识别基于地铁出行的城市居民居住地、就业地和包括通勤时间、距离、空间分布等在内的通勤特征信息,并对典型就业中心和大型居住社区周边站点进行应用分析。研究表明,基于地铁的通勤出行者有130多万持卡人,平均通勤时间为34.82 min,平均通勤距离为12.4 km;居住地在内环内、内外环间及外环外各站的持卡人相差不多,但就业地则有近2/3分布于内环内;通勤出行方向呈现明显的向心性;典型就业中心辐射范围广泛,平均通勤时间越往市中心越低;各大型居住社区的地铁通勤量相差很大,通勤去向并不集中于内环内。

 

1  数据

    本文所利用的刷卡数据为2015年4月上海市完整一月的刷卡记录,来源于上海公共交通卡股份有限公司的“公共交通卡”,是绝大多数在沪人员持有的可充值的交通卡,一定程度上一张卡可对应一个人员。刷卡记录包含的基本信息有:卡号(C)、交易日期(D)、交易时间(T)、线路/地铁站点名称(S)、行业名称(H)、交易金额(M)、交易性质(Y)等信息。

 

2  方法

2.1  数据预处理与轨道交通的出行OD数据模型

2.1.1  一般出行规则

    要基于交通卡刷卡数据分析轨道交通OD及职住关系和通勤出行,需要对原始数据进行3步预处理,从而得到出行OD数据模型。第一步,删除行业名称不为地铁的数据;第二步,识别每个卡号每次完整出行。完整的单次地铁出行应包含相邻的进站记录和出站记录,按交易日期(D)、卡号(C)、交易时间(T)、站点名称(S)、交易金额(M)先后对所有数据进行排序,依次识别相邻行的关系,当同时满足条件:CN=CN+1,DN=DN+1,SN<>SN+1,MN<>0时,初步认定第N行和第N+1行是一次完整的地铁进出站记录,并将所有字段内容合并到新行。

 

初步完整出行数据表结构

1.PNG

 

2.1.2  虚拟换乘规则

    第三步,虚拟换乘站的数据合并。上海地铁由于种种原因,存在着多个换乘站需要出站换乘然后再进站,又称虚拟换乘。虚拟换乘将产生两次计费,使用上海公共交通卡在30 min内换乘享受连续计费的优惠,使用一次性地铁票则需购票两次。

    当同时满足条件:CN=CN+1,DN=DN+1,Tn+1-Tn<30min,

    S1、S2满足{(S1N=“1号线上海火车站”AND S2N+1=“3号线上海火车站”)OR

    (S1N=“1号线上海火车站”AND S2N+1=“4号线上海火车站”)OR

    (S1N=“3号线上海火车站”AND S2N+1=“1号线上海火车站”)OR

    (S1N=“4号线上海火车站”AND S2N+1=“1号线上海火车站”)OR

    (S1N=“1号线陕西南路”AND S2N+1=“10号线陕西南路”)OR

    (S1N=“10号线陕西南路”AND S2N+1=“1号线陕西南路”)OR

    (S1N=“2号线虹桥2号航站楼”AND S2N+1=“10号线虹桥2号航站楼”)OR

    (S1N=“10号线虹桥2号航站楼”AND S2N+1=“2号线虹桥2号航站楼”)}时,认定第N行到第N+1行是虚拟换乘,并修改第N行的值令S2N=S2N+1,T2N=T2N+1,MN=MN+MN+1,同时删除第N+1行的记录。处理后得到上海地铁2015年4月的完整OD数据模型。

2.2  职住地站假定

    地铁站点无法覆盖上海所有人口和岗位,故在此定义居住地站和就业地站来代替居住地和就业地。Barry等的出行模式假说提出,大部分乘客会回到上一段出行的终点来作为下一段出行的起点,而且当天的最后一段出行的终点与第二天的第一段出行的起点一致。假设每个交通卡每日的第一次进站为居住地站;同时,定义持卡人在某地停留时间超过6 h,可认为该地是持卡人的就业地站。

2.3  基于工作日数据识别职住地站

    由于交通卡每日刷卡记录存在差异,利用一整月的工作日数据来进行汇总分析才能准确识别持卡人的职住地站。以居住地站识别为例,建立一定的识别规则并利用决策树方法进行综合分析。同理,就业地站的识别与居住地站的识别类似。

 

2.PNG

基于工作日数据识别居住地站

 

2.4  通勤OD识别

    利用所识别的各卡号最终职住地所在站,可确定各卡号的通勤OD,通勤时间和通勤距离可简化为居住地站到就业地站的时间和距离。

 

3  职住识别与通勤特征分析

3.1  职住地站识别结果

    基于工作日数据识别规则,发现共有1 318 222张卡(占总量的14.69%)的居住地站与就业地站均被识别。

 

3.PNG

居住地站视角的交通卡量统计分布图

 

4.PNG

就业地站视角的交通卡量统计分布图

 

    为了更好地在空间尺度上表达职住地站分布,依据内环内、内外环间、外环外3个空间范围对所识别的量进行统计。结果显示,居住地站在3个空间范围内识别的量差距不大,但就业地站则主要分布在内环内,占比超过一半。

 

各空间范围内的居住地站与就业地站识别量统计

5.PNG

 

3.2  通勤OD识别结果

    剔除出行时间少于2 min、多于3 h的出行,统计通勤出行的平均时间为34.82 min。对各持卡人的平均通勤时间进行分布统计,发现大部分人乘坐地铁通勤时间在8—57 min,尤其以23—33 min的人居多。从空间视角分析,居住地站的通勤时耗呈向外递增的圈层现象,内环内的居住地站通勤出行时耗显著低于内外环间、外环外的居住地站;从就业地站视角分析,圈层现象则不那么明显。统计持卡人地铁通勤出行的平均距离为12.4 km,欧式距离为11.7 km。

 

各空间范围内的居住地站与就业地站的平均出行时耗(单位:min)

6.PNG

 

7.PNG

居住地站视角的通勤平均时耗图

 

8.PNG

就业地站视角的通勤平均时耗图

 

3.3  通勤出行的可视化

    将288个地铁站点两两建立OD矩阵,并与识别出的通勤出行相关联,保留有出行记录的OD。每个OD代表一个方向的通勤出行,属性包含有该OD的识别通勤出行量、平均通勤时间、通勤距离。可视化后发现主要的通勤大客流(深红色线)分布在1号线、2号线、9号线,少量分布在5号线、7号线、8号线等其他线路间。

 

9.PNG

主要通勤OD的出行量分级图

 

    从空间范围统计发现,内外环间到内环内的通勤量是最大的,其次是内环内到内环内、外环外到内环内,三者之和达62.98%,这更加验证了上海地铁通勤出行的向心性。

 

各方向通勤出行占比数据表(单位:%)

10.PNG

 

    分析上海地铁的极端通勤出行发现,通勤时间超过60 min的占总量的8.33%。选取出行量大于100次、平均通勤时耗大于60 min的通勤OD进行可视化,发现长时耗的通勤主要是从新城到中心城大型就业中心之间的出行,典型的长距离通勤出行有松江大学城到张江高科(84.38 min)、松江大学城到陆家嘴(78.43 min)、嘉定北到陆家嘴(73.23 min)、嘉定北到漕河泾开发区(71.73 min)等。同样地,选取出行量大于100次、但平均通勤时耗低于10 min的通勤OD,发现短时间的地铁通勤出行主要集中在内环内。

 

4  典型地区通勤特征分析

4.1  典型就业中心分析

    分析主要就业地站的通勤出行与通勤时间,识别去往4个就业地站的通勤出行并从中挑选出行量大于100的通勤OD进行可视化。

 

11.PNG

去往人民广场、淞虹路的通勤OD可视化图

 

12.PNG

去往张江高科、漕河泾开发区的通勤OD可视化图

 

    从通勤来源看,位于市中心的人民广场对全市各个方向的通勤吸引水平相当,辐射范围最广;漕河泾开发区辐射范围略小于人民广场,但其对西南方向的辐射性更强;张江高科类似于漕河泾开发区;而临空经济园区所在的淞虹路则相对辐射范围较小。

    从通勤时间上看,到达内环内各就业站的平均通勤时间差距不大,内环外的漕河泾开发区、张江高科和淞虹路显著长于内环内的就业站。

4.2  大型居住社区分析

    大居方面,识别从7个大型居住社区站点出发的通勤出行,并选取通勤出行量大于50的OD进行可视化。

 

13.PNG

大居出发的通勤OD可视化图

 

    结果显示,各大型居住社区站点出发的通勤出行方向各不相同,泗泾地区主要前往漕河泾开发区周边站点,周康航地区主要前往2号线地区诸如张江高科及陆家嘴地区,顾村地区主要前往7号线静安寺、长寿路附近,江桥地区则主要前往13号线的真北路及长寿路附近,地铁通勤量最高的是泗泾地区,显著高于其他3个大型居住社区。这也反映了大型居住社区出行的主要方向并非完全是内环内,而是呈现了一定的就近就业特征。通勤时间上泗泾、江桥平均时耗较少于周康航、顾村,但四地均显著高于外环内的平均水平。

 

 

详情请关注《上海城市规划》2016年第2期《上海市职住关系和通勤特征分析研究——基于轨道交通客流数据视角》,作者:许志榕,上海市城市规划设计研究院。

微信扫一扫
关注“上海城市规划”
公众号