数据下的城市拥堵秘密:“抄小路”也是一门智慧

DT财经

百家号04-1112:47

文/张忠元、成慧敏

城市高速发展带来的交通拥堵问题一直是帝、魔两都的“心头病”,然而,帝都并非每条路都堵。本文数据侠创新性利出租车运营轨迹数据来分析路利情况,得出北京市存在支路利用率低的问题,并为城市研究提供新思路。

本文转自公众号市政厅(ID:shi-zheng-ting)

随着大数据时代到来,中国着建设交通信息化程,旨在将各类交通数据应于城市管理,充分利各类交通数据资源。作为城市交通的必不可少的部分,出租车以GPS数据记录了司机在受到路限制条件下载客的时空轨迹[1]。

出租车司机有丰富的经验,他们往往会根据经验选择最优的路线。出租车司机出行主要依靠4种道路:城市道路分为快速路、主路、次路和路[2-3]。

长期以来,在道路规划中,人们往往把光聚集在快速路以及路建设上,忽略了路的规划建设,导致城市路衔接不畅。本应为们带来较便利性的路体系变成了各类“断头路”、“瓶颈路”和“错位路”。

2016年26中共中央国务院发布《关于进一步加强城市规划建设管理工作的若干意见》后,们才开始度重视该问题。但是,们关于上述意见的讨论还仅限于定性研究,据我们所知,前还没有从定量的层提供建议。

在此,我们基于收集到的北京市出租车运营数据和纽约出租车运营数据,试图量化回答两个问题:

1. 北京市是否存在路利率低的问题?

2. 如果存在,那么哪些地路利率低的情况最严重?

一、数据与方法

我们收集到2012年11北京市和纽约市的出租车运营轨迹数据,其中包括5134909条北京市出租车和纽约市11797410条黄色出租车的运营记录。图1为北京和纽约的出租车位置分布图,颜色越亮表示车流量越大。

(图片说明:a 北京市出租车位置分布图,b 纽约市出租车位置分布图)

为研究支路利用率的问题,我们首先构造出绕路比指标:R=Dt/Dl

其中Dl指两点之间的直线距离,Dt指两者之间的行驶距离。

行驶距离为出租车的行车记录仪记录下来的距离,直线距离由我们通过计算上车坐标与下车坐标之间的球面距离而得。R值越大,说明行驶距离与直线距离之间的差异越大。R值和路利率紧密相关。如果城市路利率越,即出行的直线距离和驶距离的差别越,R就越接近1。反之,如果城市路利率越低,R就越。这样的特征在短距离的旅中表现得尤为突出(有研究表明,短途出行时,出租车司机更倾向于选择支路[4])。

二、北京与纽约的对比

北京市与纽约市都是以汽车和地铁作为主要客运交通具的特型城市。2012年11,两市出租车运营直线距离和上车时间分布密度如图2所示。

从运营距离看,两市出租车的运营直线距离都集中在0到5000,且都呈现右偏分布的特征;从上车时间看,两市出租车的运营时间都呈现出约三个波峰的分布特征,且三个波峰出现的位置基本相同。因此,两市出租车运营状况具有定可性。

(图片说明:上车时间(左图)与直线距离(右图)分布密度图。左图中的X轴表示时间,1表示凌晨1点,2表示凌晨2点,….,23表示晚上11点。)

整体对比

如表1所示,北京市R的平均数是1.582,纽约市R的平均数是1.477。我们使t检验法检验两市的R是否具有显著性的差异。结果显,北京市R显著于纽约市R,说明从总体看来,北京市路利率显著低于纽约市路利率。

(图表说明:不同城市的R值特征。其中MN表示均值,MD表示中位数,STD表示标准差,Q1表示四分之一的中位数,Q3表示四分之三的中位数。)

按上车时间分组比较

我们对上车时间,按照1时为组距,分组统计两市出租车的R。我们对每组R 都做了T检验。检验结果如图3所示,乎所有时段,北京市绕路显著于纽约市绕路,车流量较的时段,两市绕路都较,车流量较的时段,两市绕路都较低,北京市绕路的波动纽约市绕路更明显。

按直线距离分组比较

我们对直线距离,按照500 为组距,分组统计两市出租车的R。本对每组R 都做了T检验。检验结果如图3所示,直线距离于6500 时,北京市R值显著于纽约市的R值。值得注意的是,69.06% 的北京市出租车运营和87.64% 的纽约市出租车运营处于该范围。

(图片说明:绕路按上车时间(左图)和直线距离(右图)分组较;实线表北京市, 虚线表纽约市,红区块表北京市R值显著于纽约市R值,蓝表纽约市R值显著于北京市R值,白色表示t检验结果不显著。)

按时间距离交叉分组比较

最后,我们直线距离按500为组距,对上车时间以1时为组距进了交叉分组, 对每组的结果进了t 检验。检验结果如图4所示,北京市绕路显著于纽约市绕路的区域呈现出明显的集群特征。在北京,小于5000米的短途出行时,绕路比显著高于纽约,该特征在白天尤为明显。

综上,我们得出结论:北京市的确存在支路利用率低的问题。

(图片说明:绕路比按时间距离交叉分组比较。图中X轴表示直线距离,纵轴表示上车时间。 红色格子表示北京市R显著高于纽约市,蓝色格子表示纽约市R值显著高于北京市,颜色越深,差异越大。白色表示t检验结果不显著。)

以上分析显, 北京市确实存在路利率低的问题。

三、绕路比高的出租车,主要的上车点及下车点在哪?

那么,到底北京哪些上车点,存在路利率低的问题? 同理,哪些下车点存在路利率低下的问题也是我们关的。

时间特征分析

车流量高峰期时,为避让拥堵路段,有些出租车司机选择其他路段,同时带来一定副作用——绕路,从而降低R值衡量支路利用率的可信度。因此我们主要关心非高峰期时段的情况。我们将时间划分为24 个时,如图5所,不同时间段下R 值的分布呈现以下特征:

(1)7-9 点为上班峰时期: 该时段内R 值的上车点分布较为分散。

(2)10-17 点天峰期: 该时段内R 值的上车点主要集中在中关村和北京南站等区域。

(3)18-22 点为下班峰期: 该时段内R 值的上车点分布比较分散。

(4)23-6 点为夜间峰期: 该时段内R 值的上车点主要集中在军事博物馆和望路区域附近。

(图片说明:图中红格表绕路较的地点。按时间分组展:a 图表7点到9点,b 图表10点到17点,c 图表18点到22点 ,d 图表23 点到凌晨6 点。)

空间特征分析

我们将0到20000的直线距离划分为41 个区间,每个区间的长度均为500 。如图6所,不同距离段下R 值的分布呈现以下特征:

(1)0-1000 短距离出: 这段距离出的出租车绕路值最,R 值的上车点集中分布在五棵松、军事博物馆等区域。

(2)1000-5000 中短距离出: 中短距离出的R 值短距离出时低, 说明这段距离的绕路情况短距离时有所缓和, 主要集中在北京南站、国家图书馆和王府井等区域。

(3)5000-10000米中长距离出: 这段距离出的出租车R 值的上车点集中分布在北京南站、丰台科技园等区域。

(4)10000-20000米长距离出: 这段距离出的出租车R 值的上车点集中分布在北京的郊区,北边集中在西二旗,南边集中在丰台科技园。

(图片说明:图中红格表绕路较的地点。按直线距离分组展:a 图表1000米以内,b 图表1000-5000米,c 图表5000-10000米 ,d 图表示10000米以上)

综上,我们得出以下结论: 北京市R值高的上车点主要集中在王府井、国家图书馆、北京南站、中关村、军事博物馆和和五棵松带。同理,我们也可以对下车点进行分析,北京市R值高的下车点主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松和积水潭等区域。

哪些地方的支路利用率低?

目前为止,我们静态分析了哪些上车点上车和哪些下车点下车会绕路较远, 那么绕路绕得较远的路程是从哪上车和哪下车的?

为解决这个问题,接下来以动态的视,从两开展分析:

,R值的上车点主要集中在王府井、中关村、国家图书馆、北京南站、军事博物馆和和五棵松区域附近。从这些上车点出发的出租车,是去哪些地下车会绕路绕远呢?分析结果如图7所示。

另,R值的下车点主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松和积水潭等区域附近。到达这些下车点的出租车,都是从哪些地方出发导致绕路绕得远呢?分析结果如图8所示。

(图片说明:固定上车点,找R值高的下车点。图中紫和绿格表固定的上车点, 其中绿格表从该点出发到达该点绕路比也高。红色方格表示从绿色(或紫色)方格出发,且绕路较的车辆到达的终点。)

(图片说明:固定下车点,找R值高的上车点。固定下车点,找R值高的上车点。图中紫和绿格表固定的下车点, 其中绿格表从该点出发到达该点绕路比也高。红色方格表示到达绿色(或紫色)方格,且绕路较的车辆出发的上车点。)

当固定R值的上车点时,我们发现,其对应的下车点都在上车点附近。应用同样的思路,固定其下车点,我们也发现对应的上车点都是在下车点。这结论和我们之前的分析致,即R值的记录都是短途旅,短途旅中更多依赖路,因此,我们能够找出路利率低的地。

R值的上车点和下车点重合的区域为王府井、北京南站、军事博物馆、国家图书馆、五棵松,说明这些区域的路利率低下的情况较严重,在这些区域邻近范围内驶都会绕路绕得远。

结论与建议

我们创新性利出租车运营轨迹数据来分析路利情况,不仅为城市研究提供新思路,得出的结论也具有很强的实际意义。我们通过系列分析,得出北京市确实存在路利率低的问题,路利率最低的区域主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松这些区域。

其实北京市存在很多路,只是由于各种原因,如没有路标指、路与其他道路之间不连通等,导致路利率低下。建议管理者着重在这些区域加强路规范化管理,包括对违规占道售卖和停放的管理、对路硬化和绿化的管理以及加强路路标指引建设的管理等。

参考文献:

[1] H. Cai, X. Zhan, J. Zhu, X. Jia, A. S. Chiu, and M. Xu, Physica A: Statistical Mechanics and its Applications 457, 590 (2016).[2] S. A. Arhin, L. N. Williams, A. Ribbiso, and M. F. Anderson, Journal of Civil Engineering Research 5, 10 (2015).[3] T. Toledo, H. Farah, S. Morik, and T. Lotan, Transportation research part F: tra_c psychology and behaviour 26, 180 (2014).[4] 李恒鑫. 基于紧凑城市理念步原则的街区尺度与道路模式研究.Master’s thesis, 南京学, 2014

编辑 | 王旭晶: wangxujing@dtcj.com

题图 | 站酷海洛

▍数据侠门派

本文数据侠张忠元,中央财经大学统计与数学学院教授。成慧敏,中央财经大学统计与数学学院博士生。

▍加入数据侠

“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。

本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。

返回顶部