利用兴趣点数据估计中国上海市中心的通勤模式外文翻译资料

2022-12-29 11:44:42

利用兴趣点数据估计中国上海市中心的通勤模式

原文作者 Mengya Li^a,b, Mei-Po Kwan^b,c, Fahui Wang^d, Jun Wang^a

单位 ^a华东师范大学地理科学学院地理信息科学教育部重点实验室

^b美国伊利诺斯大学厄巴纳-香槟分校地理与地理信息科学系

^c荷兰乌得勒支大学人文地理与空间规划系

^d美国路易斯安那州立大学地理与人类学系

摘要：通勤是城市生活的重要组成部分。长途通勤会对个人和社会产生负面影响，例如压力、生产力下降、交通拥堵和空气污染。然而，研究人员经常面临缺乏数据的挑战，例如通勤距离、持续时间、出发/到达时间以及中国等国家的起点/目的地。本研究使用兴趣点（POI）来估计就业地点，并实施基于重力的模型来估计中国上海市中心的区际通勤模式。调查结果显示，上海中部城市西部有一条“繁忙走廊”，尤其是在早高峰时段。该模式与上海实时交通状况报告基本吻合。当研究数据有限时，我们的方法为研究通勤模式提供了一个很有前景的选择。

关键词：通勤模式；重力模型； POIs数据；中心城区；上海

1.简介

城市内通勤模式可以通过工作和居住的空间分隔以及通勤者的特征来解释(Wang， 2000)。许多研究已经研究了通勤模式与城市形态之间的相互作用（Cervero，1989；Cervero和Wu，1997；Giuliano和Small，1993；Crane，2000；Sultana，2002；Sohn，2005；Wang和Chai，2009；Zhou等人，2014）。一些人（例如，Cervero，1989）认为，工作与住房的平衡显著影响通勤，而更好的平衡可以缓解美国大城市中几个紧迫而持久的问题，如拥堵、能源消耗、空气污染、城市扩张和阶级隔离。另外一些人(如Giuliano和Small，1993)则认为工作和住房的平衡对通勤的影响很小，甚至没有影响，因为个人对居住和工作地点的选择取决于比工作机会更重要的因素，比如社区质量、绿色空间的可用性以及种族和民族的混合。另一个值得注意的文献集中在通勤行为与通勤者的社会经济属性的关系，包括性别(McLafferty和Preston，1991；McLafferty，1997；Kwan，1999；Sermons和 Koppelman， 2001；Kwan和Kotsev，2015），职业（Sang 等，2011），收入（Shen，1998；Ibeas 等，2013），婚姻状况和家庭类型（Lee 和McDonald，2003；Sultana，2005）。

在数据源上，通勤研究有三种类型。首先是调查数据，包括官方的政府人口普查和研究人员的非正式调查。交通规划方案普查(Census for Transportation Planning Package, CTPP)在美国是一个很受欢迎的数据源。例如，Wang(2000)用CTPP 1990来解释芝加哥交通分析区域(TAZ)中通勤距离和时间的变化。Sang等人(2011)利用CTPP 2000构建了一个非聚合的通勤-工作模型，以考察明尼苏达州罗切斯特市按性别和职业划分的平均通勤距离的差异。Habib等人(2009)利用“交通明天调查2001”分析了大多伦多地区的通勤时间表。Merriman等人(1995)利用1985年的日本人口普查来衡量东京市区的过度通勤。在中国，由于缺乏这样的官方数据集，Wang 和 Chai(2009)对736户家庭进行了面对面的访谈，考察了北京的工作-住房平衡与通勤之间的关系，Zhou等人(2014)对50,000多名居民进行了调查，分析了北京市的通勤模式。这两项研究都强调了单位(中国从中央计划经济时代继承下来的工作场所-住房一体化单位)在通勤方面的作用。

其次，研究人员使用各种模型来估计与通勤有关的数据。由于通勤出行很少因个人的工作职责而改变或取消，更有可能是通勤者遇到诸如恶劣天气和高空气污染物暴露等不利事件（Kaur等，2007；De Nazelle等人，2012；Lie等人，2015）。然而，这种规律性是对大型复杂的工作人员组生成的通勤流进行建模的先决条件。模型的选择取决于研究问题和地理范围。重力模型是衡量商店，停车场，医疗保健和工作的可访问性的一种流行选择（Hansen，1959；Luo和Wang，2003），因此也被广泛用于估算各种各样的区域间交通（或行程分布）。它强调了距离衰减对两个区域间相互引力的影响(例如，距离较远的地方之间通勤较少，而人口稠密的地方之间通勤较多)(Sohn，2005)。该模型需要有关出发地和目的地大小（即工作和驻地工人）的现成数据以及旅行距离或时间矩阵。基于活动的模型，通常作为结构方程来实现，用于小规模的研究，以揭示个体行为与社会经济属性之间的关系。Kuppam和Pendyala(2001)利用基于活动的旅行调查数据和结构方程模型，揭示了华盛顿特区通勤者的社会人口特征与他们的活动参与和旅行模式之间的关系。Cheng和Chen(2015)采用类似的方法研究了南京低收入通勤者的出行行为。

第三组研究依赖于定位技术和大数据。大地理空间数据为我们提供了解社会经济环境的新机会(Liu 等人，2015)，包括通勤模式。例如，Long等人(2012)基于北京公交出行一周的智能卡数据，绘制了居民小区和商业区之间的通勤流量，发现结果与家庭出行调查数据几乎吻合。Zhou等人(2016) 利用移动信号数据分析了就业空间不匹配对上海通勤行为的影响。Shen等人(2013)使用北京的一个七天GPS数据集，通过三维地理可视化研究了个人日常通勤行为的变化和灵活性。迄今为止，大规模的地理位置数据或社交媒体签到数据(如Twitter、Facebook、Weibo)被广泛用于预测城市交通和出行行为,（Crampton等人，2013；Hasan和Ukkusuri，2014；Shelton等人，2015；Poorthuis和Zook，2017），但还没有用于区分通勤和一般的旅行活动。主要原因是在这类数据中没有确定出行目的。为了克服这一限制，已经尝试采用多源数据。例如，Bao等人(2017)将智能数据和兴趣点(POIs)数据结合起来，研究纽约市共享单车出行模式。通过对目标站周边POIs的分析，他们能够对出行目的进行大致的分类。一些人仍然怀疑来自大数据的知识的可靠性，担心它可能是“算法应用的手工艺品，而不是数据本身”(Kwan，2016:275)。

中国不像美国的CTPP那样收集有关旅游活动的官方数据，有关就业地点的信息也很有限。上述的非正式调查或大数据可能是非常昂贵和费时的，对大多数研究人员来说是不可行的。数据限制是中国通勤研究的一个主要障碍。本研究旨在提供另一种研究通勤模式的数据挖掘方法。具体来说，本文使用兴趣点(POIs)数据来估计就业地点，然后对通勤模式进行建模。虽然我们的工作是在上海进行的，但这一方法可能适用于任何城市，包括那些交通数据更为匮乏的中国二三线城市。此外，现有的大多数关于上海和中国其他大城市通勤模式的研究都使用了区域等大型分析单元。我们的工作重点是上海中心城区(CUA)是更精细的规模。

2. 研究区域

在过去的四十年里，上海在城市化进程中经历了重大的空间和社会转型。截至2016年底，全市常住人口超过2420万人，其中农民工约1000万人。年龄在20-60岁之间的居民占总人口的67.75%，略高于就业人数(1370万)(http://www.stats-sh.gov.cn)。

选择上海中心城区（CUA）作为研究区域有两个原因。首先，推广开放数据，上海是中国试点城市之一，通过其官方网站(http://www.datashanghai.gov.cn/)向公众提供涵盖各种城市特征的数据集，包括人口、交通、城市规划等，这在一定程度上促进了我们的研究。其次，之前的研究调查了整个上海的通勤模式，但对中心城区的关注不够。CUA是一个特殊的地理单元，由外环与郊区分隔(图1)。虽然只占城区领土的10%，但它支持了近一半的人口和经济活动。陆家嘴、徐家汇、南京路等著名商业中心云集于此，吸引了一批世界级的企业入驻。近年来，郊区几个分中心的出现在一定程度上分散了市中心的住房和就业机会。然而，CUA仍然保持着很强的凝聚企业和员工的能力。与此同时，它还面临着最紧迫的城市问题，比如交通拥堵。因此，在更细的尺度上，CUA中的通勤模式应该受到特别关注。

图1. 上海市中心城区及年平均每日通勤人次 (2栏)

上海交通有五条重要干道，分别是外环线高架高速公路、中环线高架道路、内环线高架道路、南北高架道路和延安高架道路。自20世纪90年代以来，这些道路，尤其是高架道路的设计和建造，都是为了缓解交通拥堵。但日益增长的交通需求带来的挑战仍然存在。根据《上海交通运输年度报告(2015)》，居民可以通过各种方式在一天内完成超过2500万次通勤和2700万次非通勤出行。几乎一半的日常出行发生在CUA，而只有41%发生在郊区的大片地区。另外10%是跨地区旅行，从郊区开始，在CUA结束，反之亦然。因此，除了城市层面的整体通勤模式外，对CUA区域层面通勤特征的研究成果，可能对缓解交通拥堵等问题具有更大的意义。

本研究在考虑行政单位和路网的基础上，将CUA划分为89个区域。为了发布CUA内全天实时交通状况，上海旅游网站(http://www.jtcx.sh.cn) 将其划分为68个区域，与行政单位(乡级)基本一致。每个区域都有一个值得注意的区域，如前面提到的陆家嘴和徐家汇。由于68区域方案中存在一些较大的区域，不适合进行出行活动分析，因此将主要道路作为分割边缘进行进一步划分。最后，89个区域的平均面积为7.27平方公里。最大的一个面积为15.89平方公里，最小的一个面积为1.5平方公里。超过60%的区域面积在6到14平方公里之间。

3.定义常驻工人和就业人员

对通勤旅行的分析从它们的起源和目的地开始，分别由常驻工人和就业人员定义。定义常驻工人是相当常规的并且是先要解释的。一个更具挑战性的任务是估计就业地点，这需要更深入的讨论，也是本节的重点。

计算常驻工人依赖传统的数据来源，即2010年中国全国人口普查。由于人口普查使用区块作为基本统计单位，因此采用区域加权插值方法（Wang，2015）将人口普查区块的数据转换为89个通勤区域。首先，我们覆盖了人口普查区和通勤区的各层，并计算了每个相交多边形（Area1）的面积。其次，根据人口数据分配到相交的多边形中即

Popu¹= (Popu²/Area²)* Area²

其中Popu¹为面积为a¹的相交多边形中的人口，Popu²为面积为a²的人口普查块中的人口。最后，落入同一通勤区的多边形中的人口（Popu¹）由相同的区域ID（称为Popu³）聚合为通勤区域的人口。

一旦在通勤区一级估计了人口数据，我们就可以确定常驻工人的空间分布。由于上海的教育水平较高，20岁以下的人口在劳动力中所占的比例微不足道，因此被排除在外。考虑到强制年龄限制(男性60岁，女性55岁)，中国20-60岁男性居民为856万人，20-55岁女性居民为703万人。考虑到上海适龄劳动力参与率接近100%，这一数字(1559万)是对常住工人的合理估计，占总人口的67.75%。将Popu3均匀地乘以67.75%，得到每个通勤区的常住工人人数。

如前所述，中国没有官方的就业地点数据。本研究使用兴趣点(POIs)数据来估计它们。顾名思义，POI是一种关于感兴趣地点的开放数据，广泛应用于数字地图，如谷歌地图、百度地图和Amap(后两种地图仅在中国可用)。用户可以根据自己的需要搜索POIs以获得更好的服务。人们出于不同的目的访问不同的POIs，如工作、购物、娱乐、社交等。本研究从通勤的角度研究工作场所，并假设所有POIs都与工作有关。也就是说，每个POI都可以是特定人群的工作场所。POI有一些特定的服务功能，可以反映其就业规模(例如，餐馆需要50名员工，而机场需要500名员工)。在这里，第i (E_i)区的就业是通过使用该区域内的POIs数量以及按其职能分类的POIs类别，从POIs中派生出来的如

E_i= （1）

其中E_i是区域i中的就业总数，e_j是属于类别j的POI的估计平均就业，N_ij是属于区域i中的类别j的POI的数量，n是区域的数量，m是数量 POI类别。通过使用“平均就业”，我们假设此类别j中的所有POI提供相同数量的工作。估计过程分三个步骤详述如下。

3.1.识别POI类别

通过web爬行Python程序从Amap (http://ditu.amap.com/)中提取POIs数据。由于研究区域和数据挖掘cap room同时存在大量POIs，因此对POIs进行了逐项、逐区的提取。关于每个POI的信息包括名称、X

剩余内容已隐藏，支付完成后下载完整资料

Using points-of-interest data to estimate commuting patterns in central
Shanghai, China
Mengya Li^a,b, Mei-Po Kwan^b,c, Fahui Wang^d, Jun Wang^a

a Key Laboratory of Geographic Information Science (Ministry of Education), School of Geographic Sciences, East China Normal University, Shanghai 200241, China
^b Department of Geography and Geographic Information Science, University of Illinois at Urbana-Champaign, Urbana, IL 61801, USA
^cDepartment of Human Geography and Spatial Planning, Utrecht University, 3508 TC Utrecht, The Netherlands
^dDepartment of Geography and Anthropology, Louisiana State University, Baton Rouge, LA 70810, USA

Abstract

Commuting is an essential part of urban life. Long commutes have negative impacts on individuals and society, such as stress, loss of productivity, traffic congestion and air pollution. However, researchers often face the challenge of lack of data such as commute distance, duration, departure/arrival time, and origins/destinations in countries such as China. This study uses points of interest (POIs) to estimate employment locations, and implements a gravity-based model to estimate interzonal commuting patterns in central Shanghai, China. The results reveal a “busy corridor” in the west of the central city, especially during the morning peak hours. This pattern corresponds well with reported real-time traffic conditions in Shanghai. Our methodology offers a promising alternative for studying commuting patterns when such data are limited.

Keywords : Commuting pattern Gravity model POIs data Central urban area Shanghai

1. Introduction

Commuting is the movement of workers between residence and workplace. Intraurban patterns of commuting can be explained by the spatial separation between jobs and residences, and by the characteristics of commuters (Wang, 2000). Many studies have examined the interaction between commuting patterns and urban form (Cervero, 1989; Cervero and Wu, 1997; Giuliano and Small, 1993; Crane, 2000; Sultana, 2002; Sohn, 2005; Wang and Chai, 2009; Zhou et al., 2014). Some (e.g., Cervero, 1989) argue that jobs-housing balance significantly influences commuting, and better balance can relieve several pressing and persistent concerns in U.S. metropolises, such as congestion, energy depletion, air pollution, sprawl, and class segregation.Others (e.g., Giuliano and Small, 1993) contest that jobs-housing balance has minor or no effects on commuting, because individual workers choice of residence and workplace depends on factors more important than job access, such as neighborhood quality, availability of green space, and racial and ethnic mix. Another notable strand of literature focuses on commuting behaviors in relation to commuters socioeconomic attributes including gender (McLafferty and Preston, 1991; McLafferty, 1997; Kwan, 1999; Sermons and Koppelman, 2001; Kwan and Kotsev, 2015), occupation (Sang et al., 2011), income (Shen, 1998; Ibeas et al., 2013), marital status, and household type (Lee and McDonald, 2003; Sultana, 2005).

On data sources, there are three types for commuting studies. The first is survey data including official government censuses and informal surveys by researchers. The Census for Transportation Planning Package (CTPP) is a popular data source in the U.S. For example, Wang (2000) used the CTPP 1990 to explain the variations of commuting distance and time across traffic analysis zones (TAZ) in Chicago. Sang et al. (2011) used the CTPP 2000 to construct a disaggregate journey-towork model for examining differences in average commuting distance by gender and occupation in Rochester, Minnesota. Habib et al. (2009) used the Transportation Tomorrow Survey 2001 to analyze commute schedules in the Greater Toronto Area. Merriman et al. (1995) employed the Japanese Population Census 1985 to measure excess commuting in the Tokyo Metropolitan Area. In China, for lack of such official datasets, Wang and Chai (2009) conducted face-to-face interviews with 736 households to examine the relationship between job-housing balance and commuting in Beijing, and Zhou et al. (2014) surveyed over 50,000 residents to analyze the commuting patterns in Xian. Both studies emphasized the role of danwei (a workplace-housing integrated unit inherited from the centrally-planned economy era in China) on commuting.

Secondly, researchers used various models to estimate data related to commuting trips. As commuting trips are seldom altered or canceled because of ones job obligation, commuters are more likely to encounter adverse events such as bad weather and high exposure to air pollutants (Kaur et al., 2007; De Nazelle et al., 2012; Li et al., 2015). However, this regularity is a prerequisite of modeling commuting flows produced by a large and complex worker group. Selection of models depends on the research questions and the geographic scale. The gravity model was a popular choice for measuring accessibility of stores, car parks, health cares, and jobs (Hansen, 1959; Luo and Wang, 2003), and was thus also widely used for estimating interzonal traffic (or trips distribution) at various scales. It emphasizes the distance decay effect on the mutual gravitation between two zones (e.g., less commuting between farther places and more commuting between populous places) (Sohn, 2005). The model requires readily available data on the origin and destination sizes (i.e., jobs and resident workers) as well as the travel distance or time matrix. Activity-based models, often implemented as structural equations, are developed for studies on a small scale to reveal individual behavior in relation to socioeconomic attributes. Kuppam and Pendyala (2001) used activity-based travel survey data and structural equations models to reveal the relationship between commuters socio-demographic characteristics and their a

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[276532]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码

利用兴趣点数据估计中国上海市中心的通勤模式外文翻译资料

1.简介

2. 研究区域

3.定义常驻工人和就业人员

3.1.识别POI类别

1. Introduction

您可能感兴趣的文章

最新文档

推荐栏目

登录

注册

找回密码

利用兴趣点数据估计中国上海市中心的通勤模式外文翻译资料

1.简介

2. 研究区域

3.定义常驻工人和就业人员

3.1.识别POI类别

1. Introduction

您可能感兴趣的文章

最新文档

推荐栏目