Yuhao Kang GISer

Menu

图卷积建模城市场所属性

“城市需要相互交错、互相关联的多样性,这样的多样性从经济和社会角度都能不断产生相互支持的特性”

–简·雅各布斯《美国大城市的死与生》

在20世纪60年代,简雅各布斯深入考察了都市结构的基本元素,以及这些元素在城市社会经济生活中发挥功能的方式。使我们意识到了城市的复杂性,以及这种城市复杂性之间可能存在的关联。场所(place),是地理学研究中一个非常基础而又充满争议的概念。场所常常被用作表示“空间的一部分”,具有模糊的几何边界。人们在场所内进行着规律性的生活,赋予了场所以地名、类型等语义,带来了丰富的场所属性,形成了城市多元功能的划分。

由于每个场所都不是孤立的,场所之间以多种方式连接形成网络。场所和场所之间的二阶连接特征,构成了每个场所的地理语境,这对于理解场所的属性有非常重要的意义。一个合理的假设是:当选择合适的场所连接度量地理语境时,场所属性可以被更好地推测。例如,已有研究表明,城市居民的通勤流作为一种场所的二阶连接度量,有助于推断城市的用地功能属性(如图1所示)。

图卷积建模城市场所属性
图 1 每一个场所都不是孤立的,场所的连接构成了地理语境

场所之间的连接关系多种多样,多源地理大数据中感知到的场所属性带有多维度、非结构化等复杂特征,传统的空间预测方法很难实现对不规则场所格局的建模和推理。本文提出了场所图(place-based graph)对复杂的场所属性和多源的场所连接进行形式化表达,通过训练图卷积神经网络(graph convolutional neural network, GCNN)实现地理空间回归,充分挖掘地理语境中场所属性的可预测性知识。我们基于北京市五环内的203个场所提取了自然视觉特征和社会功能特征,构造了三种不同的场所连接语境进行定量的对比实证分析。结果表明,地理语境对属性的可预测性会产生显著的影响,可预测性的高低反映了地理属性的空间分布在不同连接度量下的差异。

模型方法

从社会感知大数据中我们能够获取很多与场所有关的信息。首先,根据基础地理信息数据和人类足迹提取出场所的不规则边界,表达为计算机可以处理的几何形状;接着,感知场所的各类一阶属性,表达为多维度的特征向量;并基于不同的二阶度量,刻画不同的场所连接,比如欧式空间的距离度量、拓扑邻接关系度量,以及非欧空间的空间交互度量,比如车流量等。如图2所示,将场所表达为节点,场所属性作为节点的特征信号,场所连接作为节点之间的边,可形成一个非常简洁的包含待处理信息的图结构,即场所图。在场所图结构的基础上,将一个带有X类别属性的场所图,和一个只含有部分(样本)Y类别属性的场所图,分别作为解释变量和因变量输入到图卷积神经网络模型中,通过训练神经网络实现对其余场所的Y类别属性的推测。本研究选择图卷积神经网络来处理场所图,相较于传统的空间回归计量模型有着几点改进:(1)由于所有场所在一个图结构中,所有未采样场所及其地理语境的影响也能被显式地建模(2)GCNNs不需要预定义核函数,从而综合考虑长距离(long-range)和短距离(short-range)的空间效应(3)GCNNs是非参数化的神经网络,能够充分拟合复杂的非线性空间关系。

图卷积建模城市场所属性
图 2 构造场所图以及使用图卷积神经网络推测未知场所属性的示意图

研究数据

【刻画场所边界】

本研究基于北京市内带有场所名称标签的243065个百度兴趣点,使用基于反密度权重的核密度方法勾勒了五环内203个主要场所名称所对应的空间边界表达,如图3所示。这些场所覆盖了被广泛认知的主要城市子区,包括著名的旅游景点、居民区、商业区等。其几何空间范围存在叠加、包含、分离等多种空间关系。

图卷积建模城市场所属性
图 3 北京市五环内的203个场所。部分高亮场所为:旅游景点,如颐和园(A)天安门(B);居民区,如和平里(C)、十里堡 (D);商圈,如国贸(E)和中关村(F)。

【量化场所属性】

本研究选择了两类场所属性,其一是人类对场所环境的视觉认知,其二是人类活动赋予场所的社会功能。这两者分别作为视觉特征和社会功能特征被输入到GCNN模型之中,其中视觉特征作为输入,社会功能特征作为待预测的属性。如图4A所示,ResNet18对场所内的98万余张街景图片进行深度特征学习,基于场所单元提取能够反映人类视觉认知的512维特征。图4B则绘制了基于带有活动标签的400余万次新浪微博签到计算得到的七种社会功能特征强度(对数标准化后)的空间分布。

图卷积建模城市场所属性
图4 场所属性的量化特征表达。A.从街景图片中提取的自然视觉特征; B.从社交媒体签到数据提取的七维社会功能特征,颜色饱和度越高代表该功能越强。

【度量场所连接】

此外,我们构造了3种不同的连接方式下的地理语境。

第一种为仅考虑自连接,不考虑场所之间的空间联系,这种连接场景可以表达为一个对角矩阵,对应于仅考虑解释变量和因变量的非空间回归模型;

第二种为考虑场所之间的拓扑关系,凡是存在边界的叠加便将对应的连接赋值为1。这种场景可以表达为一个二元矩阵,反映场所之间的基础欧式度量关系;

第三种为基于出租车O-D流得到的空间交互强度。这种连接可以表达为一个稠密矩阵,反应场所之间的人类移动性联系。

图卷积建模城市场所属性
图 5 三种连接场景的行标准化矩阵及频数直方图。

实验结果

图6A所示为选择20%的采样率时,某一次随机划分得到的20%的训练集场所和

剩余80%的测试场所。训练场所具有已知的视觉特征和社会功能特征,测试场所仅已知视觉特征而功能特征待预测。图6B给出了半监督图卷积神经网络模型,实现多维属性可预测性的并行挖掘。以含有视觉特征的场所图输入到7个两层的GCNN模型,每个模型输出一个维度的功能特征。基于训练场所的已知属性,通过后向传播对神经网络的权重进行训练。

图卷积建模城市场所属性
图6 A. 20%采样率下的训练场所和测试场所示意; B.推测测试场所的七维社会功能特征所用的图卷积神经网络模型

我们在20%采样率下进行了多次试验,发现不同场所连接度量带来的地理语境对七个维度的社会功能属性可预测性均会产生显著的影响。图7展示了在餐饮功能这一维度上的可预测性差异。统计意义上,当使用自连接度量时,测试集的预测绝对量平均误差MAPE为51.03%,说明通过视觉特征直接做非空间回归,对于餐饮特征的预测效果并不好。如果选择拓扑邻接关系建图,虽然加入了欧式空间度量,预测效果反而降低(MAPE≈80%),结果不稳定性也变大。这说明过于强调近程影响的语境反而会影响预测效果。当选择出租车空间交互语境时,MAPE达到16.24%,多次试验结果也变得更加稳定和鲁棒。

图卷积建模城市场所属性
图7 20%采样率下不同场所连接语境对餐饮功能推测精度的影响。A. 50次对照试验的预测绝对量平均误差MAPE箱线图; B.测试场所餐饮功能的预测结果空间分布

接着,我们固定地理连接语境为出租车O-D流,探索不同社会功能属性在给定视觉特征下的可预测性差异。图8所示为选取60%采样率下各功能属性最优的预测结果。可以看到,餐饮和居住有更高的可预测性,MAPE低于15%,说明出租车O-D流可以较好地帮助刻画这两类社会功能属性的空间关系;交通、商业以及娱乐特征的可预测性相对较低,MAPE约为30%,说明在分析这三类属性时,出租车O-D流并不是非常理想的一种二阶度量;另外,医疗、户外这些功能可预测性更差,MAPE约在40%左右,说明即使使用出租车O-D这种空间交互语境仍然很难对这类功能实现推测。由于场所社会功能属性与居民的活动有密切关系,我们的结果说明公园散步、医院看病这些活动在北京市内与出租车反映的人类移动模式的关系并不大。除此之外,我们在不同采样率下进行了多次的定量模拟实验,结果进一步说明,不同功能属性的可预测性差异是比较稳定的(参见原论文)。

图卷积建模城市场所属性
图8 出租车空间交互语境下各社会功能属性的最优预测结果在测试场所上的空间分布(60%采样率)

总结

因为研究人员很难确定何种场所连接方式能够反映与场所真正“关联”的地理语境,所以推测场所的未知属性是具有挑战性的。加之地理大数据中蕴含了丰富的场所属性和多样的场所连接,导致传统的空间预测方法无法充分挖掘这其中的可预测性知识,难以指导实际的空间分析工作。本研究在理论上,提出将图卷积神经网络(GCNN)应用于不规则的地理空间分布的建模和推测中,设计了神经网络视角下的空间回归模型来拟合复杂的空间依赖关系。在方法上,构建了场所图(place-based graph)实现对场所属性、场所连接的形式化表达。在应用上,为理解场所属性在地理语境下的可预测性提供了一种思路,可用于辅助评估空间模式,衡量城市社会经济发展与人类活动的关系,进而指导城市规划和居民生活。

参考文献

Di Zhu, Fan Zhang, Shengyin Wang, Yaoli Wang, Ximeng Cheng, Zhou Huang & Yu Liu (2020): Understanding Place Characteristics in Geographic Contexts through Graph Convolutional Neural Networks, Annals of the American Association of Geographers, DOI: 10.1080/24694452.2019.1694403

原文始发于:图卷积建模城市场所属性

— Written in
— Tags: