研究方法
2.1 研究区域概况
上 海 市 黄 浦 区(北 纬 121 °28 ′, 东 经31°13′48″)地处上海市中部核心区域,全区面积 20.52 km2[16]。根据第七次全国人口普查数据,黄浦区常住人口 662 030 人,人口密度达3.23 万人 /km2[17],属于典型的高密度城市街区。区域内经济、社会活动密集,老旧社区较多,服务设施相对落后,建成空间与自然要素混合程度较高。同时,区域内百度街景图像数据资源丰富,有利于保证研究结果的精确度(图 2)。
2.2 街景图像数据采集与语义分割
本研究通过百度地图采集街景图像。为了对上海市黄浦区街道品质的居民感知水平进行全面测度,在开放地图(Open Street Map, OSM)网站下载路网数据,每隔 50 m 设置并生成百度街景图像采集点,在 GIS 中对街景采集点进行视线方向计算,确保所有街景图像采集点的视角平行于该道路的空间前进方向。整个研究区域,共生成了 24 575 个采集点。
随后通过 Python 语言构建统一资源定位符(uniform resource locator, URL),调用百度 街景地 图的应 用 程 序 编 程 接 口(application programming interface, API),从 4 个方向分别获取 90°街景图片共 98 300 张,并拼贴形成样本点的 360°街景全景图片,共获得 24 574 张。图像的像素设置为可访问返回的最大数值 1 024×512像素的街景图像。
随后通过 Python 语言构建统一资源定位符(uniform resource locator, URL),调用百度 街景地 图的应 用 程 序 编 程 接 口(application programming interface, API),从 4 个方向分别获取 90°街景图片共 98 300 张,并拼贴形成样本点的 360°街景全景图片,共获得 24 574 张。图像的像素设置为可访问返回的最大数值 1 024×512像素的街景图像。
构建深度学习网络用于街景图像语义分割(图 3)。训练数据集为 g ADE_20K 数据集,包含了天空、道路、汽车、植物等 150 个日常生活场景中的元素。研究中应用的 Seg Net 图像语义分割法是由剑桥大学团队于 2015 年开发并公布的图像分割的开源项目,可以对图像中的物体进行像素级别的精确分割。该网络主要由编码网络(encoder)与解码网络(decoder)两部分组成。
encoder 主要对物体信息进行压缩提取,decoder 将提取后的语义信息还原至输入图像尺寸,即每个像素都可以分类对应物体信息的颜色。训练结果显示训练集精度为 90.83%,验证集精度为 89.95%,表明该模型可以较好地实现街景图像的解释性工作。
2.3 基于街景图像的居民感知评价
本研究以 VGG 卷积神经网络结构为基础构建深度学习网络(图 3),通过 MIT Place Pulse 数据集进行城市环境感知训练[18]。该数据集将感知分为安全、活力、美丽、富裕、压抑和无聊 6 项指标。已有研究基于该感知分类从城市居民健康[15]、城市安全性[19]、城市网红空间识别[20]等方面进行了探索,并证明该 6 项指标能够完整地表述人类感知情况,且居民的文化背景、收入水平、种族等差异不会对结果造成偏差[19]。基于上述原因,本研究选取这 6 项感知指标全面评估空间品质对景观服务的影响,并进行综合计算以消解单独感知指标在空间分布上的误差。
训练神经网络模型进行街景图像感知的两两比较判别,从而模拟居民对两张街景图片的感知评估。训练验证集不同感知指标预 测 精 度 显 示 如 下: 安 全(81.25%)、 活 力(78.13%)、美丽(84.37%)、富裕(81.25%)、压抑(81.25%)、无聊(78.13%)。采用 Microsoft True Skill 算法将成对比较的图像进行排名并获得感知分数[21],针对 24 575 张街景图像进行了 122 875 次对比预测,然后将各感知分数进行归一化处理并将分数区间映射至 [0,1]。True Skill 算法认为每张街景图像感知分数在所有图像中符合正态分布 N(μ,δ2),且设定计算 6 项感知的均数 μ 与 δ 均取相同数值,因而归一化后的 6 项感知结果可以进行相加求均,
从而获得综合感知得分,计算式如下:式中:Ptotal指对特定图像 i 的总体感知得分;Psafety为图像 i 的安全感知得分;Plively为图像 i 的活泼感知得分;Pbeautiful为图像 i 的美丽感知得分;Pwealthy为图像 i 的富裕感知得分;Pdepress为图像 i 的压抑感知得分;Pboring为图像 i 的无聊感知得分。
2.4 多元线性回归分析
城市街区环境感知往往受到多个因素的共同影响。相较于单一的自变量预测,由多个自变量的最优组合来共同预测因变量更为有效也与实际情况更为匹配,因此多元线性回归模型更具有实用价值。本研究基于 SPSS 23.0 统计分析软件,以影响街区环境的 3 项主要视觉景观要素(绿视率、天空视率、建筑视率)作为解释变量,构建多元线性回归模型,从而研究城市街区环境视觉要素与各类感知情况及综合感知情况之间的关联性,通过计算模型的 Beta 标准回归系数比较不同视觉景观要素对居民感知的影响强度差异,进而对景观感知服务功能进行解释。