城市滨河绿地生态研究区域与数据来源 - PenJing8
城市滨河绿地生态研究区域与数据来源
2023-09-21 19:47:29  浏览:0
1研究区域与数据来源
 
1.1研究区域概况
城市滨河绿地生态研究区域与数据来源
本研究选取河北省石家庄市滹沱河城区段滨河绿地作为研究对象(图1)。滹沱河发源于山西省,横跨忻州、石家庄、衡水、沧州等多个城市。为提升水质,改善生态环境质量,滹沱河于2017年启动了生态修复工程,旨在打造滨河绿色空间体系。研究区段全长42km,含水体面积2925.58hm2,临近石家庄市正定县主城区,空间景观要素类型丰富,包含湿地、岛屿、花海等多种景观类型,具有防沙滞尘、拦截雨水、吸附大颗粒物、固碳释氧等多类生态系统服务效益,同时承载了旅游、观光、休闲、养生等多种文化服务功能。
 
1.2数据来源与预处理
 
用户生成内容(usergeneratedcontent,UGC)平台能够全面地反映游人对游憩场地的感知,对场地形象的塑造具有高可信度及可用性[26]。小红书是中国知名社交网络平台,截至2022年,月活用户超过2亿,采用UGC模式运营,鼓励用户上传自身的体验感受[27],由于该平台用户量庞大,其数据作为新兴数据源具有较强的研究应用价值。例如,汉雨棣等[28]以小红书平台作为媒介,构建公众参与下的长沙城市形象。
 
故本研究选取小红书平台评论文本数据作为数据源,以“滹沱河”为关键词对小红书中的词条进行检索,时间跨度设为2018年10月—2022年1月,利用Python爬虫获取评价信息及相关联的元数据共1393条,数据包含用户id、博文标题、博文内容、照片、日期、点赞数量等。为保证用户隐私,结果以汇总形式呈现。
 
 
研究区域的场地使用度数据通过两步路户外网获得。两步路户外网是中国专业的户外应用平台之一[29],平台内置的轨迹记录、兴趣点标注等功能为用户记录户外游憩信息提供便利,同时也为研究者提供了丰富的数据信息[30]。本研究在两步路户外网以“滹沱河”为关键词进行检索,利用Python爬虫爬取相关轨迹记录共313条。
 
研究区域的土地利用信息通过解译遥感影像获得。笔者采用2021年11月Worldview-3卫星遥感影像(分辨率为0.5m),通过随机森林法解译场地土地利用信息。为更清晰地识别研究区域场地的不同植被群落特征,根据研究区域现状植被特点,将场地的用地类型分为常绿针叶林、水体、灌木林、硬质、裸地、湿地、大面积地被、阔叶林、混交阔叶林、草地、密植阔叶林共11类。
 
2研究方法

城市滨河绿地生态研究区域与数据来源
 
本研究通过构建景观信息词典库,关联评论文本数据与场地空间,进行CES感知评价。研究过程分为以下6个步骤(图2):
 
1)利用Python爬虫获取场地社交媒体评论文本数据与使用轨迹数据,对文本数据进行词频统计,构建地点信息词典库;
 
2)以地点信息词典库为依据,提取分条社交媒体评论文本数据的景点信息及土地利用信息;
 
3)构建CES指标体系,并依据词频统计结果创建场地CES感知信息词典库,提取分条社交媒体评论文本数据中的CES评价信息;
 
4)编码景点信息及土地利用信息,关联评论文本与场地空间,进行CES空间感知制图;
 
5)计算轨迹数据的核密度,表征场地某区域使用度的高低;
 
6)通过空间自相关的方法,探究场地CES综合价值与场地使用度的联系,并为场地的改造设计提供建议。
 
2.1词频统计与词典库建立
 
文本挖掘可以从大量的文本数据中抽取有价值的信息[31]。本研究采用Python软件的第三方库jieba对预处理之后的文本进行词频统计。
 
1)对收集到的文本数据进行预处理,包括去除噪声、标点符号和停用词,并进行词干化和词形还原等处理。
 
2)计算每个词在文本中的出现频率,提取研究区域内描述景点、土地利用、CES感知信息的关键词,筛选得出1393条评论文本中重复5次以上的词频统计结果,删除地点范围过大及描述较为模糊的词汇,如滹沱河、正定、石家庄等。
 
3)以词频统计获得的高频关键词为依据,构建词典库,筛选出具有景观语义的词语,归纳研究场地内被提到的景点、土地利用与CES感知信息。创建景点与土地利用2个地点信息词典库,共计101个词汇;创建CES感知信息词典库,共计317个词汇。
 
2.2文本分词
 
文本分词是切割输入字串,实现词汇划分的自然语言处理技术。本研究利用文本分词挖掘社交媒体评论文本数据中的景点、土地利用与CES感知信息。判断收集到的评论文本是否包含景点、土地利用、CES感知信息词典库所包含词汇,并将景点信息、土地利用信息、CES感知信息结果输出。
 
2.3CES指标体系构建
 
为定义CES分类,本研究参考MA、生态系统和生物多样性经济学(TheEconomicsofEcosystemsandBiodiversity,TEEB)、国际生态系统服务分类体系(CommonInternationalClassificationofEcosystemServices,CICES)分类框架,并结合CES分词结果,选择以下6个指标作为本研究的CES类型(表1):观光游憩、科普教育、精神满足、美学体验、社会关系、文化遗产[32-35]。
 
2.4CES空间感知制图
 
首先,以Worldview-3遥感影像解译的土地利用信息及添加景点信息后的地图为底图,依据地点信息词典库,以“景点-土地利用”的方式编码底图,构成场地基本信息底图。其次,运用与处理信息底图相同的方式,对评论文本进行编码,获得编码评论文本的数量,以此作为该编码地点的CES综合价值评分[36],并对公园不同类别CES的感知频率进行统计[37]。最后,以评论文本的编码为依据,将各项评分链接到基本信息底图的地点编码上,最终获得研究区域的各类型CES感知频率及CES综合价值评价。其中,各类型CES感知频率计算式为
 
Fjjajja式中:是场地第类CES的感知频率,是提到第类CES的分词数量,是场地的文本分词总量。
 
2.5场地使用度评价
 
本研究场地使用度的评价数据来源于两步路户外网抓取的场地轨迹数据。核密度估算(kerneldensityestimation,KDE)是一种利用概率论原理估计已知数据集合的密度函数的经典算法[38-39]。本研究以轨迹数据出现在不同地点的核密度来表征场地某区域使用度的高低,并基于游人出行轨迹的集聚度,分析游人对场地的使用强度[40],其具体计算式为
 
f(x)nk(x)h(h>0(x?Xi)xXif(x)式中:为研究场地使用度的核密度估算值,为样本数量;为核函数,),为带宽,为估值点到事件处的距离。值越大,表示此区域内的场地使用度越高,反之则越低。
 
2.6空间自相关分析
 
空间自相关分析常用于研究场地空间变量的分布关系[41-43]本研究使用Geoda软件,应用局部双变量空间自相关(localindicatorsofspatialassociation,LISA)聚类分析,探索CES综合价值与场地使用度之间的关系。局部双变量莫兰指数是空间自相关性的度量指标,其取值范围为[?1,1],根据其正负可将空间自相关性描述为高-高(HH)、低-低(LL)、高-低(HL)、低-高(LH)4种类型。局部双变量莫兰指数的具体计算式为
 
IsnWijXikikXilil?Xk?Xlkl?k?lkl式中:为局部双变量莫兰指数;为空间单元数量;是衡量空间单元间临界关系的权重矩阵;是空间单元属性的值;是空间单元属性的值;、是属性、的平均值;、是属性、的方差。
 
本研究以p值与z得分判别全域空间自相关的显著性和聚集性。当p<0.100时,表示在90%的置信区间上拒绝原假设,当p<0.010时,表示在99%的置信区间上拒绝原假设,即研究内容存在显著空间自相关性。当z得分>1.96或<?1.96时,表示研究内容呈现明显聚类特征,当z得分取值范围为[?1.96,1.96]时,表明观测值间聚类关系不显著。局部双变量空间自相关分析的结果将以LISA聚类地图的形式在地理空间上可视化呈现。