长三角一体化先行启动区水体生境质量评价 - PenJing8
长三角一体化先行启动区水体生境质量评价
2023-09-20 15:37:54  浏览:0
长三角一体化先行启动区水体生境质量评价深度学习模型构建

长三角一体化先行启动区水体生境质量评价
 
基于CNN图像分类方法,长三角一体化先行启动区水体生境质量评价深度学习模型构建包含3个步骤(图2):
 
1)模型训练数据集准备;
 
2)CNN搭建与模型训练;
 
3)准确度测试。
 
3.1模型训练数据集准备
 
在研究数据集中随机选取4000张卫星瓦片图作为本研究的模型训练数据集,用于深度学习模型的训练、验证与测试。
 
3.1.1图像分类评价指标体系
 
目前影响力较大、应用较为广泛的水体生境质量评价方法有河流生境调查法(riverhabitatsurvey,RHS)[18]、快速生物评估草案[19]、河流状态指数[20]等。其中,以RHS为前身的URS是目前国际上主流的城市河流评价方法之一[21],该方法将城市水体生境与自然水体生境的异同纳入考虑范畴,能较为准确地对城市水体生境进行分类评价,评价结果可为水体生境的生态修复提供参考[22]。URS主要由3个部分组成[23-24]:
 
1)城市河流生境调查方法;
 
2)数据库与数据管理系统;
 
3)城市河流生境的专题分类与专用于水体生境质量评价的河段生境质量指数(stretchhabitatqualityindex,SHQI)。由URS手册可知[24],URS通过对大量实证研究数据的分析归纳得到指标决策树,并从中筛选出对河流生境影响程度较高的指标,包括物理环境、植被类型、材质类型3个大类及其下属的14个小类;对指标进行评分与加权计算得到SHQI值,结合与SHQI值对应的“很好、好、一般、较差、差、很差”6个等级的评价标准,可得到水体生境质量等级。
 
结合相关研究的可行性论证[21-25],本研究将以该指标体系为基础对深度学习模型训练数据集进行分类标注。由于材质类型中的河床材质指数无法通过图像识别,且在通过指标决策树进行打分叠加计算时,发现该指标剔除后对SHQI值的分类结果影响较小,因此,本研究最终使用的水体生境质量评价指标为:物理环境类别中的植被堆积边数量、河岸自然断面比例、河道生境类型数量、水流缓流比例;植被类型类别中的河岸乔木连续性指数、河岸乔木特征指数、水生植被平均覆盖度、主导水生植物类型、河岸表层植被结构复杂度;材质类型类别中的固定河床材料比例、护岸存在比例、河岸材质指数、主导护岸材质等级。该评价指标体系是模型训练数据集图像分类标注的依据,也是水体生境质量评价深度学习模型的图像评价规则。
 
3.1.2模型训练数据集分类标注
 
依据图像分类评价指标体系对模型训练数据集中的4000张水体生境图像进行人工打分,并加权计算出SHQI值,进而结合SHQI值的评价标准对图像进行评价,并将评价的等级结果作为图像分类标注的标签(label)。为减小误差,本研究结合实地调研结果,严格按照评价方法对图片进行打分。评价结果为:“很好”0张,“好”94张,“一般”544张,“较差”1071张,“差”2050张,“很差”241张。由于“很好”类别无对应图片,缺乏模型训练所需数据,且实地调研时未发现“很好”类别的水体生境,因此,本研究中的图像分类标签最终设定为5类,水体生境图像质量相应地确定为5个评价等级。
 
3.2CNN搭建、模型训练与准确度测试
 
图像分类是CV领域的一个基础任务,能够以最小误差将图像划分成不同类别[8]。与传统机器学习相比,基于深度学习的图像分类网络更加适用于大批量数据的处理,且具有更高的准确性[8]。CNN是当前较为前沿且被广泛使用的图像分类架构,具有局部连接、权值共享、池化操作等特点,其模型具有一定程度的不变性、强鲁棒性和较高的容错能力[8]。
 
本研究采用基于深度学习的图像分类方法,搭建CNN并进行模型训练与优化,经过准确度测试后,得到长三角一体化先行启动区的水体生境质量评价深度学习模型。

长三角一体化先行启动区水体生境质量评价
 
本研究使用TensorFlow2.0框架读取模型训练集数据,将模型训练数据集中的图像以6∶2∶2的比例随机分为训练集、测试集与验证集,再搭建CNN进行模型训练(图3)。由于部分类别的图像样本量较少,为提高模型准确率,在模型训练时使用数据增强的方法对数据集进行扩充。
 
在训练的过程中,每个训练轮次(epoch)结束后,需要使用验证集来验证当前模型的性能,以进一步优化模型,确定最佳参数;验证完成后再使用测试集来测试模型的准确度。