×

基于卷积长短期记忆网络的NDVI预测方法研究

hqy hqy 发表于2025-03-02 20:04:41 浏览7 评论0百度已收录

抢沙发发表评论

作 者 信 息

潘信亮1,张 震1,江 涛1,隋百凯1,孙玉超2

(1. 山东科技大学 测绘科学与工程学院,山东 青岛 266590;2. 国家海洋局 南海规划与环境研究院,广东 广州 510300)

【摘要】植被作为生态系统的重要组成部分,分析、预测其分布特征对目标地物监测、估产、自然灾害预测等应用具有重要意义。选取内蒙古自治区锡林郭勒盟为研究区,基于卷积长短期记忆网络(ConvLSTM),利用2000年2月至2012年12月500 m分辨率的MODIS逐月NDVI时序特征影像产品(MODND1M),通过对不同参数进行优化与调整,建立预测模型,实现了2013年逐月NDVI值的预测,并与同期NDVI产品进行对比分析。结果表明,植被生长周期4~10月预测数据整体上与产品数据趋势一致,决定系数R2平均值为0.678,精度最高可达0.835。该预测算法能充分利用空间时序特征实现对NDVI的预测,并为农作物估产、地上植被生物量估算等研究提供有力的技术支撑。

【关键词】ConvLSTM;时间序列;NDVI预测;MODIS产品

【中图分类号】F224.9 【文献标识码】A 【文章编号】1672-1586(2020)02-0060-08

引文格式:潘信亮,张 震,江 涛,等. 基于卷积长短期记忆网络的NDVI预测方法研究[J].地理信息世界,2020,27(2):60-67.

正文

0 引 言

植被指数(Vegetation Index,VI)是通过对遥感数据相应波段进行线性或非线性运算得到的一种能很好地反映作物生长状况、代谢强度和监测植被健康程度的指标因子,是作物估产、草地生产力计算、植被制图和生态环境评价等应用的重要参数和指标,在植被遥感应用中具有重要的物理意义。目前常用的植被指数有差值植被指数、比值植被指数、归一化植被指数及在他们基础上的改进型。其中归一化植被指数(Normalized Vegetation Index,NDVI)相对于比值和差值植被指数能更好地消除背景噪声,具有更强的抗干扰能力,因此成为应用最多且最有效的植被指数,与植被的覆盖度、长势密切相关,能很好地表示和反映植被空间分布及生长状况。

国内外学者利用NDVI在植被覆盖度、气候变化响应、环境监测、农业估产等方面做了应用研究,但均是利用已知的历史NDVI数据进行建模,会导致估产的滞后性,不能做到对未来数据的预测。而传统的预测方法如回归分析法、时间序列分析法、灰色预测法等都存在其预测的弊端。回归分析法误差较大,适合中期的预测,并且回归模型是一种因果关系模型;灰色预测法有较大的变动性,适合短期的预测,仅可处理线性关系;时间序列法准确性差且仅适合短期预测,传统方法都有其局限性而不适合于本文研究。近年来,神经网络迅速发展,凭借优秀的处理非线性数据能力、自适应力、泛化性和简便性而成为主流预测模型。循环神经网络(Recurrent Neural Network,RNN)是深度学习领域重要的分支,区别于其他神经网络,主要用于处理时间序列数据,其最大的特点是在上时刻的输出与下时刻的样本同时输入下一神经元,该网络结构能够记忆历史输入数据,这种串联的网络结构非常适合于时间序列数据。然而RNN结构的记忆序列较短,只能记忆短时期的上下文信息,而面对长序列的信息,随着学习量的增多或者学习周期的增长会导致梯度消失或梯度爆炸的现象。长短期记忆网络(Long Short-Term Memory, LSTM)则是针对RNN不足进行的改进,是由Hochreiter等首次提出并在近期被Alex Graves改良和推广,改良的LSTM在隐含层神经元中增加了遗忘门、输入门和输出门3个门控的设置以解决序列的长期依赖及梯度消失问题。近年来,有学者利用该深度学习算法对气象温度进行时间序列建模,通过分析国内外研究现状及对时间序列预测模型的研究与对比,提出了改进深度学习框架来进行温度时间序列预测的思路,最终证明,在深度前馈网络中加入时序特征的天气预报模型,效果要明显优于不考虑时序的模型但是LSTM只是针对于一维时序数据,无法对空间数据进行预测分析。Xingjian Shi等针对该不足提出了卷积长短期记忆网络模型,该模型可以直接对空间数据进行处理,实验证明该算法在时空上解决了临近降水预报的问题,在捕获时空相关性方面具有较好的效果。

ConvLSTM具有直接处理空间数据的优势,本文探究将该网络算法应用于遥感影像预测分析中的可行性,选择内蒙古锡林郭勒盟为研究区,利用2000~2012年逐月的MODIS NDVI时序特征影像产品,在时空尺度上对2013年NDVI进行逐月预测,并利用同期MODIS产品对预测结果进行精度评价。

1 研究基础

1.1 研究区概述

锡林郭勒盟是内蒙古自治区所辖盟,位于中国正北方,内蒙古自治区中部(如图1所示),属北部温带大陆性气候,其主要气候特点是风大、干旱、寒冷。年平均气温0℃~3℃,结冰期长达5个月,寒冷期长达7个月,1月气温最低,平均-20℃,为华北最冷的地区之一。该盟是一个以高平原为主体,兼有多种地貌的地区,地势南高北低,东、南部多低山丘陵,盆地错落其间,为大兴安岭向西和阴山山脉向东延伸的余脉。西、北部地形平坦,零星分布一些低山丘陵和熔岩台地,为高原草场,草原类型丰富

1 研究区位置图

Fig.1 Location of study area

1.2 数据源获取

研究采用的数据为MODIS中国月合成产品NDVI数据集MODND1M,其空间分辨率为500 m,采用最大合成法获取月内每天的最大值。数据来源于中国科学院计算机网络信息中心地理空间数据云平台(http://www.gscloud.cn)。数据以月为单位选取从2000年2月至2013年12月共167幅NDVI影像,影像产品的大小为883×1 498。

1.3 数据预处理

NDVI取值范围为[-1,1],考虑数据负值较少,在训练过程中会增加网络负担,为利于后续神经网络提取特征,加快网络收敛速度,建立最优模型,需要对原始数据进行Min-Max归一化处理,公式如下:

式中,X为影像归一化结果;x为影像中原始NDVI值;xmaxxmin分别为所有使用预测网络进行训练和测试NDVI产品中的最大值、最小值。通过Min-Max归一化后,NDVI取值范围变为[0,1],避免了负值的影响,利于神经网络的收敛,加快神经网络预测效率。

1.4 研究技术路线

ConvLSTM网络能充分提取影像空间特征输入到网络中,再不断学习时序影像的特征,经过优化网络参数,得到空间数据在时序特征上的规律,以完成网络的训练和测试。本文对NDVI影像处理主要包含预处理、网络训练、预测、反归一化等4个部分。首先将影像归一化并生成输入网络前的时序队列数据,使用ConvLSTM网络对输入的时序数据进行训练和预测,最后对预测结果进行反归一化得到最终的预测产品。总体流程如图2所示。

2 研究总体技术路线图

Fig.2 Overall research roadmap

2 实验原理

2.1 ConvLSTM网络

ConvLSTM是在LSTM网络的基础上进行的改进,主要针对二维的影像数据输入,利用卷积操作提取每个时间点处数据的空间特征,然后利用LSTM原理在时间维度上学习长期特征,进行长时间序列预测,使得网络预测能够同时掌握空间与时间上的特征。ConvLSTM较LSTM相比,是一种端到端的网络模型,从输入到状态和状态到状态的转换中都具有卷积结构,通过对图像进行卷积运算,提取数据空间特征,然后通过输入门与忘记门考虑新数据的输入与上一时间点的输出,综合形成新的细胞状态,最后通过输出门确定本时间点的输出。细胞结构如图3所示。下面详细介绍网络中的具体运算和运行原理。

3 ConvLSTM细胞结构图

Fig.3 The cell structure of ConvLSTM

1)卷积运算

卷积运算中包括卷积核及数字图像,卷积核指进行卷积的滤波器,卷积主要依靠卷积核的滑动进行运算,而数字图像指需要进行卷积运算的图像。卷积开始,卷积核于数字图像左上角开始滑动,滑动步长可自定义。每次滑动,在图像上提取卷积核大小的窗口,将卷积核与窗口内数值对应相乘并相加,最后将计算结果取代窗口中心像元像素值,如图4所示。

4 卷积示意图

Fig.4 Schematic diagram of the convolution

卷积示意图中,每当卷积核运算结束当前窗口后,根据步长大小向右移动步长距离,以此类推,自左向右,自上而下,计算完毕可提取图像特征形成一幅新的图像。卷积运算具有权值共享、局部链接的特点,能有效降低计算复杂度,加速收敛速度。ConvLSTM将LSTM与卷积运算结合,可以将卷积计算出来的特征直接输入到预测模型中,极大地提升了预测网络的利用率和应用价值。

2)Sigmoid函数

Sigmoid函数是神经网络中比较常用的阈值函数,可以将变量映射到[0,1]之间。Sigmoid函数由下列公式定义。

经过Sigmoid函数运算后,门控设置可以按[0,1]间数字比例选择输入数据,如遗忘门通过函数输出控制遗忘比例,输入门控制输入比例,输出门则控制本次细胞状态的输出比例。

3)tanh函数

tanh函数为双曲正切函数,对于输入的数据,tanh函数可以将其映射至[-1,1]之间。tanh函数公式定义如下所示。

在ConvLSTM细胞中,tanh函数主要处理细胞状态,得到[-1,1]间的值。

4)ConvLSTM细胞内部运算

ConvLSTM细胞内部计算公式如下所示:

式中,*代表卷积运算,为Hadamard乘积;Xtt时刻神经元的输入;ht-1t-1时刻神经元输出;WxiWxfWxcWxo分别为不同卷积运算中Xt的权重;WhiWhfWhcWhoht-1的权重;bibfbcbo为卷积运算的偏置值。it控制输入门,它利用sigmoid函数对输入的新数据及上以神经元的输出进行选择,决定该神经元的输入信息。ft控制遗忘门,输入参数同输入门,按比例遗忘上一神经元的输出,即控制保留上一神经元多少信息进入该神经元。Ctt时刻神经元的细胞状态,它结合上一神经元的细胞状态及t时刻输入的新数据,形成新的细胞状态。最后是输出门,通过门控设置,将本次细胞状态按比例输出,即为本次细胞输出ht

2.2 评价指标

通过决定系数()、均方根误差(RMSE)、平均绝对误差(MAE),对得到的预测结果进行分析评价,评定预测结果精度。公式(8)~(10)中n为数据个数,yi为真实数据值,为预测数据值,为真实数据的均值。

决定系数()又称拟合优度,表示了预测值的拟合程度如何。公式(8)中,SSR为回归平方和,SST为总平方和。

均方误差是真实值与预测值之差平方的期望值,可评价数据的预测程度,均方根误差(RMSE)为均方误差的算术平方根,用来衡量观测值与真实值之间的偏差,RMSE越小,预测精度越高。

平均绝对误差(MAE)又称平均绝对离差,是所有单个观测值与算术平均值的偏差的绝对误差的平均值,相比绝对误差能更好地反映预测误差的实际情况。

3 实验与分析

基于ConvLSTM网络,在网络环境设置的基础上,通过生成时序队列组合和反归一化等处理,对实验方案进行设计和参数优化,并对实验结果进行精度评价。

3.1 环境设置与运算流程

本实验是在Linux系统下,基于Python语言,借助Keras框架搭建ConvLSTM,具体参数见表1。

1 环境配置

Tab.1 Computer confifiguration

3.2 时序队列组合

类似于语音识别,输入数据的时序特征是网络的重要参数,错误的输入会直接导致网络的病态预测,因此数据的输入必须按照规定时序进行排列。将NDVI影像按时间顺序组成时间队列数据。根据NDVI变化规律选取适当的时间队列长度,进而将数据分解为由若干队列组成的队列组合。

如图5所示,设队列长度为n,按照时间顺序将NDVI分为若干组合。用X1Xnn张影像预测Xn+1X2nn张影像,此为第一队列组。去除X1,引入X2n+1,用X2Xn+1n张影像预测Xn+2X2n+1n张影像,此为第二队列组。队列组合的前进步长为1,即以1为基本单位逐次向前推进形成队列组合,以完成所有时序输入数据的学习。

5 时序队列组合图

Fig.5 Time series chart

3.3 反归一化处理

由于预处理中对神经网络的输入数据进行了归一化操作,因此网络输出结果与实际 NDVI不属同一量级,并非最终预测结果,需要对其进行反归一化得到最终预测NDVI。

公式(11)为反归一化公式,x为最终预测结果,即预测的NDVI值,取值范围为[-1,1],X为神经网络输出结果;xmaxxmin为原始数据中的最大、最小值。通过反归一化后的N D V I数据为最终预测结果,可进行后续精度评价。

3.4 实验方案设计与参数优化

为精确预测2013年的NDVI数据,实验在对队列长度、Batch_size、卷积核数等超参数进行优化设置的基础上,根据环境配置及预测要求,设计了9种实验方案进行预测计算,并对其结果进行精度评价与分析,最终确定最优参数与实验模型。方案的不同参数设置见表2。 

2 实验方案设计

Tab.2 Experimental design

其中,队列长度指数据预测的时间序列长度,如利用2012年12个月数据预测2013年数据,则队列长度为12;Batch_size是每次输入神经网络进行训练的队列个数;层数是指神经网络隐藏层层数;卷积核数代表隐藏层内进行卷积运算的卷积核个数。采用平均绝对误差、交叉熵等作为网络的损失函数,采用Adam、Adadelta等优化器进行反向传播进而调整网络参数。对所有的分类方案训练次数均设置为100次,使用143个月的NDVI作为训练数据对2013年4~10月的NDVI进行预测,分别使用MAERMSER2进行精度分析,以2013年9月为例对预测成果进行整理见表3。

3 20139月份方案精度对比

Tab.3 Accuracy analysis in September 2013

由表中可以看出,均方根误差及平均绝对误差在方案V中精度达最高分别为0.065及0.052,而决定系数在方案VII中最高为0.842,方案V及方案IX次高为0.835。综合评价最优方案为方案V。

考虑实地环境,由于锡林郭勒盟地区冬季天气寒冷,不宜作物生长,植被覆盖度较小,反映为NDVI值较小,不具研究意义,因此本实验着重研究4~10月NDVI数据,并对预测结果制作箱体图进行直观展示,其中箱体内部‘□’号为7个月预测结果的均值,如图6所示。

6 设计方案精度对比图

Fig.6 Charts of accuracy comparison

从图6中看出,当队列长度为12时,其均方根误差和平均绝对误差明显小于队列长度为3和6的,精度较高。但方案V至方案IX起伏较小,总体变化不大,其中方案V误差平均值最小并在误差最小值上表现优异,方案表现较为稳定。

9种方案的精度,队列长度为12的方案同样明显优于队列长度为3及6的,方案V、VII、IX上4分位数均达0.8以上,具有较高精度,但方案V平均值最高,最为稳定。

综合考虑精度对比结果,按方案V设置参数进行预测时,3个评价指标精度达最高且表现稳定,因此最终选定方案V为实验方案。方案V神经网络采用三层ConvLSTM层,每层卷积核大小为3×3,卷积核数为4,队列长度为12,损失函数采用Binary_crossentropy,用来计算预测值与真实值之间的Sigmoid交叉熵。优化器采用Adam,它为较常用的优化器,实现简单,计算高效,对内存需求少。Batch_size设置为1,即每次读入网络1个时间队列,可以有效减少内存消耗。

4 结果与评价

4.1 实验结果

实验具体将2000年2月至2011年12月共143幅NDVI影像作为训练数据集,将2012年1月至2013年12月共24幅影像作为测试数据集。考虑植被生长周期,设时间序列长度Sequence为12,因此训练数据共有120个队列组合。网络模型随迭代次数而变化的Loss值如图7所示,由于网络在迭代次数达到90次时基本已经完全收敛,因此将Epochs设置为100次,既避免了网络过度训练,又保证了网络精度。

7 网络迭代损失图

Fig.7 Relationship between iteration times and losses

通过训练后的ConvLSTM网络利用2012年NDVI数据对2013年进行逐月预测,对网络输出结果进行反归一化,得到与NDVI产品同一量级的预测值,选取2013年4~10月产品数据与预测数据如图8所示。

8 2013年实验结果对比图

Fig.8 Comparison of experimental results in 2013

从图8中可以看出,锡林郭勒盟东部地区NDVI较大,植被覆盖度较高,西部的 NDVI值相对较小,植被稀疏。预测数据与产品数据总体趋势基本相同,具有较高的拟合度,但相比产品数据存在偏高估现象,预测数值略大。

4.2 精度评价

为客观验证实验预测结果的准确性,以2013年9月NDVI影像为例,在研究区随机提取500个随机点做定量精度分析,如图9所示。

9 研究区随机点分布图

Fig.9 Distribution of random points in the study area

由图10可得,预测与产品数据的决定系数高达0.835,具有很高的拟合度,但回归系数为0.723,预测数据总体存在略高估现象。2013年4~10月预测结果的MAERMSER2精度数据如图11所示。

10 产品值与预测值的散点图及拟合效果图

Fig.10 The scatter plot and linear fifitting of product values and prediction values

11 预测结果精度分析图

Fig.11 Diagram of accuracy analysis

从图11可以看出,平均绝对误差和均方根误差从4~10月均有先增大后减少的趋势,并在6月表现为最大,最小平均绝对误差MAE、均方根误差RMSE都是在4月,分别为0.026、0.032,平均值分别为0.081、0.063;决定系数呈现不断提高的趋势直到9月最高为0.835,10月反而达到最低为0.401;5~9月NDVI的预测结果的平均绝对误差及均方根误差都在0.12以下,决定系数均在0.69以上,模型能够掌握NDVI影像的空间及时间特征,预测结果良好,具有较高的预测精度。而在4月与10月时平均绝对误差与均方根误差较其他月份表现更好,但决定系数却在0.5左右,相对其他月份表现略差。原因为在锡林郭勒盟区域植被返青期多集中于4月中旬及下旬,少数出现在4月上旬,黄枯期均多集中在10月中旬。在返青期及黄枯期阶段,植被初生或接近枯萎,植被覆盖度相对较小,NDVI值偏小,因此当预测结果与真实值有较小偏差时,反映到决定系数可能会出现较大误差,导致出现决定系数偏小的问题。就总体而言,网络模型的输出结果比较稳定,无奇异值出现,预测误差较小,精度较高。

5 结束语

本文研究了一种基于卷积长短期记忆网络预测NDVI数据的方法,该网络模型结合了卷积神经网络及LSTM两者各自的优点,既能像卷积神经网络一样提取二维影像图的空间特征,又能利用LSTM的优点,在长时间序列上进行影像预测,因此,ConvLSTM能同时保证空间跟时间的特征,实现对NDVI影像的预测。得到如下结论:

1)通过实验预测及精度分析,最终得到ConvLSTM的预测结果R2最高能达到0.835,MAERMSE精度最高分别为0.026、0.032,证明网络模型能够实现对NDVI影像的预测并具有较高的预测精度。

2)从预测数据与产品数据对比可看出,网络模型预测趋势一致且具较高精度,但结果存在略高估计现象,后续希望通过添加改正系数,调整预测结果,使其整体更接近真实数据值,进一步提高预测精度。

3)通过试验方案的比较选择及模型预测结果的精度分析,可得出ConvLSTM能够实现长时序影像的预测且有较高精度,方法可行。 

本期回顾

时空大数据与新型城镇化研究

· 新型城镇化定量研究的时空大数据应用需求分析

· 基于多元时空数据的新型城镇化动态监测指标体系研究

· 基于人群流动大数据的新型城镇化质量与对外交通协同发展研究

· 基于城市微博签到数据的人群活动时空特征分析

· 基于多源时空数据的粤港澳大湾区建设用地扩张及动力机制研究

·基于多源大数据的武汉城市圈城际通勤分布及影响因素研究

·基于夜间灯光遥感的城市垂直空间扩展研究——以武汉为例

·基于深度学习的公民参与城市治理的时空格局研究 ——以苏州市为例

·基于百度大数据的城市公共厕所空间布局合理性评价

理论研究

·面向无测风区域的复杂地形风场模拟研究

邮箱变更声

·《地理信息世界》邮箱变更声明

网站开通公告

·关于开通《地理信息世界》网站的公告

诚聘特约审稿专家

·诚聘|《地理信息世界》诚聘特约审稿专家

专题组稿

·约稿函|《地理信息世界》关于开辟“博士综述论坛”专栏的约稿函