狮子算法优化的长短期记忆网络在印度乌都皮地区地下水位预测中的应用

摘要

地下水是一种珍贵的自然资源。地下水位(GWL)预测在水资源管理领域具有重要意义。从观测井中测量含水层含水率是含水层信息的主要来源，是评价含水层含水率的关键。印度卡纳塔克邦的Udupi地区大部分由红土地形和片麻岩组成。由于地形的起伏和降雨的不一致性，乌都皮地区的GWL在夏季持续下降，大部分裸井在夏季出现干涸现象。因此，目前的研究主要是利用长短期记忆-狮子混合算法(LSTM-LA)建立地下水位预测模型。利用印度卡纳塔克邦Udupi地区观测井的历史GWL和降雨量数据开发了该模型。混合LSTM- la模型的预测精度优于前馈神经网络(FFNN)和孤立LSTM模型。基于lstm - la的混合预测模型具有更大的数据集前景。

1.介绍

《新印度快报》2018年报道的地下水(GW)调查显示，印度南部各邦的地下水位(GWL)非常低。调查显示，在卡纳塔克邦调查的1421口井中，有985口井显示gwl下降。调查还显示，乌都皮区GWL持续下降[1］．能够使用高级算法预测GW资源是至关重要的。GWL预测系统有超过六十年的历史[2］．在文献中发现了大量的研究工作，已经达到了一定的成熟水平。

水文地质GWL预测模型对GW系统的评价具有概率性、确定性和随机性。传统的GW流动模型是偏微分方程，其中嵌入了对含水层性质和边界条件的简化假设[3.］．这些天然地下水系统是复杂的，具有大量的参数，这些参数在时间和空间上都是高度可变的，如含水层参数如地层的水力传导率、地下水的储量、含水层的维数以及其他与地质构造相关的参数。为了简化GWL预测，研究人员试图探索各种参数来发展GWL预测模型[4］．

随着城市化和气候变化，水文模型对环境和水管理的重要性日益增加。水文模型大致分为概念模型、物理模型和数学模型[5］．数学模型进一步分为经验集总模型、概念模型和物理模型。基于物理的模型使用物理上可测量的静态输入变量，并需要研究领域的广泛信息。测量物理特性是很困难的，特别是对于预测模型，因为输入值会随着时间而变化[6］．物理模型虽然预测准确，但不太实用，因为它们在预测不规则变化的数据模式时效率较低[7］．为了克服这一限制，随着计算能力的迅速提高，最近采用了数据驱动模型，使用定量的历史数据来预测未来趋势[8]，已成为水资源管理部门的标准工具[9］．基于机器学习的方法在水文时间序列预测中具有广阔的前景。然而，许多技术依赖于人工神经网络(ANN)权值或架构的优化。数据驱动模型使用现有的数据和关于输入和输出参数之间关系的信息来开发。这些模型是特定位置的，输出值只适用于开发它的位置[10］．统计、模糊、回归和人工神经网络是这些数据驱动模型中通常使用的数学方法。人工神经网络模型在最近的文献中受到了很大的关注[11］．研究人员已经实施了ANNS的功能，以模型表面和地下水量[12］．BackPropagations（BP）广泛用于安培训。但是，发现ANN方法的结果不太一致和不稳定[8］．因此，需要更准确地预测实时GWL所需的替代和高级数据驱动的模型。

文献中使用多层前馈、循环网络和径向基网络发展了不同类型的ANN体系结构和算法[13］．Rani Sethi等人[14用BP学习算法研究了多层前馈，以开发水位深度预测模型。探索影响水位波动的重要参数，他们使用每月降雨，蒸发和水台深作为输入参数。他们在硬岩含水层中预测了一个月的地下水台深。使用在研究期间监测的有限输入数据集进行校准。通过足够的数据集和不同的架构，可以进一步提高模型的性能。传统的ANNS无法有效地处理顺序数据，这是主要缺点之一[15］．需要使用具有多个隐藏层的深度学习技术开发的提前期较长的预测模型。

在近年来，输入和经常性神经网络（RNNS）之间具有多个隐藏层的深度学习技术被广泛应用于近年来[16，17］．然而，标准RNN架构在捕捉变量之间的长期依赖方面存在困难，这是由于消失和爆炸梯度问题，而这种问题可以通过RNN的一种变体——长短期记忆(LSTM)来克服。LSTM直到最近才被用于水文时间序列预测[18］．Bowes等人[19比较了RNN和LSTM预测弗吉尼亚诺福克洪水易发城市GW表的数据。他们探索了两种机器学习算法LSTM和RNN来建模和预测GW表对风暴事件的响应，使用GW表、降雨量和海平面作为2010年至2018年的输入参数来训练和测试模型。根据他们的研究，LSTM网络被发现比RNN有更多的预测技能。Kratzert等人[20.]探讨了LSTM作为区域降雨径流模型在免费可用的camel数据集集区内的应用。他们测试了他们的方法，并将结果与著名的萨克拉门托土壤湿度核算模型(SAC-SMA)进行了比较，取得了更好的模型性能，这强调了LSTM在水文模拟应用中的潜力。LSTM RNN具有内部状态，可以学习预测不同的序列，具有良好的长时记忆能力，是传统前馈神经网络(FFNN)最吸引人、最强大的特征之一。

单独使用LSTM网络有几个缺点。学习大量存储单元的LSTM模型的计算代价很高。它还缺乏解释模型获得的最终决定的能力[21］．为了克服这一限制，采用了一种混合方法。Mohd Nawi等人[22[使用Cuckoo搜索混合技术在RNN上采用权重优化来调查数据分类器问题。收敛速率和局部最小问题被寻址为Cuckoo搜索算法。使用BPNN算法和其他混合变体与ABC进行比较该模型的性能。结果表明，当与混合方法耦合时，传统RNN的计算效率高度改善。钟和胫骨[23]利用现有的财务数据研究了一种新的股票市场预测模型。他们采用了混合方法的深度学习技术，将LSTM与遗传算法相结合。他们使用遗传算法(GA)来确定LSTM网络的时间窗大小和拓扑结构。实验结果表明，混合LSTM网络的性能优于基准模型。Rashid等人[24]开发了一种结构良好的LSTM来解决传统RNN网络的困难。他们使用了基于元启发式算法的四种不同的优化器，和声搜索(HS)、灰狼优化器(GWO)、正弦余弦算法(SCA)和蚁狮优化算法(ALOA)。研究了LSTM中由于长期依赖而导致的学习速度和准确性，并与RNN体系结构进行了比较。他们认为，LSTM的分类精度优于传统的RNN体系结构，而训练这些网络增加的复杂性可以通过使用替代的、强大的、自然启发的算法来解决。

有必要有一个计算效率高的模型，以最小的参数化预测水位。同时，这样一个模型应该能够处理预期的气候变化。为了克服传统方法的不足，提高收敛速度(预测精度)，需要一种更先进、简单、稳健、高效、准确的模型。狮子算法(LA)是Rajkumar在2012年开发的一种受自然启发的算法，它模拟了社会领地狮子的繁殖和对其他游牧狮子的防御。该LA可以与LSTM结合使用来寻找最优解。目前的研究旨在开发一种新的混合元启发式方法，利用LA优化LSTM网络的权值。该研究还旨在通过与标准前馈体系结构的比较，分析所提出的混合LSTM-LA方法在选定数据集上的性能。

2.材料和方法

研究开发并测试了一个混合LSTM-LA模型。本节描述了研究领域和所使用的数据集，FFNN模型的描述，所提模型的体系结构及其实现。

2．1．研究区域和数据集

地下水位预测面临的挑战之一是地下水的流动是地质构造所特有的。因此，GW分析是基于站点区域的。没有标准的基准可以用于GWL的预测，以建立模型的优势。因此，有必要通过收集特定区域的数据来开展区域GWL预测。该研究基于政府机构从印度卡纳塔克邦Udupi地区的一个观察井收集的次级数据(图)1）.卡纳塔克邦的地质非常复杂，其构造参数多种多样，包括红土岩、片麻岩、花岗岩、橄榄岩岩脉和海岸沉积岩类型[25］．本研究考虑的观测井位于红土地形[26］．

2.2。基于前馈神经网络的地下水位预测方法

基于模糊神经网络的GWL预测在GW研究中有着广泛的应用。在神经网络领域，对含水层模型最常用的算法是梯度下降算法。在本工作中，采用梯度下降法优化FFNN的权值。传统的基于梯度下降的算法对单个权重向量进行运算。采用梯度下降训练的两个输入、三个隐藏、一个输出节点的FFNN结构如图2．

FFNN的配置以随机的顺序学习，并且信息在网络的每一层中只沿着向前的方向流动。由于没有循环，它只能预测连续的目标变量。因此，为了学习渐进深度学习算法，实现了一种特殊类型的RNN LSTM方法，该方法在隐藏层中具有自连接门。

２.３.长短期记忆狮子算法(LSTM-LA)的混合方法

LSTMs，由Hochreiter和Schmidhuber介绍[][21，是一种特殊的rnn，能够学习长期依赖关系。与传统的FFNN相比，LSTMs选择性地长时间记忆模式。lstm能够通过精心调节的门(如遗忘门)将信息删除或添加到细胞状态F、输入门一世，输入调制门，和输出门（图3.）.

遗忘门有助于处理以前状态的输出H_T.-1并通过忘记不必要的信息来做决定。具有s型函数的遗忘层表示为1）.输入门通过适当的缩放添加新信息，sigmoid激活函数更新值，tanh函数创建新的候选值(方程(2）和（3.))。在适当尺度下更新的新候选值也如式(4)：

最后，s形函数的相关输出为:

基本LSTM Neuron具有单独的单元格状态，可跟踪长期连续信息。但是，用于大量存储器单元的学习LSTM模型变得昂贵。因此，目前研究采用杂交LSTM-LA方法，如流程图所示（图4）.

在LSTM- la混合模型中，通过对狮子的交配特性进行数学建模，优化LSTM网络的权值。被称为狮子的随机生成的解集的种群被初始化。可能的解决方案是LSTM网络的权值和偏差。

人口为2N狮子被分配到两组作为候选人口。在第一个时代中的LA初始化最佳重量和偏差，并将其传递到LSTM网络。算法中的第二步是配合过程，其确保狮子的生存以及不同成员之间的信息交换平台。使用父母的线性组合使用配合操作员在以下等式中给出的父母的线性组合，产生新的幼崽：其中NRM =种群中居民男性的数量和α=随机生成的数字和

在后代的每个基因上随机应用突变率为0.2的突变算子。在洛杉矶的最后一个阶段是防御操作员，包括防御新成熟的雄性居民和防御游牧狮子。这名防守人员在洛杉矶扮演着重要的角色，帮助他们留住强大的雄狮作为解决方案。游牧狮子和领地狮子是通过同样的方式产生的，领地狮子和游牧狮子进行了新的生存斗争。雄狮通过保护幼狮来占领领地，然后用新的解决方案来攻击雄狮。如果在狮群中，游牧狮子优于其他解决方案，雄狮就会被游牧狮子取代。领土接管是最后一步，这与遗传算法中的选择过程相同。在这一步中，寻找最优解来替代劣解，并重复配对过程，直到达到100个纪元的终止条件。洛杉矶将在下一个循环中用可能的最佳解更新权值，并继续搜索过程。

因此，随机初始化LSTM模型中各层的权值和阈值，LA搜索最优权值。如果达到终止准则，即迭代次数最大，则得到最优参数，否则重复优化步骤直到满足条件。然后，将优化后的LSTM模型用于GWL的预测。

采用LSTM- la、LSTM和FFNN混合模型对GWL的未来趋势进行预测。使用2000-2018年期间的数据集对LSTM-LA模型进行训练和测试，以适应不同的预测层位。将80%的数据设置为训练集，其余20%设置为测试集。将混合LSTM- la模型与LSTM和FFNN方法对2018年GWL结果的月预测结果进行比较。

3.结果与讨论

使用LSTM- la、LSTM和FFNN混合方法对2018年GWL的预测如下图所示5）.预测结果验证了观察结果。与混合LSTM-LA方法相比，FFNN基于FFNN的预测显示了前大使期间的误差。观察到，与LSTM和FFNN和其他方法相比，杂交LSTM-LA模型结果与原始数据更好地相关。因此，与传统的馈电方法相比，LSTM-LA方法更准确地预测。

我们考虑了两个性能指标来评估预测的准确性。数字6用统计指标均方根误差(RMSE)和平均绝对误差(MAE)说明了三种软计算方法的性能。RMSE是平方误差，它对预测和实际之间的较大偏差更敏感。另一方面，平均绝对误差是一种更合适的测量方法。混合LSTM- la方法的MAE和RMSE值较FFNN和LSTM方法低，表明混合LSTM- la方法优于独立方法、LSTM和FFNN方法。

使用LSTM- la、LSTM和FFNN混合方法对2019年GWL的月预测如图所示7．由于降雨量的不一致，该图显示了随季节而增加的趋势。

时间序列图（图8）显示使用所提出的混合LSTM-LA模型的未来GWL预测。从2000年1月至2017年12月开始，使用数据培训了216个月（18年）的培训。该模型能够准确预测未来趋势，最多一年的连续时间。

交叉验证重采样过程用于在有限的数据样本上评估不同的机器学习算法。交叉验证主要用于估计机器学习算法对未见数据的准确性。在5重交叉验证中，我们将原始训练数据集划分为5个相等的子集，称为折叠。机器学习算法的准确性是通过平均所有5种交叉验证的准确性来估计的。盒须图(图9)显示了每种算法在每个验证折叠上的预测精度分数的分布情况。

FFNN、LSTM和混合LSTM- la方法的预测精度(以中位数表示)分别为72%、88%和97.5%。将基于LSTM-LA的混合模型与基于传统FFNN网络结构的模型进行了比较。从上图的图中9，可以看出LSTM-LA方法比基于ffnn的模型具有更高的精度。

4.结论

纯净饮用水的缺乏是一个全球性问题。GWL为地下水资源评价提供了有用的信息。本研究开发了一种新的混合元启发式方法，使用lion算法优化LSTM网络的权值，以预测GWL。从政府机构获取了2000-2018年的GWL和降雨数据。该观测井位于印度卡纳塔克邦Udupi地区红土地带。将提出的LSTM- la模型的结果与基本FFNN和LSTM模型进行比较。FFNN模型学徒的学习顺序是随机的，而LSTM中的反馈循环使学习能够循序渐进。使用独立的LSTM网络有几个缺点。与训练数据相比，测试集中输入变量的分布不正常。因此，采用lion算法优化LSTM的权值，建立LSTM- la模型。 The lion algorithm looks for optimal point through different strategies by balancing exploration and exploitation. The hybrid LSTM-LA model is preferred over traditional FFNN and LSTM on its own, in terms of prediction accuracy and convergence rate. This research work concludes that GWL forecasting with systematically configured LSTM model surpasses the traditional FFNN model with higher efficiency.

数据可用性

用于支持本研究发现的数据可由通讯作者要求提供。

的利益冲突

作者声明本文的发表没有利益冲突。

致谢

作者感谢Nagaraj Rao，统计部门，乌杜普区，卡纳塔卡政府，德兰江先生和迪纳卡先生，高级地质学家Udupi区，为研究期提供宝贵的降雨和GWL数据。作者也感谢Mahipal高等教育学院（MAHE）和MIT学院（麻省理工学院），以支持这项研究工作。

参考文献

A. M. Sripad，卡纳塔克邦地下水水位下降《新印度快报》，印度金奈，2018年。
M. N. Eienen和M. Arshad，地下水问题规模，地下水综合管理，美国地质调查局，弗吉尼亚州莱斯顿，美国，2016。
D. kare、M. K. Jat和P. K. Mishra，“地下水水文:气候变化下可持续整体水资源管理概述”，第4.1-4.26页，2017年，印度新德里，Jain兄弟公司。视图:谷歌学者
C. P. Kumar和S. Singh，“地下水系统的概念和建模”，国际创新科学、工程与技术期刊，第2卷，第2期2，pp。262-271,2015。视图:谷歌学者
G. K. Devia, B. P. Ganasri和G. S. Dwarakish，《水文模型综述》，水生Procedia， vol. 4, pp. 1001-1007, 2015。视图:出版商网站|谷歌学者
M. El Alfy，“地下水数值模拟作为干旱地区水资源管理的有效工具”，水文科学杂志，第59卷，第59期6、pp. 1259-1274, 2014。视图:出版商网站|谷歌学者
M. knotter和M. F. P. Bierkens，“地下水位时间序列模型的物理基础”，水资源研究第36卷第2期1，页181 - 188,2000。视图:出版商网站|谷歌学者
V. Nourani, A. A. Mogaddam和A. O. Nadiri，“基于ann的地下水水位时空预测模型”，水文过程第22卷第2期26, pp. 5054-5066, 2008。视图:出版商网站|谷歌学者
B. Shirmohammadi, M. Vafakhah, V. Moosavi，和A. Moghaddamnia，“几种数据驱动技术在预测地下水位方面的应用”，水资源管理第27卷第2期2，页419-432,2013。视图:出版商网站|谷歌学者
田建军，李春华，贾林等，“利用数据驱动模型和gamma测试辅助预测地下水深度”，可持续性，第8卷，第2期1076, pp. 1-17, 2016。视图:出版商网站|谷歌学者
P. Coulibaly, F. Anctil, R. Aravena, B. Bobée，“地下水位波动的人工神经网络模型”，水资源研究，第37卷，第2期4，页885-896,2001。视图:出版商网站|谷歌学者
r .陶尔米纳,K.-W。Chau，和R. Sethi，“威尼斯泻湖沿海含水层系统每小时地下水位的人工神经网络模拟，”人工智能工程应用，第25卷，第2期8, pp. 1670-1676, 2012。视图:出版商网站|谷歌学者
高勇，“基于模糊神经网络的时间序列预测方法，”模糊集与系统号，第150卷。2，页331 - 350,2005。视图:出版商网站|谷歌学者
R. Rani Sethi, a . Kumar, S. P. Sharma, H. C. Verma，“利用人工神经网络预测硬岩盆地地下水位深度”，国际水资源与环境工程杂志，第2卷，第2期4, pp. 95-102, 2010。视图:谷歌学者
O. I. Abiodun, a . Jantan, a .E. Omolara, K. V. Daba, N. a .E. Mohamed, H. Arshad，“人工神经网络应用的最新技术:综述”，Heliyon，卷。4，pp。1-41,2018。视图:出版商网站|谷歌学者
A. Shrestha和A. Mahmood，《深度学习算法和架构综述》，IEEE访问， vol. 7, pp. 53040-53065, 2019。视图:出版商网站|谷歌学者
R. Talal，Z.Tariq和Z.T.T. Mohammed，“通过混合PSO-CUCKOO搜索算法培训经常性神经网络进行问题优化，”国际计算机应用杂志第159卷第1期3，页32-38,2017。视图:出版商网站|谷歌学者
肖颖、尹颖，“基于短时交通流生成的混合LSTM神经网络”，信息，第10卷，第5期。105，第1-22页，2019。视图:出版商网站|谷歌学者
B. Bowes, J. M. Sadler，和M. M. Morsy，“Madhur behl和jonathan L.goodal，用长期短期记忆和循环神经网络预测洪水易发海岸城市的地下水位，”水，第11卷，第1-38页，2019。视图:出版商网站|谷歌学者
F. Kratzert, D. Klotz, C. Brenner, K. Schulz和M. Herrnegger，“使用长短期记忆(LSTM)网络的降雨-径流模型”，水文与地球系统科学第22卷第2期11，pp。6005-6022,2018。视图:出版商网站|谷歌学者
S. Hochreitor和J. Schmidhuber，“长期内存，”神经计算，第9卷，第5期。8，第1735-1780页，1997。视图:出版商网站|谷歌学者
N. Mohd naawi, A. Khan, M. Z. Rehman，和Tutut Herawan，“混合元启发式杜鹃搜索技术用于数据分类的递归神经网络的权重优化”，工程数学问题文章编号868375,12页，2015。视图:出版商网站|谷歌学者
钟宏生及k.s.Shin，“遗传算法优化股票市场的长短期记忆网络”，可持续性，第10卷，第5期。3765，pp。2-18,2018。视图:出版商网站|谷歌学者
T. A. Rashid, P. Fattah，和D. K. Awla，“使用精度度量改进元启发式算法的LSTM训练”，Procedia计算机科学，第140卷，第324-333页，2018。视图:出版商网站|谷歌学者
B. P. Radhakrishna和R. Vaidya Nathan，地质的卡纳塔克邦，印度地质学会，班加罗尔，印度，2011。
印度政府，地下水信息手册，Udupi区，卡纳塔克邦，印度政府，水资源部，中央地下水委员会，德里，印度，2013。

应用计算智能和软计算