一种河流水体中溶解氧的预测方法、系统及介质

本发明涉及水质预测,具体涉及一种河流水体中溶解氧的预测方法、系统及介质。
背景技术:
1、溶解氧(do)作为评价河流污染最重要的水质指标之一,其可以直接指示水生生态系统的状况。适宜的do含量是保证水中动植物正常生长发育的先决条件。低do水平会导致缺氧从而危及水生生物的安全,如鱼类会生长缓慢,甚至死亡;高浓度的溶解氧会导致生物体过度生长,从而破坏生态系统平衡。因此,准确预测do浓度有助于水资源的管理和保护,可以为决策者制定有效的水资源管理和污染控制策略提供强大的技术支撑。
2、当前,物理模型和统计模型是预测溶解氧的主流工具。然而,物理模型,如vollenweider和kirchner-dillon,需要大量的其他水质参数来校准模型,受制于数据可获取性和模型内部对复杂生化反应的过度简化致使其实现准确预测仍具有挑战性。统计模型,如arma和时间序列分析模型,要求序列服从稳态变化,然而,在气候变化和人类活动影响下河道水体中do含量呈现出较强的非线性和非平稳性,统计模型很难捕捉其变化过程。综上,现有技术对于河流水体中溶解氧的预测准确性不佳。
技术实现思路
1、为解决上述问题,本发明提供一种河流水体中溶解氧的预测方法,该方法突破了传统模型对大数据的依赖且预测精度差等问题,提供了一种所需数据少、预测精度高、全自动的预测方法,能够精准地预测河道水体中的do浓度。
2、为实现上述目的,本发明提供了如下的技术方案。
3、一种河流水体中溶解氧的预测方法,包括以下步骤:
4、获取河道水体的气象、水文和水质作为输入变量,采用随机森林模型对输入变量进行重要度排序,以此确定最优输入变量;
5、采用stl算法将溶解氧时间序列分解为趋势项、季节项和残余项,并利用最优输入变量分别构建溶解氧趋势项、季节项和残余项的lstm预测子模型;
6、通过麻雀搜索算法对溶解氧趋势项、季节项和残余项的lstm预测子模型的超参数进行自动寻优,获得优化后的溶解氧趋势项、季节项和残余项的lstm预测子模型;
7、通过优化后的溶解氧趋势项、季节项和残余项的lstm预测子模型对溶解氧浓度进行预测,对各个lstm预测子模型的预测结果进行求和获得溶解氧浓度的预测结果。
8、优选地,还包括:将获取河道水体的气象、水文和水质作为输入变量构建候选输入变量库;所述候选输入变量库包括日降水量、日平均气温、日最高气温、日最低气温、日大气压、日蒸发量、日平均径流量、日平均流速、日平均ph、日平均水温、电导率、浊度、氨氮和高锰酸盐指数。
9、优选地,所述采用随机森林模型对输入变量进行重要度排序,以此确定最优输入变量,包括以下步骤:
10、将候选输入变量库中的所有输入变量作为随机森林的输入拟合溶解氧浓度;
11、采用下式计算每个候选输入变量的重要度:
12、
13、
14、
15、其中,msem是节点m的均方误差;mseleft和mseright分别是左子节点和右子节点的均方误差;nm是节点m上的样本量;nleft和nright分别是左子节点和右子节点的样本数;impj(t)表示单棵树上特征j的重要度;impj表示特征j在随机森林中的重要度;
16、按照输入变量的重要度进行排序,当impj>10*impj+1,则选取比impj大的输入变量作为最优的输入变量;j代表输入变量,j+1代表按照重要度排序后与j变量相邻的输入变量。
17、优选地,所述采用stl算法将溶解氧时间序列分解为趋势项、季节项和残余项,如下式所示:
18、dot=stt+st+rt
19、其中,dot代表河道中溶解氧观察序列;stt代表趋势项;st代表季节项;rt代表残余项。
20、优选地,所述利用最优输入变量分别构建溶解氧趋势项、季节项和残余项的lstm预测子模型,包括以下步骤:
21、根据确定的最优输入变量,分别构建溶解氧趋势项、季节项和残余项的lstm预测子模型;其中,所述lstm预测子模型的计算公式如下式所示:
22、ft=σ(wf·[ht-1,xt]+bf)
23、it=σ(wi·[ht-1,xt]+bi)
24、
25、
26、ot=σ(wo·[ht-1,xt]+bo)
27、ht=ot×tanh(ct)
28、其中,ht表示当前细胞单元的输出,ht-1表示前一个细胞单元的输出,xt代表当前细胞单元的输入,wf、wi、wc、wo、bf、bi、bc和bo为lstm模型的可训练超参数,在训练过程中不断进行更新,σ和tanh为模型的激活函数;ft、it和ot分别为lstm预测子模型遗忘门、输入门和输出门的计算公式;ct为细胞状态。
29、优选地,所述通过麻雀搜索算法对溶解氧趋势项、季节项和残余项的lstm预测子模型的超参数进行自动寻优,包括以下步骤:
30、确定要优化的lstm预测子模型的超参数,并定义每个超参数取值的上下界;
31、设定麻雀规模数量,并初始化麻雀群体;
32、定义适应度函数,用于评价每组超参数在lstm预测子模型上的表现,适应度计算公式如下:
33、
34、式中:
35、params=(超参数1,超参数2,超参数3…超参数n)
36、其中,yobs表示溶解氧的实测值;ypre表示lstm预测子模型的预测值;n代表溶解氧的样本量;
37、确定当前条件下的最优解,其计算公式如下式所示:
38、best_fitness=min{fitnes_value}
39、best_params=argmin{fitnes_value}
40、fitnesvalue=f(params)
41、其中,min代表当前条件下所有麻雀群体fitnes_value的最小值,argmin代表最小值所对应的位置,即对应的麻雀;
42、发现者是群体中适应度最好的个体,负责带领群体寻找新的食物来源,在优化过程中发现者的更新策略公式如下式所示:
43、new_posleader=leader+α*rand*(leader-sparrowrand)
44、其中,α是控制更新步长的参数;leader是当前最优的发现者;sparrowrand代表群体中的随机麻雀;rand是一个在0到1之间的随机数;
45、跟随者依据发现者的位置来更新自身位置,其更新公式如下式所示:
46、new_posfellower=follower+β*rand*(sparrowrand-follower)
47、其中,β是控制更新步长的参数;follower代表当前的跟随者;sparrowrand代表群体中的随机麻雀;rand是一个在0到1之间的随机数。
48、警戒者通过随机跳动的方式避免陷入局部最优,警戒者更新公式如下式所示:
49、new_posalert=lowerbound+(upperbound-lowerbound)*rand
50、其中,upperbound和lowerbound代表每个超参数搜索空间的上下界;rand是一个在0到1之间的随机数;
51、重复执行搜索,直到满足达到最大迭代次数或两次相邻的迭代之间适应度值的差值小于0.01时,整个寻优过程结束,将适应度值最优的超参数作为lstm预测子模型最终的参数。
52、一种河流水体中溶解氧的预测系统,所述系统包括:
53、处理器;
54、存储器,其上存储有可在所述处理器上运行的计算机程序;
55、其中,所述计算机程序被所述处理器执行时实现所述的河流水体中溶解氧的预测方法的步骤。
56、一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现所述的河流水体中溶解氧的预测方法的步骤。
57、本发明的有益效果:
58、本发明提出一种河流水体中溶解氧的预测方法,突破了传统方法所需水质参数多、调参工作量大以及预测精度差等问题,转而利用一些易获取的数据,并结合了输入变量选择、时间序列分解、优化思想以及深度学习模型等方法实现对河道水体中的do进行精准的预报。该发明具有所需数据量少、预报精度高、建模成本低等优势。
技术研发人员:段利民,张文瑞,王国强,高瑞忠,薛宝林,刘廷玺,王克玲,孙冰
技术所有人:内蒙古农业大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
