您好,欢迎来到划驼旅游。
搜索
您的当前位置:首页基于智能计算的影响河流水质的因素分析文献综述

基于智能计算的影响河流水质的因素分析文献综述

来源:划驼旅游
基于智能计算的影响河流水质的因素分析

文献综述

随着经济的快速发展,水质污染问题日益严重。为了有效的防治水污染,最近年来在很多重要区域建立了水质自动监测站。但由于水质参数在线监测技术的,水质变化趋势的在线预测依旧难以实现。水质预测可用于随机性非点源污染的监控和防治,所以在建立水质自动监测站的同时,增加水质预测系统,对保护水资源和水环境的安全具有十分重要的意义。

1 主成分分析法(PCA)

陈建宏,刘浪等的《基于主成分分析与神经网络的采矿方法优选》[1]:主成分分析是利用降维的思想,在保证原有数据信息损失最小的前提下,在各个原始指标相关关系研究的基础上,把多个原始指标压缩为少数几个能反映原问题特征的综合变量指标[1]。同时综合指标之间又彼此,避免了信息重叠,同时保留了原始指标的主要信息,比原始变量具有某些优越性质,使得在研究复杂问题时更加容易[2]。

[1] 刘德林,刘贤赵. 主成分分析在河流水质综合评价中的应用. 水土保持研究, 2006,13(3)

[2] 陈建宏,刘浪等. 基于主成分分析与神经网络的采矿方法优选. 中南大学学报(自然科学版),2010,41(5)

假定有n个水质样本,每个样本共有p个指标变量描述,这样就构成了一个n×p阶的水质数据矩阵。在实际应用中,各指标之间存在着量纲、数量级不同等方面的问题。因此,在主成分分析前,要对数据进行标准化,标准化后的水质数据矩阵为:

x11x21Xxn1x12x1px22x2pxn2xnp

通过主成分分析法,根据精度分析要求(一般特征值的累计贡献率达85—90%),p个原始指标变量综合成m个新指标Z1,Z2,…,Zm,主成分综合指标的

得分矩阵为:

z11zZ21zn1

z12z22zn2z1mz2mznm

其计算公式为:

其中,(j=1,2,…,m)为对应于特征值的特征向量的分量,为标准化后的原指标变量值。计算出所需要个主成分值,形成新的综合指标样本集。PCA具体计算步骤参考文献[3]。

[3] 陈小前,罗世彬,王振国,陶玉静. BP神经网络应用中的前后处理过程研究. 系统工程理论与实践,2002,22(1)

2 BP神经网络

输入层隐层输出层输入输出

根据所依据的理论基础不同, 水质预测模式大致可以归纳为数理统计预测法、灰色系统理论预测法、神经网络模型预测法、水质模拟模型预测法以及混沌理论预测方法等5大类[4]。其中的BP神经网络模型预测法具有高维性、并行分布处理性, 以及自适应、自组织、自学习等优良特性, 在水质预测等复杂问题的研究上具有非常好的适用性。

[4] 李如忠.水质预测理论模式研究进展与趋势分析[J].合肥工业大学学报:自然科学版,2006,29(1):26-28.

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

BP网络是一种具有3层或3层以上的阶层型神经网络,由输入层、一个或多个隐含层及输出层组成。输入层接受外界信息, 输出层则对输入信息进行判别和决策, 隐层用来储存知识。各层的神经元之间实行全连接而同层各神经元之间无连接,其连接程度用权值表示。对于如何确定BP 网络的层数及每层中的神经元数,常常需要经过反复的尝试调整,最终以BP 网络的全局误差小于预先给定的允许误差而确定它。

BP 网络的学习规则是,当一对学习参数提供给网络后,神经元的激活值从输入层经隐含层向输出层传播,在输出层获得网络的输出响应。再按减小希望输出与实际输出误差的方向,从输出层经隐含层逐层修改各层神经元的权值和阈

值,最后回到输入层。随着这种对误差逆向修正的不断进行,网络对各层权值和阈值的正确率也不断上升,一直到网络的全局误差小于预先给定的允许误差为止。

BP算法训练网络有两种方式[5] : 一种是顺序方式, 即每输入一个训练样本修一次权值; 一种是批处理方式, 即待组成一个训练周期的全部样本都一次输入网络后, 以总的平均误差能量为学习目标函数修正权值的训练方式。

[5] 高隽.人工神经网络原理及仿真实例[M].2版.北京:机械工业出版社,2007.

BP神经网络隐含层节点数的选取相对来说比较困难, 隐含层节点数确定的恰当与否也是影响BP网络性能优劣的关键因素。对于隐含层节点数的确定问题, 大多都是采用经验公式估算或是试算的方法来确定[6]。

[6] 袁曾任.人工神经元网络及其应用.北京:清华大学出版社,1999.

隐层节点数根据公式Q=

BP神经网络在学习收敛过程中存在收敛速度慢和会出现“局部最小值”的问题。由于水质指标预测具有复杂的输入、输出非线性隐性关系,所以通过大量的样本学习和训练去得到有用的模型是一种比较可行的方法。为了避免BP神经网络的缺点,采用高效率的优化算法来缩短学习时间并提高网络的准确度是很有必要的。 BP神经网络的训练方法Levenberg-Marguardt(LM),适用于内存足够的中心型网络。因此在水质预测中运用LM 优化算法可以明显缩短学习时间,提高训练速度[7]。BP神经网络在学习收敛过程中存在收敛速度慢和会出现“局部最小值”的问题。由于水质指标预测具有复杂的输入、输出非线性隐性关系,所以通过大量的样本学习和训练去得到有用的模型是一种比较可行的方法。

[7] 董长虹等. Matlab神经网络与应用. 国防工业出版社: 北京,2007

传递函数包括:PURELIN-纯线性形函数 ;LOGSIG-对数S形函数 ;TANSIG-双曲正切S形函数。在传递函数的选取上,隐层用tansig是比较理想的,输出层则需要自己的多次尝试,如用purlin是输出任意值,logsig很多书也是推崇的,将输出值限定在[0,1]中,这种传递函数通常用于反向传播BP网络,这得益于函数的可微性。

利用BP人工神经网络模型进行预测的关键在于模型的建立. 模型一旦确立并训练成功, 进行预测就只需要将数据输入, 就可以快速得出预测结果, 可以大大简化预测过程.同时,在建立BP人工神经网络模型时, 要特别注意隐含层结点数、步长、期望误差的设置, 训练样本的数量和质量对预测结果也会产生影响。

+C,C=[1,10]。

3 遗传算法

遗传算法(简称GA),是以自然选择和遗传理论为基础的,将生物进化过程

中适者生存规则与群体内部染色体的随机信息交换机制相结合的高效全局寻优搜索算法。与以往的优化算法相比,GA具有很突出的优点[8]:1)GA不是从单个点,而是从多个点构成的群体开始搜索;2)在搜索最优解的过程中,只需要由目标函数值得到适应值信息,而不需要导数等其它辅助信息;3)在搜索过程不容易陷入局部最优极值。

在遗传算法中,将问题空间中的决策变量通过一定编码方法表示成遗传空间的一个个体,它是一个基因型串的结构数据;同时,将目标函数值转为适应值,它是用来评价个体的好坏的,并作为以后遗传操作的依据。遗传操作包括三个基本操作:选择、交叉和变异。选择是用来实施适者生存的原则,即把当前群体中的个体按与适应值成比例的概率复制到新的群体中,构成交配池,交配池则是指当前代与下一代之间的中间群体。选择的作用效果是提高群体的平均适应值,由于选择没有产生新个体,所以群体中最好个体的适应值不会因选择操作而有所改进。交叉可以产生新的个体,它首先使从交配池中的个体随机配对,然后将两两配对的个体按某种方式相互交换部分基因。变异是对个体的某一个或某一些基因值按某一较小概率进行改变。从产生新个体的能力方面来说,交叉是产生新个体的主要方法,它决定了遗传算法的全局搜索能力;而变异只是产生新个体的辅助方法,但也必不可少,因为它决定了遗传算法的局部搜索能力。交叉和变异相配合,共同完成对搜索空间的全局和局部搜索[9]。

[8] 刘勇,康立山,陈毓屏.遗传算法(非数值并行算法(第二册))[M].北京:科学出版社,1997.

[9] 刘国华,包宏,李文超.用MATLAB实现遗传算法程序[A].北京科技大学,2001

[10]

GA一般过程:

(1) 编码:解释空间中的解数据x,作为遗传算法的表现型形式。从表现型到

基因型的映射称为编码。GA在进行搜索之前先将解空间的数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合就构成了不同的点。

(2) 初始群体的生成:随机产生N个初始串结构数据,每个串结构作为初始

点开始迭代。设置进化代数计数器t,设置最大进化代数T,随机生成M个个体作为初始群体P(0)。 (3) 适应度值评价监测:适应度函数表明个体或解的优劣性。对于不同的问题,

适应度函数的定义方式不同。根据具体问题,计算群体P(t)中各个个体的适应度。

(4) 选择:将选择算子作用域群体。

(5) 交叉:将交叉算子作用于群体。 群体P(t)经过选择、交叉、变异运算后

得到下一 (6) 变异:将变异算子作用于群体。 代群体P(t+1) (7) 终止条件判断:若t≤T,则t←t+1,转到(2);若t>T,则已进化过程中

所得到的具有最大适应度的个体作为最有输出,终止运算。

遗传算法的基本操作:

(1) 选择:选择的目的是为了从当前的群体中选出优良的个体,使它们有机会

作为附带为下一代繁殖子孙。根据各个个体的适应度值,按照一定的规则或方法从上一代群体中选择出一些优良的个体遗传到下一代群体中。GA通过选择运算体现这一思想,进行选择的原则是适应性强的个体(即适应度值高)为下一代贡献一个或多个后代的概率大。

(2) 交叉:交叉操作时GA中最主要的遗传操作。通过交叉操作可以得到新一

代个体,新个体组合了父辈个体的特性。将群体内的各个个体随机搭配成对,对每一个个体,以某个交叉概率(Pc)交换它们之间的部分染色体。交叉体现了信息交换的一种思想。

(3) 变异:对群体中每一个个体,以某个变异概率(Pm)改变某一个或某一些基

因座上的基因值为其他的基因值(如0→1或1→0)。通生物界一样,GA中的变异发生的概率很低,变异为新个体的产生提供了机会。

[10] 雷英杰,张善文,李续武,周创明. MATLAB遗传算法工具箱及应用[M]. 西安电子科技大学出版社.2004.

[11] 雷英杰,张善文,李续武,周创明. MATLAB遗传算法工具箱及应用[M]. 西安电子科技大学出版社.2004.

[11]

遗传算法和BP神经网络结合解决基于智能计算的影响河流水质的因素分析:

考虑到BP神经网络的各层之间都有权值和阀值,不妨使用这些权值和阀值按顺序级联起来成一条染色体,再生成N个这样的染色体。也就是把权值和阀值作为要用遗传算法优化的参数。神经网络结构的选择尚无一种统一而完整的理论指导,一般只能由经验选定,因此优化网络结构的思想不容易实现,考虑到神经

网络除了结构需要考虑之外,还有它的权值和阈值在应用时也需要考虑进去,既然BP神经网络的结构难以进行优化,不妨使用擅长全局搜索的遗传算法优化神经网络的权值和阀值,从而弥补BP神经网络结构难以优化的缺陷,优化好的权值和阈值在BP神经网络的应用中同样可以提高最终训练(预测)结果的可信度。 编码时可以将BP神经网络的权值和阀值按照输入层与隐含层的权值、输入层与隐含层的阀值、隐含层到输出层的权值、隐含层到输出层的阀值的顺序连接起来形成一个染色体,接着产生N个这样的染色体。每个权值和阀值的编码长度固定为一个值,比如定为10,一条染色体的权值(阀值此时也算作权值)的个数是固定的,有计算公式[(IN+1)*HN+(HN+1))OUT]可推导出(IN为输入层节点个数,HN为隐层神经元个数,OUT为输出层神经元个数)。考虑到若采用实数编码,交叉变异时意义并不大,编码最好采用二进制编码。激励函数可以参考BP神经网络中常用的一些激励函数,如f(x)=1/(1+exp(-x))等。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo6.com 版权所有 湘ICP备2023023988号-11

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务