火力发电作为一种重要的发电方式,是保障充足稳定电力供应的基础,但其以燃煤机组为主,燃煤产生的NOx在一定条件下可破坏臭氧层、形成酸雨等,直接或间接地危害生态环境。近年来,我国不断加强电力外送通道建设,使得国电外送规模持续创新高,这无疑加剧了对我国生态环境的影响。在国家节能减排政策的严格要求下,火力发电厂纷纷通过锅炉燃烧优化技术降低 NOx排放,在一定程度上提高火电机组的环保性。
锅炉燃烧系统的优化依赖于锅炉燃烧预测模型的建立,一般采用回归建模法。由于NOx排放量和其运行操控参数间存在很强的非线性关系,传统建模方法难以准确地建立NOx排放预测模型。近年来,随着统计学、机器学习、神经网络等不断发展,国内外学者围绕燃煤电站锅炉NOx排放量预测模型的构建进行了大量的研究。其中BP神经网络、SVM、ELM等被广泛用于电站锅炉NOx排放建模预测中[1-4]。HU et al[5]将660 MW燃煤机组作为研究对象,采用BP神经网络建立了NOx排放预测模型。2006年,GUO et al[6]以一台300 MW旋流对燃锅炉为研究对象,建立了基于SVM的锅炉燃烧过程中的NOx排放预测模型。李素芬等[7]基于粒子群优化算法和LS-SVM建立电站锅炉NOx排放预测模型。然而BP容易出现过拟合现象,SVM算法因需要二次规划使得样本数量受限而仅适用于小样本建模。为了解决以上问题,TAN et al[8]基于从某电厂700 MW燃煤电站锅炉采集的约5 d实际运行样本数据,建立了基于ELM的NOx模型,提高了模型的泛化性。陈琪[9]提出基于GMM的数据重采样及SKPCA-ELM算法,建立锅炉NOx排放模型,其中基于GMM的数据重采样通过选择代表性样本有效地解决了样本数据分布不均衡问题,缩短了模型训练时间。然而以上算法仍存在局限性,一方面将SKPCA用于特征数据降维,没有考虑特征属性与决策属性之间的关系,使模型不能达到很好的预测精度;另一方面使用ELM建模,模型的稳定性和泛化性不理想。K-ELM的提出,有效地解决了ELM存在的缺陷。基于ELM的燃煤锅炉NOx排放预测模型的稳定性和泛化性与核函数密切相关,然而单一的核函数难以准确描述NOx排放与被操控运行变量之间的非线性关系,导致该预测模型的学习能力与泛化能力不足。
为了有效地平衡建模时间与模型预测准确度,本文提出了一种基于FAR和HK-ELM的燃煤电站锅炉NOx排放预测方法。该方法以锅炉NOx排放量为预测目标,首先利用FAR算法筛选出影响NOx排放量的主要影响因素,生成新样本数据集;然后基于生成的新数据集采用HK-ELM建立NOx排放预测模型。实验结果表明,本文所提方法能够有效地建立NOx排放预测模型,同时保证模型提高预测精度、缩短建模时间。
燃煤电站锅炉的燃烧过程是一个复杂的物理化学过程。在其运行过程中常常受到外部干扰及内部设备振动等诸多随机因素的影响,使得特征属性间存在冗余性和耦合性,这必然会影响NOx排放预测模型的建模效率及模型准确性。因此通过科学筛选影响NOx排放的核心影响属性因子来提高建模效率和准确性显得尤其重要。
粗糙集理论于1982年由波兰数学家Z.Pawlak教授提出,由此众多学者开始研究粗糙集,使其广泛发展。目前粗糙集理论已经被应用于特征选择、模式识别和预测[10-12]等方面,其中属性约简[13]就是粗糙集研究的一个核心内容,主要在不改变原始样本数据的基础上,通过删除冗余的属性特征来保持信息系统的预测能力。而邻域粗糙集模型的引入解决了经典粗糙集只能处理名义型数据的问题,用于处理数值型数据,在此基础上,属性约简算法得到了进一步发展。
给定邻域大小,有性质1:如果条件属性子集B1、B2满足B1⊆B2⊆C,且样本集X⊆U,则对于论域U中的任一个样本x,如果x∈POSB1(D),则x∈POSB2(D).
知识约简定义:设P和Q是U中两个等价关系组,若Q∈P,Q是独立的,且ind(P)=ind(Q),则称Q为P的一个约简,记为red(P).
一般采用前向贪心搜索策略来进行属性约简,即依次将新属性添加到已选条件属性集,将粗糙集属性依赖度作为属性重要度的度量指标,重新依次判断每一个样本是否在正域内。2008年,胡清华等[14]根据性质1,表明新样本的增加不会使原来属于正域的样本变为边界样本,基于Pawlak属性约简,提出一种邻域粗糙集前向搜索属性约简快速算法(forward attribute reduction based on neighborhood rough sets and fast search,FARNEMF),该算法所采取的加速思想仅会提高属性约简速度,并不会对属性约简结果产生影响。因此本文将其用于燃煤电站锅炉NOx预测建模时大规模样本数据的属性特征选择中。
ELM是黄广斌等[15]提出的一种快速单隐层前馈神经网络(SLFNs).因结构简单、速度较快、参数较少、泛化能力强等被广泛应用于工业、农业等多个领域的分类及回归问题中。2012年,通过对SVM、LS-SVM与ELM的算法机理进行对比,将核函数应用于ELM,提出了K-ELM[16].K-ELM不仅继承了ELM的诸多优点,同时解决了ELM模型输出容易因随机复制而出现随机扰动的问题,使其泛化性、稳定性进一步增强。
ELM的SLFNs模型可描述为:
f(x)=h(x)β=Hβ.
(1)
式中:x为样本输入,f(x)为神经网络的输出,H表示隐含层特征映射矩阵,β表示输出权重矩阵。
根据文献[16],K-ELM对应的输出为:
(2)
式中:C为正则化因子,T为样本对应的输出。
K-ELM的核矩阵定义如下所示:
ΩELM=HHT∶ΩELMi,j=h(xi)h(xj)=K(xi,xj) .
(3)
核函数有很多种类型,如线性核函数、小波核函数等。一般情况下,样本输入往往不同且有较大差异,使得难以选择有效的核类型和核参数。文献[17]选择多项式核函数(Poly)和高斯径向基核函数(RBF)线性相加构造一全新的混合核函数模型,使其兼具局部核函数学习能力较强和全局核函数泛化性较好的优点,进而具有更好的学习能力和泛化性能。混合核函数表达式为:
ΩELM=HHT∶ΩELMi,j=h(xi)h(xj)=Kmix(xi,xj) .
(4)
在这种情况下,混合核极限学习机(hybrid kernel ELM,HK-ELM)模型的输出为:
(5)
式中:ΩELM为N×N对称矩阵,Kmix(xi,xj)为混合核函数,据Mercer原理和线性加权原则,得之比混合核函数Kmix也是Mercer函数:
Kmix(x,xj)=rKpoly(x,xi)+(1-r)Krbf(x,xi),
(0≤r≤1) .
(6)
其中,参数r为平衡因子,用于调节局部核函数和全局核函数的作用大小,范围为[0,1];Kpoly(x,xi)为多项式核函数,Krbf(x,xi)为高斯径向基核函数,即
(7)
Kpoly(x,y)=(xTy+1)d.
(8)
在使用HK-ELM进行建模时,正则化因子C与核函数参数(γ,d,r)的设定直接影响HK-ELM模型的性能。
本文结合FAR与HK-ELM算法,提出了一种基于FAR-HK-ELM的燃煤电站锅炉NOx排放预测方法。基于FAR-HK-ELM的燃煤电站锅炉NOx预测模型,其基本方法是:
1) 首先,通过拉以达准则、线性插值法、归一化处理等对采取的样本数据进行数据预处理。
2) 其次,采用FAR算法对预处理后的样本数据集进行属性约简,筛选影响NOx排放量的主要影响属性变量,构建新的属性子集,以作为NOx排放预测模型的输入变量。
3) 最后,通过带约束的权重线性递减粒子群寻优算法结合10-fold交叉验证方法,优化HK-ELM的正则化因子及核参数,以实际数据和预测数据的均方根误差最小化作为目标,基于属性约简后所构建的新样本集,建立基于HK-ELM的NOx排放量预测模型。
基于FAR-HK-ELM的燃煤电站锅炉NOx预测模型构建过程如图1所示。
本文采用某电厂600 MW燃煤电站锅炉的历史运行数据对模型进行测试,采样周期为1 s.在锅炉实际运行中,锅炉负荷、一次风、二次风等是影响其NOx排放的主要因素,本文充分考虑从燃煤电站锅炉采集的实际测点数据,选取共57维运行操控参数作为模型的输入量,以锅炉NOx排放量作为模型的输出量,具体如表1所示。
图1 基于FAR-HK-ELM的燃煤电站锅炉NOx预测模型构建过程
Fig.1 NOxprediction model construction process of coal-fired utility boiler based on FAR-HK-ELM
表1 NOx排放预测模型输入量
Table 1 Input of NOxemission prediction model
输入量及属性样本集列号锅炉负荷1磨煤机给粉量(A-F层)2~7磨煤机一次风风速(A-F层)8~13磨煤机二次风风速(A、C-F层)14~27空气预热器出口二次风温28~29炉膛进入汽轮机二次风量30~38送风机出口二次风压39空气加热器入口烟气含氧量40~44排烟温度45过热器(SP)二次风压偏差46燃尽风挡板开度参数47~54媒质数据55~57
为保证燃煤锅炉NOx排放量预测模型的性能,在模型训练之前需要对样本数据进行数据预处理,依次采取拉以达准则、线性插值法剔除数据离群点、补齐空值、替换异常值。然后随机选取10%样本数据,共1 200组样本数据归一化处理到[-1,1],使其量纲达到同一数量级。
为了准确地评价本文所建立的基于FAR-HK-ELM的燃煤电站锅炉NOx预测模型的性能,本文采用粗糙集属性重要度作为度量指标衡量属性特征的贡献,采用拟合优度R2、均方根误差(root mean squared errors,RMSE)、平均相对误差(mean relative error,EMRE)作为标准来衡量模型的学习能力和预测能力。
1) 粗糙集属性重要度计算公式如下:
(9)
式中:|·|表示集合内元素的个数;U为论域;B,D分别为条件属性子集、决策属性;POSB(D)为条件属性子集B所确定的正域。
2) 衡量模型的学习能力和预测能力的计算公式如下:
(10)
(11)
(12)
式中:yi为NOx排放实际值;为模型的NOx排放预测值;
和
分别为NOx排放实际值和预测值的平均值;n为样本个数。
在研究锅炉NOx排放量预测模型时,为了保证模型预测精度同时减少建模时间,首先使用FAR算法将全部样本数据用于属性特征选择,选定邻域半径计算参数、重要度下限的控制参数分别为6.1,0.000 1,以属性重要度为评价指标,即条件属性对决策属性的贡献,约简后的样本输入属性为{1,2,3,6,8,9,12,13,14,15,19,25,28,34,35,39,43,46,53},共计19个,各特征属性的重要度如图2所示。从燃煤电站锅炉实际运行情况来进行分析,锅炉NOx排放量主要取决于锅炉负荷大小、一次风速、二次风速等影响,与排烟温度等的关系并不是很密切,其与约简结果基本一致。
图2 属性重要度
Fig.2 Attribute importance
将属性约简后新的特征属性构成的新样本集用于HK-ELM建模,随机选取其中80%的样本数据作为训练样本,剩余20%作为测试样本。HK-ELM模型的学习能力和泛化能力取决于HK-ELM的正则化因子C和混合核函数参数(γ,d,r).通过带约束的权重线性递减粒子群寻优算法寻找HK-ELM模型的最优参数,以10-fold交叉验证中10次测试的总测试均方根误差的均值作为粒子群算法的适应度值(见公式(13)),以达到避免模型训练中出现过拟合的目标。
(13)
为了平衡模型预测准确性与建模时间,多次调整迭代次数及核函数范围,则带约束的权重线性递减粒子群寻优算法及HK-ELM模型具体参数设置见表2.根据表2参数设置进行寻优,此时得到HK-ELM模型中的参数组(C,γ,d,r)为(189.043, 3.434 65, 3,0.436 496),建立NOx排放的HK-ELM模型,并对测试样本进行预测,NOx排放量模型预测值与实际值的对比如图3所示,可以看到FAR-HK-ELM模型的预测值与实际值有很好的一致性。模型对训练样本EMRE、R2、RMSE分别为1.90×10-11,1,1.33×10-11,测试样本的EMRE、R2、RMSE分别为0.001 4,0.980 6,0.043 2,结果表明FAR-HK-ELM模型不仅学习能力很强,且具有较高的预测精度和拟合泛化能力,可以对燃煤锅炉NOx排放量进行准确预测。
表2 粒群寻优算法及HK-ELM模型具体参数设置
Table 2 Particle swarm optimization algorithm and specific parameter setting of HK-ELM model
参数参数值正则化因子C∈[2-10,210]RBF核参数γ∈[2-10,23]Poly核参数d∈[1,20](d∈Z+)平衡因子r∈[0,1]种群规模N=50学习因子c1=1.5,c2=2.5权重wmax=0.2,wmin=0.4种群速度vi∈[-1,1](i=1,2,3,4)迭代次数t=100
图3 NOx排放量模型预测值与实际值的对比
Fig.3 Comparison between the prediction values of NOxemission model and the real value
为了综合评定FAR-HK-ELM预测燃煤锅炉NOx排放量时时间复杂度、预测精度等方面的性能,将本文方法与其他算法进行比较,分别为BP神经网络、SVM、ELM、多项式核极限学习机(PK-ELM)、高斯径向基核极限学习机(GK-ELM)、混合核极限学习机(HK-ELM),以R2,RMSE,EMRE作为评定指标进行实验对比分析,均取20次实验均值作为最后结果如表3.
实验均随机选取其80%作为训练样本,剩余20%作为测试样本。实验中所有对比算法的核函数参数、惩罚系数、初始权值等参数都通过粒子群优化算法和10-fold交叉验证进行参数寻优。
由表3可知,针对电站锅炉NOx排放量建立预测模型,BP神经网络模型学习能力和预测性能较差;ELM模型学习能力很强,但模型泛化性较差;SVM模型相较于BP、ELM模型,模型性能有了一定提升,但时间复杂度较高。引入核函数后,从训练集的EMRE,R2,RMSE三个指标来看,PK-ELM模型的学习能力优于GK-ELM模型;从测试集的EMRE,R2,RMSE来看,GK-ELM模型的泛化性能优于PK-ELM模型。综合PK-ELM和GK-ELM两个模型优点所建立的HK-ELM模型,与PK-ELM和GK-ELM模型相比,其学习能力和泛化性能都显著提高,但混合核的引入增加了HK-ELM模型计算复杂度,使建模时间加长。为此通过属性约减减少样本属性维度,在保证提高模型学习能力和泛化性能的同时降低模型计算复杂度。
综合分析可知,FAR-HK-ELM模型学习能力和泛化性能均优于其他模型,实现了模型预测准确性与建模时间之间的平衡,能够较为精准地对NOx排放量进行预测,在锅炉NOx预测中是一种可行且有效的方法。
表3 不同算法性能指标比较
Table 3 Comparison of performance indexes of different algorithms
算法训练集EMRER2RMSE测试集EMRER2RMSEBP0.019 30.866 10.056 50.033 10.904 40.094 9ELM0.000 71.000 00.001 50.005 00.906 40.093 9SVM0.003 80.999 40.008 20.009 90.968 30.063 4PK-ELM0.007 80.996 90.018 70.021 80.973 30.052 6GK-ELM0.002 70.999 50.007 70.032 80.971 50.053 3HK-ELM1.92×10-1111.30×10-110.007 80.976 10.051 2FAR-HK-ELM0.99×10-1110.89×10-110.004 10.978 50.047 2
本文基于燃煤电站锅炉实际运行情况,提出了一种基于FAR-HK-ELM的锅炉NOx排放预测方法,采用领域粗糙集属性约简算法筛选建模样本核心特征属性,删除属性间的冗余信息,然后综合考虑多项式核函数和高斯径向基核函数的优点构建基于HK-ELM的NOx排放预测模型,提高了预测模型的准确性与泛化性。通过与BP,SVM,ELM,PK-ELM,GK-ELM和HK-ELM的对比实验,进一步验证了本文所提出的FAR-HK-ELM建模方法,能够很好地用于实际电站锅炉NOx排放建模中,该模型不仅具有很好的学习能力,并且可以较为准确地预测NOx排放量,具有良好的拟合泛化性能力。
[1] 谷丽景,李永华,李路.电站锅炉燃烧优化混合模型预测[J].中国电机工程学报,2015,35(9):2231-2237.
GU L J,LI Y H,LI L.Hybrid model prediction of utility boiler combustion optimization[J].Proceedings of the CSEE,2015,35(9):2231-2237.
[2] 方海泉,薛惠锋,李宁,等.基于贝叶斯神经网络遗传算法的锅炉燃烧优化[J].系统仿真学报,2015,27(8):1790-1795.
FANG H Q,XUE H F,LI N,et al.Boiler combustion optimization based on bayesian Neural Network and genetic algorithm[J].Journal of System Simulation,2015,27(8):1790-1795.
[3] 赵文杰,吕猛.基于多LS-SVM集成模型的锅炉NOx排放量建模[J].电子测量与仪器学报,2016,30(7):1037-1044.
ZHAO W J,LYU M.NOxemission modeling of coal-fired boiler based on multi LS-SVM ensemble model[J].Journal of Electronic Measurement and Instrumentation,2016,30(7):1037-1044.
[4] 徐晨晨,续欣莹,阎高伟,等.基于改进分布式极限学习机的电站锅炉NOx排放预测算法[J].太原理工大学学报,2017,48(6):946-952.
XU C C,XU X Y,YAN G W,et al.NOxemission prediction algorithm of power station boiler based on distributed extreme learning machine[J].Journal of Taiyuan University of Technology,2017,48(6):946-952.
[5] HU P T,LIU C L.Soft-sensing of NOxcontent in power station based on BP Neural Network,RBF Neural Network and PCA-RBF Neural Network[J].IOP Conference Series:Materials Science and Engineering,2018,392(6):062180.
[6] GUO J,LIU S,JIANG F,et al.NOxemission characteristics in opposed firing boiler based on SVM[J].Journal of Combustion Science and Technology,2006,3:243-247.
[7] 李素芬,吴祯祥,葛玉林.电站锅炉NOx排放与效率的混合建模及优化[J].热科学与技术,2007,6(1):26-31.
LI S F,WU Z X,GE Y L.Hybrid modeling and optimization of NOxemission and efficiency of utility boilers[J].Thermal Science and Technology,2007,6 (1):26-31.
[8] TAN P,XIA J,ZHANG C,et al.Modeling and optimization of NOxemission in a coal-fired power plant using advanced machine learning methods[J].Energy Procedia,2014,61:377-380.
[9] 陈琪.基于极限学习机的电站锅炉燃烧系统建模及多目标优化[D].太原:太原理工大学,2019.
CHEN Q.Modeling and multi-objective optimization of power plant boiler combustion system based on extreme learning machine[D].Taiyuan:Taiyuan University of Technology,2019.
[10] 常犁,王国胤,吴渝.一种基于Rough Set理论的属性约简及规则提取方法[J].软件学报,1999,10(11):1207-1211.
CHANG L,WANG G Y,WU Y.An approach for attribute reduction and rule generation based on Rough Set theory[J].Journal of Software,1999,10(11):1207-1211.
[11] 石云,孙玉芳,左春.基于Rough Set的空间数据分类方法[J].软件学报,2000,11(5):673-678.
SHI Y,SUN Y F,ZUO C.Spatial data classification based on Rough Set[J].Journal of Software,2000,11(5):673-678.
[12] ZHAO H,MIN F,ZHU W.Test-cost-sensitive attribute reduction based on neighborhood Rough Set[C]∥HONG P,KUDO Y,KUDO M C,et al.IEEE International Conference on Granular Computing (GrC 2011).New Jersy:IEEE Computer Society,2011:802-806.
[13] LIU Y,HUANG W L,JIANG Y L,et al.Quick attribute reduct algorithm for neighborhood Rough Set model[J].Information Sciences,2014,271(1):6581.
[14] 胡清华,赵辉,于达仁.基于基于邻域粗糙集的符号与数值属性快速约简算法[J].模式识别与人工智能,2008,21(6):735-738.
HU Q H,ZHAO H,YU D R.Fast reduction algorithm of symbol and numerical attributes based on neighborhood rough set[J].Pattern Recognition and Artificial Intelligence,2008,21(6):735-738.
[15] HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:a new learning scheme of feedforward neural networks[C]∥IEEE Computational Intelligence Society.IEEE International Joint Conference on Neural Networks.New Jersy:IEEE,2004:985-990.
[16] HUANG G B.An insight into extreme learning machines:random neurons,random features and kernels[J].Cognitive Computation,2014,6(3):376-390.
[17] 杜群.基于KPCA和混合核LS-SVM的航煤参数软测量研究[D].大连:大连理工大学,2011.
DU Q.Research on the soft sensing of aviation kerosene parameters based on KPCA and mixed kernel LS-SVM[D].Dalian:Dalian University of Technology,2011.