煤炭是我国的战略性能源,在贫油、少气、富煤的能源结构下,煤炭依然会被长期依赖[1]。而在煤矿开采过程中,经常会存在大量的安全隐患[2]。其中煤层底板突水问题一直是受到专家学者关注的安全问题[3-6]。目前,煤炭开采环境复杂,煤层底板突水频发,但突水预测能力依旧不足,对煤矿的安全生产造成了重大威胁。
国内外专家学者研究煤层底板突水问题时,会将其与煤层底板突水机理有效地结合,科学提出煤层底板突水影响因素指标体系,再通过一系列静态预测模型,如回归分析[7]、数据挖掘[8-9]、支持向量机[10-12]、神经网络[13-15]及极限学习机[16-17]等方法对煤层底板突水进行预测。这些煤层底板突水预测模型在煤矿生产中的应用,提高了煤矿突水的预测能力,防范于未然。
但在煤矿的实际开采过程中,某一回采点对煤层底板突水影响是由多种因素组成的,如地质构造、煤层厚度、煤层倾角等,并且这些因素会随着采动的进行影响权重,所以煤层底板突水预测不能简单地当成一个静态问题处理,需要考虑采动影响下的动态变化[18]。针对该问题,本文提出了动态预测模型:门循环单元(gated recurrent unit,简称GRU)神经网络预测模型,该模型能够充分利用采动过程中收集的时间序列数据,过滤监测过程中的缺失数据及干扰数据,通过对一系列样本数据变化规律的学习,实时更新影响因素的变化,精确地对煤层底板突水进行预测,提高煤矿生产安全。
煤层底板突水是复杂的非线性问题,它受到多种因素的影响,并且随着开采的进行其影响因素也会产生动态变化。早在20世纪60年代就有学者提出突水系数法用于煤层底板突水预测[19]。后来的许多学者不断对突水系数法进行完善,同时,“下三带”理论、薄板理论、“强渗通道”说及关键层理论等基于经验公式和力学模型的突水理论也相继发展起来[18]。
通过总结以往煤层底板突水理论,本文选择煤矿突水实例的工作面煤层底板突水数据以及正常回采实测数据进行分析,如表1所示。
表1 矿区部分现场实测数据
Table 1 Partial field measured data in mining area
编号煤层本身煤层倾角/(°)煤层厚度/m地质构造构造有无断层落差/m裂隙带有无开采条件采动破坏深度/m采高/m开采面积/m2走向长度/m含水层条件含水层厚度/m水压/MPa距工作面距离/m隔水层条件灰岩段厚度/m砂岩段厚度/m泥岩段厚度/m45104.15有0.70无15.30.651 230.41011.282.1417.85038.1245.3646114.15有0.70无17.30.551 425.05711.281.5617.85038.1245.364794.15有0.70无16.50.741 009.72311.283.2417.85038.1245.3655133.45有0.45有17.31.10793.42015.361.6329.471.2347.2356.4256123.45有0.36有15.50.842 304.61515.361.2429.470.9547.2356.426981.23有0有18.31.531 742.33514.771.7442.56041.3552.327091.23有1.56有15.90.751 865.34013.651.6342.56041.3552.327191.23有0.36有10.31.232 012.75114.121.1245.69041.3552.3272101.23有0有11.90.981 029.634213.981.5842.561.2141.3552.3287122.45无0有16.61.123 652.33216.121.5661.230.5423.4575.2788102.45有4.23无12.90.854 212.93516.121.2261.230.6923.4575.278992.45有1.36有14.30.892 564.83017.231.4561.231.2323.4575.2793143.12有0.65有16.21.021 765.86413.142.2572.36032.6561.4294153.12有0.75有13.11.254 325.44313.141.4272.361.3532.6561.4295133.12有0.21有10.20.522 236.85112.981.3672.360.8632.6561.42
影响突水的因素是多方面的,突水机理是非常复杂的,一般影响突水的因素包括地质构造、底板隔水层、底板承压水、矿山压力和开采活动等几个方面。这些因素对煤矿突水影响程度各不相同,具体到某突水事故可能是单个因素的作用结果,也可能是几个因素组合反映的作用。我们需要具体研究分析每一种因素对矿井突水的影响方式和作用,就可以有针对性地进行预测和采取有效的预防措施。
抗突水的唯一重要因素阻抗突水能力的大小取决于岩石的力学性质隔水层的厚度及其组合关系。底板承压水对突水的影响受到水压大小和所含水量等因素的影响,水压是造成底板突水的前提条件和动力源泉,其作用主要是对底板岩层中的裂隙和节理进行冲刷,使得承压水渗透量上升,当遇到不同路径的通道接近煤层时,承压水可能趁势流入导致突水。除了导水断层造成工作面突水或采掘工作揭露充水之外,矿山压力对采煤工作面底板突水有着非常大的影响。因此,开采活动对底板突水的影响是通过对以上几个方面的部分或综合影响表现出来。但是随着回采工作的进行,煤层自身及上覆和下覆岩层的原始应力状态发生了变化,承压含水层和底板各岩层之间所处的相对平衡状态发生改变,其开采活动的影响正是表现在使原始的应力状态重新分布,顶底板岩层受到破坏的过程。
本文提出了煤层底板突水影响因素指标体系,如表2所示。煤层底板突水影响因素指标体系被划分成5个一级指标和15个二级指标。
表2 煤层底板突水影响因素指标体系
Table 2 Index system of influencing factors of water inrush from coal floor
一级指标二级指标煤层本身煤层倾角煤层厚度地质构造构造有无断层落差裂隙带有无开采条件采动破坏深度采高开采面积走向长度含水层条件含水层厚度水压距工作面距离隔水层条件灰岩段厚度砂岩段厚度泥岩段厚度
数据在传统神经网络中传递是先从输入层到隐含层,再从隐藏层进入输出层,层间传播呈现全连接形式,而层内的节点之间不存在联系,模型无法很好地处理数据的时间序列问题。循环神经网络(recurrent neural networks,RNN))的提出很好地解决了数据的时间序列问题,但RNN在计算时存在梯度消失问题,GRU的出现彻底解决了这个问题[20]。图1为GRU神经网络结构图。GRU是RNN的改进版本,它在RNN的基础上通过增加状态c来确保在长期状态下能够长久保存,解决了之前仅仅一个隐层状态h的局面。
图1 GRU神经网络结构图
Fig.1 GRU neural network structure
图2为GRU神经网络模型单位结构图。GRU单元中含更新门zt、重置门rt、输入xt、输出ht,t-1表示上一时刻,t表示当前时刻。重置门决定上一时刻的单元信息是否被记住或者遗忘,更新门决定单元信息是否被删除或新信息是否被添加。隐藏层通过使用One-Hot编码进行二维向量输出,在隐藏层传递最后一个时间单元的输出值给输出层后,SoftMax分类器会对其进行解码,将其转化为代表预测结果的0和1,其中1代表突水,0代表不突水。
图2 GRU神经网络模型单元结构图
Fig.2 GRU neural network model unit structure
式(1)表示此模型的损失函数:
J(θ)=-∑(x(i),y(i))∈Dlog(p(y=y(i)|x(i),θ)) .
(1)
式中:θ为模型参数;D表示样本数据构成的训练集;(x(i),y(i))表示训练集中第i个样本数据,x(i)是10维的向量,y(i)的取值仅有0和1,分别表示不突水和突水;p(y=y(i)|x(i)),θ)表示样本(x(i) ,y(i))突水(不突水)的概率。
本文研究的某煤矿含煤层为侏罗系中统延安组,根据岩性、岩相、沉积旋回及煤岩组合特征分为三段:第一段含4、4-1、4-2煤,第二段含4上-2、4上-1煤,第三段含3煤。矿井目前开采4煤层,4煤层属于稳定可采煤层,底板为泥岩。矿区主要属中生代承压水盆地范畴,勘探阶段未揭露大型断层,仅在采掘过程中揭露部分小型断层,因此该矿的充水通道主要受采动影响。
回采工作面位于矿区二采区中部。煤层顶板为深灰色炭质泥岩和灰白色中砂岩,工作面地质构造相对简单。工作面三岔口以北263 m存在一正断层,断层面胶结性良好,透水性较差。三岔口以北516 m处存在一逆断层,断层发育高度较小,掘进过程中顶板存在淋水现象,水量较小且持续时间较短。NY103工作面中部有一走向EW的向斜构造,北翼倾向SW,倾角3°~8°,南翼倾向NW,倾角3°~11°.回采过程中顶板淋水、NY105工作面采空区积水等将全部流向向斜轴部,有可能造成工作面突水。
本文选取该煤矿突水实例的工作面煤层底板突水数据以及正常回采实测数据进行分析(如表1所示)。
由于原始数据中各项数据相互间有较大的差别,例如其数据类型有差别、数据采用的量纲也不同、绝对值存在较大的差值,因此需要对数据进行归一化处理,否则会对模型的运行产生较大影响。输入样本中包含逻辑型数据和数值型数据,前者使用0和1表示,后者运用线性转换方式把输入数据的范围投射到[0,1]区间,其转换方式如式(2)所示:
(2)
式中:x(p,i)为样本p中第i个数据进行归一化处理后的数值;x0(p,i)为样本p中第i个数据进行归一化处理前的数值;xmin(i)为全部样本中第i个数据的最小值;xmax(i)为全部样本中第i个数据的最大值。
特征选择是将冗余特征去掉,将输入向量空间维数减小,同时将学习样本进行优化,是对输入数据使用降维操作的一个步骤,可以明显提升训练效率。针对煤层底板突水预测问题,各个地区的煤矿处于不同的地理位置,并且各个地区煤矿的主控因素千差万别,因此存在各种各样导致突水的原因。在现场收集的数据不仅数据量非常大,同时存在许多无关紧要的冗余数据,而这些数据会对模型的训练效率产生影响,所以需要预先去掉这些冗余数据。
在突水预测问题方面,可以采用Wrapper评价策略,因为原始样本的数据量比较小,其数据特征只有15维,在保证准确率的情况下,运算速度也不至于太慢。因此本文选用基于Wrapper评价策略的特征选择方法[21]。
以下为该特征选择方法的详细过程和计算结果:
将原始特征集合内的所有特征进行编号,开始第一轮的特征选择,号码“1,2,…,15”分别代表“煤层倾角、煤层厚度、构造有无、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、含水层厚度、水压、距工作面距离、灰岩段厚度、砂岩段厚度、泥岩段厚度”。在15维的原始特征集合内每次删掉号码i的特征(i=1,2,…,15),把剩下的14维特征用特征子集Mi(i=1,2,…,15)表示,从而获得M1,M2,…,M15共15个特征子集;并且,用子集M0表示原始特征集合。把子集M0,M1,M2,…,M15按顺序输入模型,对GRU神经网络模型进行训练,将预测准确率的大小用作评判结果好坏的标准,选用“十折交叉验证法”对错误率进行运算。Mi(i=0,1,…,15)的错误率分别由xi(i=0,1,…,15)表示。把xi(i=1,2,…,15)分别与x0做对比,如果相互间的差值很小,就假设仅去掉号码i的特征之后,对整体的误差率不会产生太大影响,将其认定为待定冗余特征。
图3为各个子集第一轮特征选择时的误差率计算结果,由图可知,“x0,x3,x9,x12,x15”这5个点的误差率较低,将不去除子集中任意特征的误差率设为x0,“x3,x10,x13,x15”代表在原始的特征子集中仅单独去掉“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”这四个特征后的误差率。故而,“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”被判定为待定冗余特征。同时,因为x3和x0最为相近,因此认定与其对应的“构造有无”为冗余特征,再把该特征从原始集合中剔除,集合变成14维,然后进行第二轮特征选择。和第一轮相同,第二轮特征选择对每个特征重新编号,重复一遍第一轮的过程。
图3 各个子集在第一轮特征选择时的误差率
Fig.3 Error rate of each subset in the first round of feature selection
图4为各个子集在第五轮特征选择时的误差率。如图所示,从集合中单独去除某一特征后,都显著影响了最后的误差率,可以表明“煤层倾角、煤层厚度、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、水压、距工作面距离、砂岩段厚度”这11项特征和煤层底板突水是密切相关的。同时前四轮已去除的4项特征被认定为冗余特征,分别为“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”。
图4 各个子集在第五轮特征选择时的误差率
Fig.4 Error rate of each subset in the fifth round of feature selection
GRU神经网络模型可以学习时间序列数据。由上文可知,数据维数已由15维降到11维,在进行分类和划分数据集后,就可输入到模型中。通过回采点与时间段的差异,对数据进行排序分组,然后把分组好的数据分为训练集、验证集和测试集;每个部分所占的比例不同,其中训练集是分组好的数据中随机抽取60%所构成,验证集为20%,测试集为20%.
在训练过程中,每次训练输入一组数据,把模型预测结果和实际结果对比,从而得到误差率,之后采用优化算法对权重矩阵进行更新,提高预测准确率。在全部数据都输入模型得到预测结果,并进行权重调整后,对模型的一轮训练才算结束。同时,根据实际情况确定训练的轮数。
图5为GRU神经网络模型准确率及损失情况。图5(a)代表训练集上预测的准确率变化动态,图5(b)表示训练集上损失值变化动态,图5(c)表示验证集上预测的准确率变化动态,图5(d)表示验证集上损失值变化动态。因Dropout的启用,一部分节点被隐藏,模型的准确率以及损失会随迭代次数的加大而发生抖动,而训练集准确率低于验证集,同时明显的过拟合显现没有发生。由图5可以得到,GRU预测模型在训练集上的准确率可以达90.42%,在验证集上的准确率可以达96.29%.
图5 GRU神经网络模型准确率及损失情况
Fig.5 Accuracy and loss of GRU neural network model
结合前文矿区的现场实测数据,本文使用支持向量机、BP神经网络、极限学习机这三个静态神经网络预测模型与动态的GRU神经网络预测模型进行对比。每个模型均按前文所述方法,将数据划分成训练集、验证集及测试集,应用各模型将训练集数据进行训练,以测试集准确率为准进行模型预测精度评估。
不同预测模型的准确度结果如图6所示,动态的GRU神经网络预测模型在训练、验证和测试三个阶段的准确率均要高于静态的支持向量机、BP神经网络和极限向量机。尤其是在最终的测试阶段,动态的GRU神经网络预测模型的准确率要达到95.23%,而其他的静态预测模型的准确率均低于90%.
图6 不同预测模型在训练、验证及测试阶段的准确率
Fig.6 Accuracy of different prediction models in the training, verification, and testing phases
GRU神经网络模型与BP神经网络等向前反馈的静态预测模型相比,GRU神经网络模型依靠对大量的数据样本进行学习,并自身总结出煤层底板突水的变化规律及该动态变化对突水的影响,从而对突水变化因素进行高精度的筛选,较其余三种静态神经网络预测模型在煤层底板突水预测能力上具有更高的准确率,运用到煤矿开采中可以极大地提高生产安全。
工程现场表明,大部分矿井突水都与断层、陷落柱等构造密切相关。该矿统计的大部分数据中都是有构造的,但通过Wrapper评价的特征选择,最终确定“构造有无”为冗余特征;相反,“煤层厚度、开采面积”却被特征选择为与煤层底板突水密切相关。后续研究需要进一步改进相关的特征选择方法。
1) 以煤矿突水理论及现场实测数据为依据,建立了煤矿突水影响因素指标体系,并基于Wrapper评价策略的特征选择,确定“煤层倾角、煤层厚度、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、水压、距工作面距离、砂岩段厚度”这11项特征和煤层底板突水密切相关。
2) 煤层突水GRU神经网络模型通过对现场实测数据的学习,确定其在训练集上的预测准确率达90.42%,在验证集上的准确率达到96.29%,可以很好地进行煤层突水预测测试。
3) 将动态的GRU神经网络预测模型与支持向量机、BP神经网络及机器学习机这三个静态的神经网络预测模型进行比较,发现动态的GRU预测模型预测的准确率在训练、验证及测试阶段都要高于其他的静态模型。因此,GRU模型比其他静态神经网络预测模型要更适合应用到煤层底板突水预测。
[1] 马英.大型矿区资源与环境协调开发评价模型及应用[J].煤炭工程, 2018,50(5):25-28.
MA Y.Evaluation model and application of coordinated development of resources and environment in large mining areas[J].Coal Engineering,2018,50(5):25-28.
[2] 李哲,陈嘉思,宫厚健,等.煤层直接顶板弱富水性含水层涌(突)水危险性评价[J].煤矿安全,2018,49(7):181-184,192.
LI Z,CHEN J S,GONG H J,et al.Risk evaluation of water inrush in poor water yield capacity aquifer of coal seam direct roof [J].Coal Mine Safety,2018,49(7):181-184,192.
[3] 张立新,李长洪,赵宇.矿井突水预测研究现状及发展趋势[J].中国矿业,2009(1):91-93,111.
ZHANG L X,LI C H,ZHAO Y.Research status and development trend of mine water inrush prediction [J].China Mining Industry,2009(1):91-93,111.
[4] 王勇,孟巧荣,高力,等.热解无烟煤三维裂隙重构及定量表征研究[J].太原理工大学学报,2021,52(2):211-218.
WANG Y,MENG Q R,GAO L,et al.Three-dimensional reconstruction and quantitative characterization of pyrolytic anthracite[J].Journal of Taiyuan University of Technology,2021,52(2):211-218.
[5] 施龙青,曲兴玥,韩进,等.多模型融合评价煤层底板灰岩岩溶突水危险性[J].煤炭学报,2019,44(8):2484-2493.
SHI L Q,QU X Y,HAN J,et al.Multi-model fusion to evaluate the risk of water inrush from coal seam floor limestone karst[J].Journal of China Coal Society,2019,44(8):2484-2493.
[6] 原富珍,马克,庄端阳,等.基于微震监测的董家河煤矿底板突水通道孕育机制[J].煤炭学报, 2019,44(6):1846-1856.
YUAN F Z,MA K,ZHUANG D Y,et al.Inoculation mechanism of water inrush channel in Dongjiahe coal mine floor based on microseismic monitoring[J].Journal of China Coal Society,2019,44(6):1846-1856.
[7] 王江荣,黄建华,罗资琴,等.基于粗糙集的Logistic回归模型在矿井突水模式识别中的应用[J].煤田地质与勘探,2015,252(6):74-78.
WANG J R,HUANG J H,LUO Z Q,et al.Application of logistic regression model based on rough sets in mine water inrush pattern recognition [J].Coal Geology and Prospecting,2015,252(6):74-78.
[8] 刘再斌.基于数据挖掘分类技术的煤层底板突水预测[D].北京:煤炭科学研究总院,2008.
[9] 周天沛,孙伟.基于粗糙集的数据挖掘系统在安全决策中的应用[J].煤矿安全,2012,43(9):218-221.
ZHOU T P,SUN W.Application of data mining system based on rough set in safety decision-making[J].Coal Mine Safety,2012,43(9):218-221.
[10] 秦洁璇,李翠平,李仲学,等.基于支持向量回归机的矿井突水量预测[J].中国安全科学学报,2013,23(5):114-119.
QIN J X,LI C P,LI Z X,et al.Mine water inrush prediction based on support vector regression machine [J].China Safety Science Journal,2013,23(5):114-119.
[11] 曹庆奎,赵斐.基于遗传—支持向量回归的煤层底板突水量预测研究[J].煤炭学报,2011(12):143-147.
CAO Q K,ZHAO F.Research on prediction of coal seam floor water inrush based on genetic-support vector regression[J].Journal of China Coal Society,2011(12):143-147.
[12] 闫志刚,杜培军,张海荣.矿井突水信息处理的SVM-RS模型[J].中国矿业大学学报,2008,37(3):295-299.
YAN Z G,DU P J,ZHANG H R.SVM-RS model of mine water inrush information processing[J].Journal of China University of Mining and Technology,2008,37(3):295-299.
[13] 李兴莉,蔡红梅.基于GA-BP神经网络的矿井突水判别数学模型研究[J].煤炭技术,2019,38(5):121-123.
LI X L,CAI H M.Research on the mathematical model of mine water inrush discrimination based on GA-BP neural network[J].Coal Technology,2019,38(5):121-123.
[14] 徐星,田坤云,王公忠,等.Elman神经网络在矿井突水水源判别中的应用[J].安全与环境学报,2017,12(4):1257-1261.
XU X,TIAN K Y,WANG G Z,et al.Application of Elman neural network in the identification of water inrush sources in mines[J].Journal of Safety and Environment,2017,12(4):1257-1261.
[15] 冯利军,郭晓山.人工神经网络在矿井突水预报中的应用[J].西安科技大学学报,2003(4):369-371.
FENG L J,GUO X S.Application of artificial neural network in mine water inrush forecasting[J].Journal of Xi'an University of Science and Technology,2003(4):369-371.
[16] 王亚,周孟然,闫鹏程,等.基于极限学习机的矿井突水水源快速识别模型[J].煤炭学报,2017,42(9):2427-2432.
WANG Y,ZHOU M R,YAN P C,et al.Quick identification model of mine water inrush source based on extreme learning machine[J].Journal of China Coal Society,2017,42(9):2427-2432.
[17] 毛志勇,黄春娟,路世昌,等.基于KPCA-MPSO-ELM的矿井突水水源判别模型[J].中国安全科学学报,2018(8):111-116.
MAO Z Y,HUANG C J,LU S C,et al.KPCA-MPSO-ELM-based mine water inrush water source discrimination model[J].Chinese Safety Science Journal,2018(8):111-116.
[18] 董丽丽,费城,张翔,等.基于LSTM神经网络的煤矿突水预测[J].煤田地质与勘探,2019,47(2):141-147.
DONG L L,FEI C,ZHANG X,et al.Coal mine water inrush prediction based on LSTM neural network[J].Coal Geology and Prospecting,2019,47(2):141-147.
[19] 乔伟,李文平,赵成喜.煤矿底板突水评价突水系数-单位涌水量法[J].岩石力学与工程学报,2009,28(12):2466-2474.
QIAO W,LI W P,ZHAO C X.Evaluation of water inrush coefficient of coal mine floor water inrush-unit water inrush method[J].Chinese Journal of Rock Mechanics and Engineering,2009,28(12):2466-2474.
[20] 古勇,苏宏业,褚健.循环神经网络建模在非线性预测控制中的应用[J].控制与决策,2000,15(2):254-256.
GU Y,SU H Y,CHU J.Application of cyclic neural network modeling in nonlinear predictive control [J].Control and Decision,2000,15(2):254-256.
[21] 潘伟靖,陈德旺.基于GRU-SVR的短时交通流量预测研究[J].计算机技术与发展,2019,29(10):11-14.
PAN W J,CHEN D W.Research on short-term traffic slow forecast based on GRU-SVR[J].Computer Technology and Development,2019,29(10):11-14.