Prediction of failure depth of coal seam floor in pressure mining based on small sample enhancement of MTD class distribution
-
摘要:
机器学习预测方法在带压开采煤层底板破坏深度预测评价中得到广泛应用,然而在预测模型构建过程中常常存在着实测数据获取成本高、采集难度大以及随机性强等问题,基于少量样本构建的模型预测的性能往往受到预测精度和泛化能力的严重制约。通过文献调研,收集获得50组实测数据样本,引入MTD (Mega-Trend-Diffusion)类分布虚拟样本生成技术,生成虚拟样本,进一步实现煤层底板破坏深度实测样本的扩充增强;采用SaDE-ELM (Self Adaptive Differential Evolution- Extreme Learning Machine)、GA-PSO-BP (Genetic Algorithm-Particle Swarm Optimization-Back Propagation Neural Network)、BP (Back Propagation Neural Network)等机器学习算法,构建虚拟样本增强前后煤层底板破坏深度预测模型,并对增强前后的模型预测精度进行对比分析。结果表明:所提方法生成的虚拟样本与实测样本的分布基本一致;采用虚拟样本增强后的预测模型精度均显著提高,其中基于MTD类分布小样本增强的PCA-SaDE-ELM (Particle Swarm Optimization-Self Adaptive Differential Evolution-Extreme Learning Machine)预测模型的预测效果最优,增强前后误差可降低42.95%~51.27%。采用MTD类分布生成技术进行小样本增强,并构建带压煤层底板破坏深度预测模型能够更加精确地预测多因素影响下煤层底板破坏深度,通过与规范经验预测结果和滑移线场理论预测结果进行对比分析,所提方法预测得到的云驾岭矿19105工作面底板破坏深度相对较大,有利于工作面安全生产管理。相关研究成果对奥灰承压水上煤层的安全高效回采提供了有利支撑。
Abstract:The prediction method of machine learning has been widely used in the prediction and evaluation of the failure depth of coal seam floor in pressure mining. However, there are often some problems in the construction of the prediction model, such as high acquisition cost, difficulty in collecting and strong randomness of the measured data. The prediction performance of the model built based on a small number of samples is often severely restricted by the prediction accuracy and generalization ability. Through literature research, 50 sets of measured data samples were collected, and MTD similar distribution virtual sample generation technology was introduced to generate virtual samples to further expand and enhance the measured samples of coal seam floor failure depth.Machine learning algorithms such as ADE-ELM, GA-PSO-BP and BP were used to build a prediction model of coal seam floor failure depth before and after virtual sample enhancement, and the prediction accuracy of the model before and after enhancement was compared and analyzed. The results show that the distribution of virtual samples generated by this method is basically consistent with that of measured samples. The accuracy of the prediction models enhanced with virtual samples is significantly improved, among which the PCA-ADE-ELM prediction model enhanced with small distributed samples of MTD class has the best prediction effect, and the error of the enhanced model can be reduced by 42.95%~51.27%. MTD similar distribution virtual sample generation technology is used to enhance small samples, and the prediction model of failure depth of coal seam floor under pressure can be built to more accurately predict the failure depth of coal seam floor under the influence of multiple factors. Through comparison and analysis with the standard empirical prediction results and the slip line field theory prediction results, the failure depth of 19105 working face of Yunjialing Mine predicted by this method is relatively large, which is conducive to the safe production management of working face. The relevant research results provide favorable support for the safe and efficient mining of confined above-water coal seam of Ordovician limestone.
-
0. 引 言
煤炭在我国一次能源结构中的占比仍超过50%,是保障我国能源安全的压舱石[1],而随着开采深度的增加,煤层赋存地质环境愈加恶劣,加之复杂的开采扰动影响,导致底板奥灰水突涌风险加剧,严重威胁着深部煤层安全高效回采[2]。据不完全统计,华北地区约20%的煤炭资源遭受底板岩溶水的影响[3],存在带压开采问题,以邯郸和邢台地区的煤矿尤甚,一旦管理不当常常诱发工作面突水灾害。为此,国内外学者开展诸多研究[4-6],并取得了可喜成果。其中突水系数理论得到了广泛认可和应用,底板有效隔水层厚度是突水系数理论的关键参数之一,合理确定底板破坏深度对煤层底板突水风险评价[7-9]具有重要意义。
煤层底板破坏深度传统计算方法有:现场实测法[10],公式法[11-12],数值模拟法[13-14]以及室内模型试验[15]等。近年来,机器学习被广泛引入到煤层底板破坏深度预测研究中,于小鸽等[16]提出的BP神经网络预测模型;施青龙等[17]构建了PCA-GWO-BP (Principal Component Analysis - Grey Wolf Optimization - Back Propagation Neural Network)神经网络预测模型;邵良杉等[18]构建了基于PSO-ELM-Boosting (Particle Swarm Optimization- Extreme Learning Machine- Boosting)的底板破坏深度预测模型;WANG等[19]基于模糊神经网络建立了底板破坏深度预测模型。相比传统方法,智能预测模型考虑了更多的影响因素,对原始数据进行了更深层次的挖掘;预测精度和效率都有很大提高。但上述成果中没有考虑底板奥灰水的影响。同时煤层底板破坏相关实测数据的获取还存在着成本高、难度大以及随机性强等问题。少量的样本难以覆盖整个有效空间,存在信息不完整和不充足等缺陷。小样本问题严重影响煤层底板破坏深度预测模型的精度。通过撷取小样本数据间隙中存在的潜在信息,产生适当数量虚拟样本,即虚拟样本生成技术 (Virtual Sample Generation, VSG),实现小样本数据增强,进而能够提高训练样本对总体数据特征的表征能力和模型的学习与泛化能力。
基于整体趋势扩散的虚拟样本生成技术 (Mega-Trend-Diffusion, MTD)[20-21]是一种常用的VSG技术,其属于随机样本生成技术的一种改进形式,可实现对真实数据信息间隔填补,主要通过隶属函数来估计样本变量的真实数据空间,即通过隶属函数计算其相应的虚拟样本信息的左边界LB和右边界RB,从而在该范围内生成虚拟样本信息。但是该方法较少考虑真实样本与虚拟样本之间变量的相似特征,从而导致预测模型的过度拟合现象。此外,实际中先验知识的获取存在一定的困难性,实测样本中的变量之间往往并非完全独立,导致虚拟样本的生成难以满足变量间的独立性假设。且由于虚拟样本的引入存在误差的累积效应,虚拟样本的生成数量也是影响模型预测精度的因素之一。综上,少量实测样本、变量独立性以及虚拟样本生成数量均是影响煤层底板破坏深度预测模型精度的关键因素,如何消除原始样本数据特征量之间的关联性、生成与实测样本信息分布类似的虚拟样本以及确定合理的虚拟样本数量等问题值得进一步深入研究。
鉴于此,基于文献[22]调研获得带压开采煤层底板破坏深度实测数据和影响因子集,共计50组数据;借助PCA算法优化实测数据样本空间,消除原始数据样本中各变量间的相关性;分析PCA (Principal Component Analysis)优化后的数据样本中主成分分布特征,通过引入基于MTD类分布生成技术,生成类似分布的虚拟样本,并通过K-S (Kolmogorov-Smirnov)检验验证虚拟样本与实测样本分布的相似性,进而实现对实测数据小样本的扩充;采用SaDE-ELM混合优化算法,生成虚拟样本输出,构建影响煤层底板破坏深度的混合数据样本;基于SaDE-ELM、GA-PSO-BP、BP 3种算法,构建底板破坏深度预测模型,对比分析数据增强前后的模型预测精度。相关研究成果对煤层底板突水风险评价和预测预警能力的提升具有一定的支撑作用。
1. 基于MTD小样本增强的底板破坏深度预测模型
1.1 实测样本数据的PCA优化
采用已搜集到的50组煤层底板破坏深度相关数据,见文献[22]。实测数据集中包含底板破坏深度影响因子和评价指标集2部分。其中影响因子集包含工程地质因素 (导水构造发育程度f1、陷落柱发育程度f2、断层发育程度f3和断层落差H1)、水文地质因素 (底板含水层水压力P、初始底板隔水层厚度h、隔水层砂性百分比p1、隔水层泥性百分比p2、隔水层灰性百分比p3、断裂导水特性k1、构造充水性k2和最大涌水量Q)和工作面开采条件 (开采深度H、煤层倾角α、煤层厚度M、工作面长度L1、走向长度L2、工作面采高m、月推进步距L3) 等19种影响因子。值得说明的是,此处的初始底板隔水层厚度是指地质勘探的结果,不包含开采扰动的影响。
对实测数据集进行皮尔逊相关性检验,如图1所示。由图分析可知标有星号(*)的某些变量间的确存在相关性,如底板含水层水压力P和初始底板隔水层厚度h,工作面采高m和开采深度H、最大涌水量Q等。考虑到MTD类分布生成技术的独立性假设要求,采用PCA算法对50组原始数据样本进行主成分分析,降低样本数据之间的关联性。借助SPSS软件对影响因子集进行PCA降维优化处理,确定协方差矩阵R的特征值及对应的特征向量,结果见表1、表2。根据主成分累计贡献率选取前9个主成分作为输入变量,并根据式(1)计算各主成分。
表 1 总方差解释Table 1. Total variance explanation主成分 特征值 方差百分比/% 累积/% Ⅰ 5.541 29.163 29.163 Ⅱ 2.464 12.971 42.134 Ⅲ 2.121 11.163 53.297 Ⅳ 1.534 8.072 61.370 Ⅴ 1.322 6.957 68.327 Ⅵ 1.215 6.396 74.723 Ⅶ 0.933 4.912 79.635 Ⅷ 0.823 4.331 83.966 Ⅸ 0.743 3.910 87.876 Ⅹ 0.588 3.097 90.973 ⅩⅠ 0.453 2.382 93.355 ⅩⅡ 0.310 1.633 94.989 ⅩⅢ 0.286 1.508 96.497 ⅩⅣ 0.267 1.404 97.901 ⅩⅤ 0.176 0.925 98.827 ⅩⅥ 0.122 0.641 99.468 ⅩⅦ 0.079 0.415 99.882 ⅩⅧ 0.022 0.118 100.000 ⅩⅨ 0.000 0.000 100.000 表 2 成分矩阵Table 2. Component matrix主成分 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ f1 0.377 0.526 −0.410 0.078 0.086 0.324 0.131 −0.246 0.072 f2 −0.039 0.159 −0.346 −0.009 0.350 0.613 −0.325 0.429 0.123 f3 0.035 0.521 0.098 0.386 0.106 0.366 0.052 −0.405 −0.354 H1 0.620 0.202 −0.237 0.097 −0.408 0.043 −0.109 0.076 −0.347 P 0.695 0.070 0.300 0.220 −0.348 0.091 −0.271 0.193 −0.061 h 0.661 −0.042 0.187 0.221 −0.387 0.125 −0.342 −0.014 0.194 p1 0.453 −0.162 −0.768 0.204 0.159 −0.265 −0.071 −0.008 0.052 p2 −0.515 0.167 0.323 −0.147 −0.575 0.327 0.308 0.068 0.133 p3 −0.036 0.034 0.751 −0.124 0.482 −0.011 −0.279 −0.073 −0.245 k1 0.280 0.755 −0.161 −0.148 −0.003 −0.325 −0.147 0.064 0.030 k2 0.219 0.741 0.150 0.148 0.046 −0.301 0.052 −0.145 0.314 Q 0.662 −0.087 0.151 0.182 0.318 0.233 0.387 0.213 −0.021 H 0.789 0.098 0.408 −0.027 0.140 −0.224 −0.005 0.125 0.011 α −0.116 0.151 0.283 0.745 0.125 −0.091 0.260 0.276 0.185 M 0.782 −0.464 −0.056 0.157 −0.064 −0.030 0.125 −0.098 −0.143 L1 0.629 −0.064 0.245 −0.312 0.092 0.194 −0.163 −0.234 0.346 L2 0.717 0.017 −0.031 −0.452 0.062 0.193 0.266 −0.085 0.120 m 0.765 −0.515 0.038 0.109 0.026 0.002 0.107 −0.138 0.068 L3 0.559 0.380 0.003 −0.473 −0.021 −0.118 0.248 0.330 −0.247 \boldsymbol{A}_{\rm{m k}}=\left[{a}_{{ij}}^{\prime}\right]_{{m} \times {n}} \frac{\boldsymbol{W}_{\rm{n k}}}{\sqrt{{\boldsymbol{\lambda}}_{{j}}}} (1) 式中:{a}_{{ij}}^{\prime} 为标准化后的数据,i=1,2,…,m;j=1,2,…,n;m为样本个数;n为样本特征数;Amk为样本的主成分;Wnk为特征向量根据特征值大小按列降序排列,选取前k列组成的矩阵;λj 为特征向量,j=1,2,…,n。
1.2 数据集划分
SPXY (Sample set partitioning based on joint x-y distance) 算法 [23]是广泛应用的数据集划分方法,是基于KS (Kennard-Stone) 算法提出的一种改进方法,该方法能够同时计算不同样本的x向量方向和y向量方向的欧氏距离,并通过正则化将x和y方向的距离结合,更加全面的评估和划分数据集,能够有效地减小过拟合问题,提高机器学习模型的泛化能力。笔者采用该方法进行样本的训练集和测试集划分。
1.3 基于MTD类分布的虚拟样本生成
1)基于MTD类分布生成技术的基本原理
MTD的基本原理[20-21]如图2所示,所生成的虚拟样本的左边界LB和右边界RB按式(2)和式(3)计算。
\mathrm{LB}=\left\{ \begin{array}{cc} {\mathrm{C L}}-{Skew}_{\mathrm{L}} \times \sqrt{-2 \times \dfrac{\hat{S}_x^2}{N_{\mathrm{L}}} \times \ln \left(10^{-20}\right)} & {\mathrm{L B}} \leqslant \min \\ \mathrm{min} & \mathrm{LB}>\min \end{array}\right. (2) \mathrm{RB}=\left\{ \begin{array}{cc} {\mathrm{C L}}+{Skew}_{\mathrm{R}} \times \sqrt{-2 \times \dfrac{\hat{S}_x^2}{N_{\mathrm{R}}} \times \ln \left(10^{-20}\right)} & {\mathrm{R B}} \geqslant \text {min} \\ \min & \mathrm{RB}< \mathrm{min} \end{array}\right. (3) 其中:
{\mathrm{CL}}=(\max-\min)/2 {Skew}_{{\mathrm{L}}}=\frac{{N}_{{\mathrm{L}}}}{{N}_{{\mathrm{L}}}+{N}_{{\mathrm{R}}}} {Skew}_{{\mathrm{R}}}=\frac{{N}_{{\mathrm{R}}}}{{N}_{{\mathrm{L}}}+{N}_{{\mathrm{R}}}} {\hat{S}}_{x}^{2}=\frac{\displaystyle\sum _{i=1}^{n}{\left({x}_{i}-\bar{x}\right)}^{2}}{n-1} 式中:min 为样本特征最小边界;max为样本特征最大边界;LB 为虚拟样本左边界;CL 为样本数据中心点;RB 为虚拟样本右边界;NL、NR分别为中心点数据CL左边和右边的样本数量;{\hat{S}}_{x}^{2} 为样本方差;xi 为样本,i=1,2,…,n;\bar x 为样本均值;n 为样本数量。
一般情况下,虚拟样本的生成方法采用插值法,根据插值方法的不同可分为三角分布插值法,均匀分布插值法、正态分布插值法以及混合插值方法。采用上述方法生成的虚拟样本中的变量分布类型为既定类型,没有考虑到真实样本数据的潜在分布规律等情况的影响,虚拟样本与真实样本的分布不同,训练出来的模型可能会过度拟合虚拟样本的特征,无法准确预测真实样本。因此基于MTD提出类分布虚拟样本生成技术,其核心是通过分析实测样本数据潜在分布类型,进而生成与实测样本相似分布的虚拟样本集,可按照式(4)计算生成。
X_{V S G}={\mathrm{L B}}+g({\mathrm{R B}}-{\mathrm{L B}})+\Delta x (4) 式中:g为与实测样本分布相似的随机数,g = (0,1);\Delta x 为修正量,由于真实样本存在边界分布不平衡的问题,可能出现少量极端样本,这会导致MTD生成的拓展域上的虚拟样本不能很好的反应实测样本的分布,生成的虚拟样本分布情况与实测样本存在一定偏移,故对虚拟样本增加一个修正因子\Delta x 。
2)实测样本训练集的潜在分布特征
实测样本训练集中主成分Ⅰ~Ⅸ的频率直方图和累计分布曲线,如图3所示。由图中分析可知,除主成分Ⅰ出现明显两端分布大、中间分布少的特点外,其他主成分分布两头低、中间高,与正态分布相似。故主成分Ⅰ采用双正态分布组合的形式进行模拟,其他主成分采用正态分布进行模拟。
3)虚拟样本合理性K-S检验
为进一步验证生成的虚拟样本与实测样本分布的相似性,采用K-S检验方法[24]对虚拟样本与实测样本训练集进行分布检验,该方法适用于样本量小的非参数检验。
设原假设:两个样本来自同一连续分布;备择假设:两个样本来自不同的连续分布。虚拟样本生成数量分别为50、200和500,限于图幅要求,文中仅给出虚拟样本数量为200时,虚拟样本与实测样本中主成分的累积分布曲线对比结果,如图4所示。由图中分析可知,九个主成分的分布显著性水平均在0.8以上,故接受虚拟样本与实测样本同分布假设。
3)虚拟样本输出生成
通过SPXY算法划分生成的训练集为 (x,y),采用MTD类分布技术获得得到的虚拟样本为 (Tx,y(T(x)))。为了给虚拟样本输入生成更合理的虚拟样本输出,首先采用SaDE-ELM算法对训练集 (x,y) 进行回归训练,通过调整模型超参数,使预测均方根误差RMSE降低到0.1以下,利用训练好的模型为虚拟样本生成输出值。
1.4 底板破坏深度预测模型构建
将虚拟样本集与训练集组成的的混合训练集,分别采用SaDE-ELM、BP、GA-PSO-BP 3种智能算法构建数据增强前后的带压开采煤层底板破坏深度预测模型,并对模型预测精度进行对比分析,模型实现的具体流程如图5所示。
2. 模型验证
为验证引入虚拟样本对模型的优化效果,采用绝对误差Ea、相对误差δ、均方根误差RMSE三个指标评价模型预测精度,评价指标的计算方法见式(5)—式(7)。
{{\mathrm{E}}}_{{\mathrm{a}}}=\left|{\widehat{b}}_{{\mathrm{i}}}-{b}_{{\mathrm{i}}}\right| (5) \text{ δ} =\frac{\left|{\widehat{b}}_{{\mathrm{i}}}-{b}_{{\mathrm{i}}}\right|}{{b}_{{\mathrm{i}}}}\times 100\% (6) {\mathrm{RMSE}}=\sqrt{\frac{\displaystyle\sum _{i}^{n}{\left({\widehat{b}}_{{\mathrm{i}}}-{b}_{{\mathrm{i}}}\right)}^{2}}{n-1}} (7) 式中:n为测试集样本个数;Ea 为绝对误差;δ 为相对误差;RMSE 为均方根误差;bi 为真实输出; {\widehat{b}}_{{\mathrm{i}}} 为预测输出。
虚拟样本的数量对模型计算效率和预测精度具有一定程度的影响,不同虚拟样本数量下模型的误差分布变化规律,如图6所示。由图中分析可知,虚拟样本数量超过80后,模型预测误差变化基本稳定,而未考虑虚拟样本增强的模型预测误差始终波动变化,综合考虑计算效率及模型预测误差的影响,本次分析中虚拟样本数量均取100。
根据SPXY算法样本集划分结果,对黑山矿3号(真实破坏深度:9.34 m)、夏庄矿3号(7.83 m)、夏庄矿5号(12.58 m)、夏庄矿7号(9.34 m)、夏庄矿8号(13.66 m)、夏庄矿10号(13.66 m)、夏庄矿11号(13.66 m)、夏庄矿12号(11.50 m)、夏庄矿13号(6.10 m)、双山大井4号(8.80 m)10个样本进行预测。为避免模型的随机性,进行5次试验,结果取平均。采用虚拟样本增强前后,各模型的误差对比分析结果如图7—图9和表3所示。由图表分析可知,数据增强前,SaDE-ELM模型预测的底板破坏深度分别为
9.3357 、7.8681 、12.5940 、9.2549 、13.6255 、13.5846 、13.6793 、11.5509 、6.1208 、8.8046 m,GA-PSO-BP模型预测的底板破坏深度分别为9.5588 、7.7790 、12.7142 、9.2624 、13.5262 、13.6400 、13.4901 、11.3607 、5.9880 、8.7881 m,BP模型预测的底板破坏深度分别为9.4667 、6.5122 、10.8061 、8.3582 、12.7219 、11.7219 、11.6353 、9.2193 、6.1496 、8.0830 m;数据增强后,SaDE-ELM模型预测的底板破坏深度分别为9.3435 、7.8401 、12.5648 、9.3106 、13.6486 、13.6135 、13.7059 、11.5228 、6.1114 、8.8015 m,GA-PSO-BP模型预测的底板破坏深度分别为9.2529 、7.7339 、12.6455 、9.2745 、13.7134 、13.5855 、13.5567 、11.4919 、6.3055 、8.7799 m,BP模型预测的底板破坏深度分别为10.1114 、7.9542 、12.8855 、9.6846 、12.3618 、13.7132 、13.6569 、11.4998 、6.7525 、8.8053 m。相较于虚拟样本增强前,增强后SaDE-ELM模型、GA-PSO-BP模型、BP模型的平均绝对误差分别降低约42.95%、27.09%、70.7%,平均相对误差分别降低约47.08%、16.3%、65.9%,均方根误差分别降低约51.27%、27.77%、36.46%,可见采用虚拟样本增强后的预测模型精度显著提升,且SaDE-ELM模型预测精度最优。表 3 模型预测误差Table 3. Model predictive error预测性能指标 数据样本 SaDE-ELM GA-PSO-BP BP 误差 误差降低/% 误差 误差降低/% 误差 误差降低/% 平均绝对误差/m 实测训练集 0.034678 42.95328 0.106853 27.09214 1.214402 70.69971 增强训练集 0.019783 0.077904 0.355823 平均相对误差/% 实测训练集 0.333537 47.08235 1.044385 16.30162 10.74378 65.89809 增强训练集 0.1765 0.874134 3.663832 均方根误差 实测训练集 0.057211 51.27344 0.2437 27.7698 1.539483 36.45541 增强训练集 0.027877 0.176025 0.978258 3. 工程应用
以邯郸云驾岭煤矿九号煤层为研究对象。根据云驾岭矿9煤层工程地质调查结果,目前正在生产的工作面为19105工作面。相邻的19103工作面已被完全开采。19105工作面存在多处局部断层,最小落差为1 m。煤底板以砂岩为主,抗拉强度5 MPa,单轴抗压强度33.26 MPa。煤层下方存在奥陶系灰岩含水层,工作面距该含水层顶界面31.41 m。含水层底部界面水压为1.49 MPa。工作面采动期间,平均涌水量约为5 m3/h,最大涌水量约为10 m3/h。根据MENG等[25],p1、p2、p3的值由式(8)计算得出。根据地质勘探结果和MENG[25]的方法计算,可以确定19105工作面影响因子值,见表4。
表 4 19105工作面影响因子值Table 4. Impact factor values of 19105 working face影响因子 值 影响因子 值 影响因子 值 f1 0.5 P /MPa 1.49 H /m 346 f2 0 hl /m 34.41 α /° 13 f3 1 p1 1 M /m 2.88 H1 /m 1 p2 0 L1 /m 69 Q /(m3·h−1) 10 p3 0 L2 /m 199 k1 0.5 m1 /m 2.88 k2 0.5 L3 /m 30 {p}_{{\mathrm{i}}}\text=\frac{{h}_{\text{i}}}{{h}_{1}}\text{}\text{×100\%} (8) 式中:pi 为岩层厚度占不透水层总厚度的比例;hi 为层状岩层厚度。
采用规范经验方法(CWIC)[25]、基于滑移场理论的解析解(ASSF)[26]和本方法对19105工作面底板突水风险进行预测和评估,如图10所示。可以看出,对于云驾岭煤矿19105工作面实际工况,本方法预测结果为
13.4794 m,CWIC预测结果为8.09 m,ASSF预测结果为12.85 m。所提方法的预测结果略大于CWIC和ASSF,主要是综合考虑了地质和建设因素的影响。该方法的评价结果偏向危险性,有利于工程安全。4. 结 论
1)针对底板破坏深度实测样本量少、预测模型精度低和泛化能力弱等问题,通过采用MTD类分布虚拟样本生成技术,增强煤层底板破坏深度实测样本,通过K-S检验方法检验了虚拟样本数据集的合理性。
2)采用SaDE-ELM、GA-PSO-BP、BP 3种算法,构建了虚拟样本增强前后煤层底板破坏深度预测模型。
3)采用虚拟样本增强后的煤层底板破坏深度预测模型精度显著提高,模型预测误差可降低42.95%~51.27%,其中基于MTD类分布小样本增强的PCA-SaDE-ELM预测模型的预测效果最优。
4)相较于其他方法,所提方法预测获得的云驾岭19105工作面底板破坏深度相对较大,有利于工作面安全生产管理。
-
表 1 总方差解释
Table 1 Total variance explanation
主成分 特征值 方差百分比/% 累积/% Ⅰ 5.541 29.163 29.163 Ⅱ 2.464 12.971 42.134 Ⅲ 2.121 11.163 53.297 Ⅳ 1.534 8.072 61.370 Ⅴ 1.322 6.957 68.327 Ⅵ 1.215 6.396 74.723 Ⅶ 0.933 4.912 79.635 Ⅷ 0.823 4.331 83.966 Ⅸ 0.743 3.910 87.876 Ⅹ 0.588 3.097 90.973 ⅩⅠ 0.453 2.382 93.355 ⅩⅡ 0.310 1.633 94.989 ⅩⅢ 0.286 1.508 96.497 ⅩⅣ 0.267 1.404 97.901 ⅩⅤ 0.176 0.925 98.827 ⅩⅥ 0.122 0.641 99.468 ⅩⅦ 0.079 0.415 99.882 ⅩⅧ 0.022 0.118 100.000 ⅩⅨ 0.000 0.000 100.000 表 2 成分矩阵
Table 2 Component matrix
主成分 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ f1 0.377 0.526 −0.410 0.078 0.086 0.324 0.131 −0.246 0.072 f2 −0.039 0.159 −0.346 −0.009 0.350 0.613 −0.325 0.429 0.123 f3 0.035 0.521 0.098 0.386 0.106 0.366 0.052 −0.405 −0.354 H1 0.620 0.202 −0.237 0.097 −0.408 0.043 −0.109 0.076 −0.347 P 0.695 0.070 0.300 0.220 −0.348 0.091 −0.271 0.193 −0.061 h 0.661 −0.042 0.187 0.221 −0.387 0.125 −0.342 −0.014 0.194 p1 0.453 −0.162 −0.768 0.204 0.159 −0.265 −0.071 −0.008 0.052 p2 −0.515 0.167 0.323 −0.147 −0.575 0.327 0.308 0.068 0.133 p3 −0.036 0.034 0.751 −0.124 0.482 −0.011 −0.279 −0.073 −0.245 k1 0.280 0.755 −0.161 −0.148 −0.003 −0.325 −0.147 0.064 0.030 k2 0.219 0.741 0.150 0.148 0.046 −0.301 0.052 −0.145 0.314 Q 0.662 −0.087 0.151 0.182 0.318 0.233 0.387 0.213 −0.021 H 0.789 0.098 0.408 −0.027 0.140 −0.224 −0.005 0.125 0.011 α −0.116 0.151 0.283 0.745 0.125 −0.091 0.260 0.276 0.185 M 0.782 −0.464 −0.056 0.157 −0.064 −0.030 0.125 −0.098 −0.143 L1 0.629 −0.064 0.245 −0.312 0.092 0.194 −0.163 −0.234 0.346 L2 0.717 0.017 −0.031 −0.452 0.062 0.193 0.266 −0.085 0.120 m 0.765 −0.515 0.038 0.109 0.026 0.002 0.107 −0.138 0.068 L3 0.559 0.380 0.003 −0.473 −0.021 −0.118 0.248 0.330 −0.247 表 3 模型预测误差
Table 3 Model predictive error
预测性能指标 数据样本 SaDE-ELM GA-PSO-BP BP 误差 误差降低/% 误差 误差降低/% 误差 误差降低/% 平均绝对误差/m 实测训练集 0.034678 42.95328 0.106853 27.09214 1.214402 70.69971 增强训练集 0.019783 0.077904 0.355823 平均相对误差/% 实测训练集 0.333537 47.08235 1.044385 16.30162 10.74378 65.89809 增强训练集 0.1765 0.874134 3.663832 均方根误差 实测训练集 0.057211 51.27344 0.2437 27.7698 1.539483 36.45541 增强训练集 0.027877 0.176025 0.978258 表 4 19105工作面影响因子值
Table 4 Impact factor values of 19105 working face
影响因子 值 影响因子 值 影响因子 值 f1 0.5 P /MPa 1.49 H /m 346 f2 0 hl /m 34.41 α /° 13 f3 1 p1 1 M /m 2.88 H1 /m 1 p2 0 L1 /m 69 Q /(m3·h−1) 10 p3 0 L2 /m 199 k1 0.5 m1 /m 2.88 k2 0.5 L3 /m 30 -
[1] 张吉雄,张强,周楠,等. 煤基固废充填开采技术研究进展与展望[J]. 煤炭学报,2022,47(12):4167−4181. ZHANG Jixiong,ZHANG Qiang,ZHOU Nan,et al. Research progress and prospect of coal based solid waste backfilling mining technology[J]. Journal of China Coal Society,2022,47(12):4167−4181.
[2] SUN W J,ZHOU W F,JIAO J. Hydrogeological classification and water inrush accidents in China’s coal mines[J]. Mine Water and the Environment,2016,35(2):214−220. doi: 10.1007/s10230-015-0363-3
[3] WANG P P,JIANG Y D,REN Q S. Roof hydraulic fracturing for preventing floor water inrush under multi aquifers and mining disturbance:A case study[J]. Energies,2022,15(3):1187. doi: 10.3390/en15031187
[4] DUAN H F,ZHAO L J. New evaluation and prediction method to determine the risk of water inrush from mining coal seam floor[J]. Environmental Earth Sciences,2021,80(1):30. doi: 10.1007/s12665-020-09339-y
[5] 靳德武. 我国煤层底板突水问题的研究现状及展望[J]. 煤炭科学技术,2002,30(6):1−4. doi: 10.3969/j.issn.0253-2336.2002.06.001 JIN Dewu. Research status and outlook of water outburst from seam floor in China coal mines[J]. Coal Science and Technology,2002,30(6):1−4. doi: 10.3969/j.issn.0253-2336.2002.06.001
[6] 袁亮. 我国煤炭资源高效回收及节能战略研究[J]. 中国矿业大学学报(社会科学版),2018,20(1):3−12. doi: 10.3969/j.issn.1009-105x.2018.01.001 YUAN Liang. Strategies of high efficiency recovery and energy saving for coal resources in China[J]. Journal of China University of Mining & Technology (Social Sciences),2018,20(1):3−12. doi: 10.3969/j.issn.1009-105x.2018.01.001
[7] LIU Y,LIU S L,HUO Z C,et al. Failure characteristics of coal seam floor and risk assessment of water inrush caused by underground coal mining[J]. Energy Exploration and Exploitation,2023,41(2):677−695. doi: 10.1177/01445987221144332
[8] LIU Y,ZHU J Z,LIU Q M,et al. Mechanism analysis of delayed water inrush from Karst collapse column during roadway excavation based on seepage transition theory:A case study in PanEr coal mine[J]. Energies,2022,15(14):4987. doi: 10.3390/en15144987
[9] HE T,LI G D,SUN C,et al. Floor failure characteristics of thick coal seam mining above confined aquifer[J]. Mining,Metallurgy & Exploration,2022,39(4):1553−1562.
[10] ZHANG P S,OU Y C,SUN B Y,et al. A case study of floor failure characteristics under fully mechanised caving mining conditions in extra-thick coal seams[J]. Journal of Geophysics and Engineering,2020,17(5):813−826. doi: 10.1093/jge/gxaa031
[11] 李杨杨,张士川,孙熙震,等. 煤层采动底板突水演变过程可视化试验平台研制与试验研究[J]. 煤炭学报,2021,46(11):3515−3524. LI Yangyang,ZHANG Shichuan,SUN Xizhen,et al. Development and experimental study on visualization test platform for water inrush evolution process of coal seam mining floor[J]. Journal of China Coal Society,2021,46(11):3515−3524.
[12] WANG W M,YUAN Y,LIANG X K,et al. Experimental study on floor damage and slurry material ratio optimization in deep and high confined water mining[J]. Processes,2022,10(9):1806. doi: 10.3390/pr10091806
[13] QI Y,WANG W,GE J Q,et al. Development characteristics of the rock fracture field in strata overlying a mined coal seam group[J]. PLoS One,2022,17(10):e0268955. doi: 10.1371/journal.pone.0268955
[14] LIU W T,DU Y H,LIU Y B,et al. Failure characteristics of floor mining-induced damage under deep different dip angles of coal seam[J]. Geotechnical and Geological Engineering,2019,37(2):985−994. doi: 10.1007/s10706-018-0666-9
[15] 郭惟嘉,张士川,孙文斌,等. 深部开采底板突水灾变模式及试验应用[J]. 煤炭学报,2018,43(1):219−227. GUO Weijia,ZHANG Shichuan,SUN Wenbin,et al. Experimental and analysis research on water inrush catastrophe mode from coal seam floor in deep mining[J]. Journal of China Coal Society,2018,43(1):219−227.
[16] 于小鸽,韩进,施龙青,等. 基于BP神经网络的底板破坏深度预测[J]. 煤炭学报,2009,34(6):731−736. doi: 10.3321/j.issn:0253-9993.2009.06.003 YU Xiaoge,HAN Jin,SHI Longqing,et al. Forecast of destroyed floor depth based on BP neural networks[J]. Journal of China Coal Society,2009,34(6):731−736. doi: 10.3321/j.issn:0253-9993.2009.06.003
[17] 施龙青,张荣遨,韩进,等. 基于GWO改进的PCA-BP神经网络煤层底板破坏深度预测模型[J]. 矿业研究与开发,2020,40(2):88−93. SHI Longqing,ZHANG Rongao,HAN Jin,et al. Prediction model of failure depth of coal seam floor based on PCA-BP neural network improved by GWO[J]. Mining Research and Development,2020,40(2):88−93.
[18] 邵良杉,周玉. 基于PSO-ELM-Boosting模型的底板破坏深度预测[J]. 中国安全科学学报,2018,28(4):24−29. SHAO Liangshan,ZHOU Yu. Prediction of destroyed floor depth based on SO-ELM-Boosting model[J]. China Safety Science Journal,2018,28(4):24−29.
[19] WANG Z C,ZHAO W T,HU X. Analysis of prediction model of failure depth of mine floor based on fuzzy neural network[J]. Geotechnical and Geological Engineering,2019,37(1):71−76. doi: 10.1007/s10706-018-0591-y
[20] LI D C,CHEN C C,CHANG C J,et al. A tree-based-trend-diffusion prediction procedure for small sample sets in the early stages of manufacturing systems[J]. Expert Systems with Applications,2012,39(1):1575−1581. doi: 10.1016/j.eswa.2011.08.071
[21] CHAO G Y,TSAI T I,LU T J,et al. A new approach to prediction of radiotherapy of bladder cancer cells in small dataset analysis[J]. Expert Systems with Applications,2011,38(7):7963−7969. doi: 10.1016/j.eswa.2010.12.035
[22] 余国锋. 基于微震和神经网络的煤层底板突水预警技术研究[D]. 淮南:安徽理工大学,2022. YU Guofeng. Study on early warning technology of water inrush in coal seam floor based on microseism and neural network[D]. Huainan:Anhui University of Science & Technology,2022.
[23] ZHANG Y X,WANG X Z,WANG Y F,et al. Detection of tomato water stress based on terahertz spectroscopy[J]. Frontiers in Plant Science,2023,14:1095434. doi: 10.3389/fpls.2023.1095434
[24] 宫凤强,王天成,黄天朗. 基于正态信息扩散原理的极值型工程参数概率分布推断方法[J]. 中南大学学报(自然科学版),2020,51(6):1692−1702. doi: 10.11817/j.issn.1672-7207.2020.06.024 GONG Fengqiang,WANG Tiancheng,HUANG Tianlang. An inference method for probability distribution of extreme value engineering parameters based on normal information diffusion principle[J]. Journal of Central South University (Science and Technology),2020,51(6):1692−1702. doi: 10.11817/j.issn.1672-7207.2020.06.024
[25] MENG Z P,LI G Q,XIE X T. A geological assessment method of floor water inrush risk and its application[J]. Engineering Geology,2012,143:51−60.
[26] ZHANG W,ZHANG D S,QI D H,et al. Floor failure depth of upper coal seam during close coal seams mining and its novel detection method[J]. Energy Exploration & Exploitation,2018,36(5):1265−1278.