高级检索

基于VRA-UNet网络的煤岩组合体裂隙识别与三维重构

王登科, 王龙航, 秦亚光, 位乐, 曹塘根, 李文睿, 李璐, 陈旭, 夏玉玲

王登科,王龙航,秦亚光,等. 基于VRA-UNet网络的煤岩组合体裂隙识别与三维重构[J]. 煤炭科学技术,2025,53(2):96−108. DOI: 10.12438/cst.2024-1441
引用本文: 王登科,王龙航,秦亚光,等. 基于VRA-UNet网络的煤岩组合体裂隙识别与三维重构[J]. 煤炭科学技术,2025,53(2):96−108. DOI: 10.12438/cst.2024-1441
WANG Dengke,WANG Longhang,QIN Yaguang,et al. Fracture identification and 3D reconstruction of coal-rock combinations based on VRA-UNet network[J]. Coal Science and Technology,2025,53(2):96−108. DOI: 10.12438/cst.2024-1441
Citation: WANG Dengke,WANG Longhang,QIN Yaguang,et al. Fracture identification and 3D reconstruction of coal-rock combinations based on VRA-UNet network[J]. Coal Science and Technology,2025,53(2):96−108. DOI: 10.12438/cst.2024-1441

基于VRA-UNet网络的煤岩组合体裂隙识别与三维重构

基金项目: 国家自然科学基金资助项目(52174174);河南省杰出青年科学基金资助项目(252300421010);河南理工大学创新团队计划资助项目(T2022-1)
详细信息
    作者简介:

    王登科: (1980—),男,湖南永州人,教授,博士生导师,博士。E-mail:wdk@hpu.edu.cn

  • 中图分类号: TD32;TP391.41

Fracture identification and 3D reconstruction of coal-rock combinations based on VRA-UNet network

  • 摘要:

    在煤岩组合体裂隙三维重构中,针对传统阈值分割方法无法准确确定煤岩之间的阈值大小从而导致裂隙分割效果不佳的问题,基于深度学习理论提出了一种新型VRA-UNet煤岩组合体裂隙精确识别模型,为煤岩组合体裂隙精确识别提供了一种优化解决方案。为了提升模型的泛化能力和防止初始化模型参数过于随机,使用VGG16模块作为骨干特征提取网络。针对煤岩组合体裂隙拓扑结构复杂,非均匀性强等问题,在上采样部分引入使用残差连接且具有空间维度和通道维度的注意力模块(ResCBAM)增强模型特征提取能力,缓解模型梯度消失的问题。在下采样的末端加入了利用不同尺度卷积核的非对称空洞金字塔模块(AC-ASPP),通过多尺度的特征提取,提高模型对不同大小裂隙的识别能力。同时,利用煤岩组合体CT扫描图像数据集验证了模型的有效性。研究结果表明:VRA-UNet模型在裂隙提取和识别方面性能良好,平均交并比、像素平均值及识别精度分别为85.22%、90.80%和91.95%;与主流的分割网络UNet、PSPNet、DeeplabV3+、FCN和SegNet相比,VRA-UNet模型的平均交并比分别提高了6.05%、16.7%、10.77%、6.87%和6.4%,像素平均值分别提高了7.13%、13.29%、12.84%、7.4%和7.53%,识别精度分别提高了3.82%、14.45%、7.4%、5.58%和4.31%;VRA-UNet识别出的裂隙结构分形维数与原始CT扫描裂隙结构分形维数保持了良好的一致性,真实还原了煤岩组合体内部裂隙结构的分布特征。

    Abstract:

    In the 3D reconstruction of coal-rock combinations fractures, in response to the problem that traditional threshold segmentation methods cannot accurately determine the threshold size between coal and rock, resulting in poor fracture segmentation performance, a new VRA-UNet coal-rock combinations fracture identification model based on deep learning theory is proposed, providing an optimized solution for accurate identification of coal-rock combinations fractures. Firstly, the VGG16 module is used as the backbone feature extraction network to enhance the model’s generalization ability and prevent the initialization of model parameters from being too random. Secondly, to address the complex fracture topology and strong non-uniformity of coal-rock combinations, an attention module (ResCBAM) with spatial and channel dimensions is introduced into the up-sampling part to enhance the model's feature extraction ability and alleviate the problem of gradient disappearance. Finally, an asymmetric atrous pyramid module (AC-ASPP) utilizing convolution kernels of different scales is added at the end of the downsampling, which reduced the computational complexity and improved the computational efficiency of the model while keeping the receptive field unchanged. The effectiveness of the model is verified using a dataset of CT scan images of coal-rock combinations. The research results indicate that the VRA-UNet model performs well in crack extraction and recognition, with an average intersection to union ratio, pixel average value, and recognition accuracy of 85.22%, 90.80%, and 91.95%, respectively; Compared with mainstream segmentation networks UNet, PSPNet, DeeplabV3+, FCN, and SegNet the average intersection to union ratio of the VRA-UNet model has increased by 6.05%, 16.7%, 10.77%, 6.87%, and 6.4% respectively. The average pixel value has increased by 7.13%, 13.29%, 12.84%, 7.4%, and 7.53% and the recognition accuracy has risen by 3.82%, 14.45%, 7.4%, 5.58%, and 4.31% respectively; The fractal dimension of the fracture structure identified by VRA-UNet maintains good consistency with the fractal dimension of the original CT scan fracture structure, accurately reproducing the distribution characteristics of the internal fracture structure of the coal-rock combinations.

  • 随着我国浅部煤炭资源的日益枯竭,煤矿开采的深度不断加大,地应力明显增大,致使冲击地压发生的频次和烈度显著增加[1-4]。冲击地压是一种煤岩组合体在矿山压力作用下大量弹性能瞬间释放所导致的矿井灾害,单独研究煤层或岩层的破坏难以反映冲击地压诱导煤岩动力灾害客观实际[5-8]。因此,开展煤岩组合体变形破坏机制相关研究,对于人们正确认识冲击地压及其诱导的煤岩动力灾害发生机理具有重要意义。为了判断煤岩组合体裂隙对煤岩动力灾害的影响,明确其在发生过程中的作用机理,传统多采用CT扫描配合VGStudio软件三维重构技术得到煤岩组合体的结构特征并进行分析[9-11]。然而,煤岩组合体中岩层与煤层的明暗背景结构,使得传统VGStudio软件自带的阈值分割方法无法准确界定裂隙的阈值。

    近年来,得益于图形处理技术的发展,深度神经网络被广泛应用至煤岩裂隙检测领域,实现了更高的检测精准率[12-14]。闫志蕊等[15]提出了一种基于改进DeeplabV3+和迁移学习的煤岩界面图像识别网络模型,该模型使用轻量化MobilenetV2模块作为骨干特征提取网络,减少了模型参数,并通过引入卷积注意力机制模块提高模型特征提取能力。JIN等[16]为了提高网络模型学习效率,提出了M2AR-UNet模型。该模型通过改进残差块、包含多种注意力机制的混合注意力模块、边缘特征增强策略、由特征金字塔和弹性空洞金字塔池化模块组成的多尺度特征提取模块等4种方式对网络结构进行优化。BOUGOURZI等[17]为了提高Att-UNet架构的性能并最大限度地利用注意力机制,提出了一种由PAtt-UNet模型和DAtt-UNet模型合并成的PDAtt-UNet架构。PDAtt-UNet旨在利用输入金字塔来保留所有编码器层的空间感知,并通过注意力机制更好地识别需要分割的边界。LI等[18]基于UNet++,设计了一种名为CA-UNet++的新模型,UNet++在处理复杂图像时更有效。针对其在跳跃连接和上采样过程中特征值损失较大的问题,引入通道注意力机制,以获得更好的图像分割效率和准确性。李元海等[19]针对交叉岩石裂隙的分离与特征提取,提出了一种基于迹线方向判定的裂隙分离与表征算法。该算法采用深度学习方法,通过引入混合注意力机制对UNet模型进行改进,从而有效提高了岩石裂隙识别的精度。ZHAO等[20]为了提高模型分割精度,提出了一种将FCN语义分割结果与BSLIC获取的超像素信息相结合的图像语义分割算法。在模型组合过程中引入超像素语义标注,不仅可以准确识别图像中目标的语义信息,还可以实现小边缘定位的高精度。王安民等[21]基于深度学习技术,设计了一种针对页岩孔隙图像分割的HAFCN模型。该模型采用了一种基于超列结构和联合注意力融合模块的全卷积神经网络,有效避免了因网络层数过多而引发的梯度消失问题。上述研究展示了深度神经网络在煤岩裂隙识别方面的应用非常广泛,为煤矿工程和地质勘探等领域的研究与实践打开了新的方向,并提供了技术上的支持。

    用于裂隙识别的卷积神经网络主要分为2类:语义分割和目标检测。与目标检测相比,语义分割在裂隙检测中更适合进行定性和定量分析[22-23]。语义分割模型原理是通过对图像进行像素级的分类,输出每个像素点的类别,从而避免了阈值分割方法处理煤岩组合体时阈值难以确定的问题。传统的语义分割模型常用于分割目标背景简单的图像,但是煤岩组合体有着复杂裂隙结构以及裂隙颜色与煤基质相近、难以区分的特点。针对上述问题,本文基于UNet网络,将特征提取主干网络替换为VGG16模块,防止模型初始参数过于随机;引入空间维度、通道维度及残差连接组成的注意力机制(ResCBAM)获得更精细的裂隙特征信息,实现对微小裂隙的精准识别;构建含有非对称卷积的空洞金字塔模块(AC-ASPP),增大感受野并降低模型的参数数量,防止模型发生过拟合现象。加入VGG16模块、ResCBAM模块和AC-ASPP模块后的UNet网络模型在本文中称之为VRA-UNet网络模型。

    UNet主要由特征提取主干网络和加强特征提取网络组成,如图1所示。该结构能够有效捕捉多尺度特征信息,特别适合处理小样本数据集,因此本文模型采用了这一结构。特征提取主干网络包含5个初步有效特征层,每个初步有效特征层由2个3×3的卷积层、ReLU激活函数和1个2×2的池化层组成,旨在逐步缩小和抽象化图像特征。其中ReLU激活函数式为

    图  1  UNet网络模型结构
    Figure  1.  UNet network model structure
    $$ f(x) = max(0,x) $$ (1)

    式中:x为输入值;f(x)为输出值。

    加强特征提取网络通过上采样逐渐将抽象化的特征图恢复到与原始图像相同的分辨率,并结合高层次语义特征与低层次细节特征进行特征融合,从而使最终的特征图包含更丰富的语义信息。输出层通过Softmax函数计算每个像素点属于不同类别的概率分布,最终生成一个融合所有特征的有效特征层。Softmax函数的数学表达式如下:

    $$ \sigma ({Z}_{c})=\frac{{{\mathrm{e}}}^{Zc}}{{\displaystyle \sum _{c=1}^{k}{{\mathrm{e}}}^{Zc}}} $$ (2)

    式中:e为自然常数;k为类别的数量;Zc为输入向量的第c个元素;σ(Zc)为Softmax函数输出的第c个元素。

    VGG16采用尺寸较小的3×3卷积核和较多层数的神经网络,设计上旨在提高模型特征提取的能力[24-26]。VGG16网络总共有16层,包括13个卷积层(Convolutional layer)和3个全连接层(Fully layer),如图2所示。输入的图像首先经过2个卷积层,每个卷积层都有64个3×3卷积核,卷积之后进行一次最大池化(Maxpool)降低特征图大小。经过一系列卷积和池化操作得到通道数为512的特征图,然后通过全连接层和Softmax函数计算每个类别的概率分布。VGG16的网络结构相对简单便于进行模型的调整和优化,以及采用随机失活的方法,有效提高了模型的泛化能力,因此经常被用作其他网络模型主干网络部分。

    图  2  VGG16网络模型结构
    Figure  2.  VGG16 network model structure

    注意力机制是一种模拟了人脑注意力的资源分配机制,其核心思想是巧妙合理地改变对信息的注意力,忽略无关信息并放大所需信息[27-29]。注意力机制可分为通道注意力和空间注意力。通道注意力机制能够增强每个通道的特征表达,其工作原理如下:① 输入特征图,经过2个并行的最大池化层和平均池化层,将处理后的结果输入到共享全连接层中,学习每个通道的注意力权重;② 将这些权重与原始特征图的每个通道相乘,得到注意力加权后的通道特征图。空间注意力机制的作用是强调图像中不同位置的重要性,其工作原理如下:① 对输入特征图,进行最大池化和平均池化操作,然后对两个特征图进行拼接,并通过卷积层处理这个特征图,以生成空间注意力权重;② 将得到的空间注意力权重应用于原始特征图,从而对每个空间位置的特征进行加权。通道注意力机制和空间注意力机制式如式(3)、式(4):

    $$ {M_c}\left( F \right) = \sigma ({{\boldsymbol{W}}_1}({{\boldsymbol{W}}_0}({F_{avg}})) + {{\boldsymbol{W}}_1}({{\boldsymbol{W}}_0}({F_{\max }}))) $$ (3)
    $$ {M_s}\left( F \right) = \sigma \left( {{f^{7 \times 7}}([F_{avg}^{};F_{max}^{}])} \right) $$ (4)

    式中:FavgFmax分别为特征图F进行全局平均池化和全局最大池化;W0W1为全连接层的权重矩阵;Mc(F)和Ms(F)分别为通道注意力图和空间注意力图;σ为Sigmoid激活函数。

    SE模块[30-32]和ECA模块[33-35]是比较有代表性的通道注意力模型。尽管他们在传统网络模型中取得了一定的增益效果,但仍然无法克服通道注意力机制仅关注通道间关联而忽视不同位置间关联的缺陷。本文结合通道注意力模块CAM[36](Channel attention module)和空间注意力模块SAM[37](Spartial attention module),并通过残差连接RC[38](Residual connection)得到ResCBAM注意力模块。残差连接的核心思想是在网络的某一层或多层之间增加直接连接,以便网络能够学习输入与输出之间的残差。这种方式有助于模型在训练过程中更有效地回流梯度,从而减轻深度网络中梯度消失的问题。因此,ResCBAM注意力模块克服了传统卷积神经网络在处理不同尺度、形状和方向信息时的局限性,缓解了模型梯度消失的问题,其结构如图3所示。

    图  3  ResCBAM注意力机制
    Figure  3.  ResCBAM attention mechanism

    ASPP(Atrous Spatial Pyramid Pooling)模块主要作用是帮助模型实现多尺度分析和特征提取[39-41]。ASPP通过多尺度特征提取提高了模型对裂隙识别的精确度,但同时也增加了网络复杂度。非对称卷积(Asymmetric Convolution)是一种卷积操作,它的卷积核在某一维度上的大小不同于其他维度,这种卷积方式通常会减少模型的参数量,降低计算复杂度。同时,不同的卷积核大小也可以灵活地捕捉不同尺度的特征,增强模型对复杂形状和模式的识别能力。为此,本文引入非对称卷积到ASPP模块中,得到了AC-ASPP模块,如图4所示。相较于ASPP模块,AC-ASPP模块能够在使用更少参数的情况下,获得更强的特征提取能力。SPP模块也是空洞金字塔结构的一种,它的主要作用是有效避免了对图像区域的裁剪、缩放操作导致的图像失真等问题。

    图  4  AC-ASPP结构
    Figure  4.  AC-ASPP structure

    AC-ASPP是由1个1×1的卷积和3个分别采用空洞率为6、12、18的非对称空洞卷积以及一个池化层并行连接组成。空洞卷积通过不同的填充与膨胀,可以获取不同尺度的感受野,提取多尺度的特征信息。空洞卷积的式为

    $$ f(x, y)=\sum_i \sum_j g(x-i, y-i) k(r i, r j)$$ (5)

    式中:f为输出特征图;g为输入特征图;k为卷积核;r为空洞率;(x,y)为特征图的索引;(i,j)为卷积核的索引。

    传统的UNet网络模型在进行图像识别时,没有充分利用加强特征提取网络部分中的特征图信息,也无法对感兴趣区域进行重点学习,往往存在目标边缘分割精度低和分割不连续等问题。本文提出了一种针对煤岩组合体裂隙精确识别的VRA-UNet模型,较好地克服了这些问题,其结构如图5所示。

    图  5  VRA-UNet模型结构
    Figure  5.  VRA-UNet model structure

    VRA-UNet模型基于UNet模型,采用VGG16模块作为主干特征提取网络。针对UNet模型在上采样过程中出现的目标细节丢失及不能对感兴趣区域进行侧重学习的问题,VRA-UNet模型在每次上采样后加入ResCBAM注意力机制,以增强模型对裂隙的学习能力。为了提取到更多的语义信息,模型底部还加入了AC-ASPP模块,以整合来自特征提取区域的语义信息,从而使特征图中的信息得到更充分的利用。这些改进提升了模型在处理复杂煤岩组合体图像时的准确性和鲁棒性,为后续的煤岩分析和应用提供了更强大的技术支持。

    本文所使用的煤岩组合体样本取自内蒙古满来梁煤矿,样本经过初步筛选和清洗,去除表面杂质和松散物质,然后使用精密切割工具将取得的样本加工成50 mm×50 mm的圆柱体,如图6所示。利用河南理工大学瓦斯地质与瓦斯治理国家重点实验室的煤岩工业CT扫描系统对煤岩组合体样本进行扫描,该CT设备具有毫米级的扫描能力。利用VGStudio软件对扫描结果进行处理,然后将扫描结果以每张图片相距0.05 mm的间隔,分割出1 000张图片,并从中挑选出裂隙发育较完整的图片,最终形成煤岩组合体数据集。

    图  6  煤岩组合体试样
    Figure  6.  Coal-rock combinations sample

    从CT扫描的图片中挑选出300张裂隙清晰且具有代表性的图片,随后利用ImageJ软件对这些原始图像中的裂隙进行像素级标注,制作出标签图片,如图7b所示。在标签图片中,裂隙区域被标记为灰度值为255的白色区域,而非裂隙区域则被标记为灰度值为0的黑色区域。为增强模型的学习能力,本文扩充了数据集的深度和广度,对原始数据进行了数据增强。增强方式包括亮度增强、噪声模糊、左右翻转和上下翻转,数据增强效果图如图7所示。经过上述增强操作,煤岩组合体数据集扩充到了1 200张,并按9∶1的比例将图像分为1 080张训练集和120张测试集,后续各模型的测试均在测试集上进行。

    图  7  数据集预处理
    Figure  7.  Dataset preprocessing

    本研究模型训练和验证在一台深度学习工作站上进行,设备采用Win 10操作系统、Intel(R) Xeon(R) Gold 6226R CPU @ 2.90 GHz处理器、192 GB内存及NVIDIA Quadro RTX5000显卡。基于Pytorch1.7深度学习框架使用Python3.9搭建深度学习网络模型。在模型训练时,采用Adam作为模型损失函数优化器,其能够在训练过程中调整每个参数的学习率,使得模型能更快地收敛到最优解。学习率设置为0.000 1能够确保模型在学习过程中不会出现剧烈波动,从而减少在最优解附近的震荡。动量Momentum设为0.9,确保模型在更新参数时的连续性和流畅性。网络批次处理图片数设为8,模型迭代次数epoch设为100,可以确保模型有足够的机会对训练数据进行多次学习,从而逐渐收敛到更优的状态。

    为了更直观地了解模型的分割性能,本文基于混淆矩阵来评估分类模型的性能。通过将模型预测的结果与实际的类别标签进行比较,从而可以计算出模型的平均交并比(mIOU)、像素平均值(mPA)和精确率(Precision)等性能指标(式中:Miou为mIOU;Mpa为mPA;Pre为Precision)。指标定义式如下:

    $$ M_{{\mathrm{iou}}} = \frac{1}{{k + 1}}\mathop \sum \limits_{i + 0}^k \frac{{{T_{\mathrm{P}}}}}{{{F_{\mathrm{N}}} + {F_{\mathrm{P}}} + {T_{\mathrm{P}}}}} $$ (6)
    $$ M_{{\mathrm{pa}}} = \frac{1}{{k + 1}}\mathop \sum \limits_{i + 0}^k \frac{{{T_{\mathrm{P}}} + {T_{\mathrm{N}}}}}{{{F_{\mathrm{N}}} + {F_{\mathrm{P}}} + {T_{\mathrm{P}}} + {T_{\mathrm{N}}}}} $$ (7)
    $$ P_{{\mathrm{re}}} = \frac{{{T_{\mathrm{P}}}}}{{{T_{\mathrm{P}}} + {F_{\mathrm{P}}}}} $$ (8)

    式中:k表示目标的类别数量;TP(True Positive)为模型将实际为裂隙的样本正确识别为裂隙;FN(False Negative)为模型将实际为裂隙的样本错误识别为背景;TN(True Negative)为模型将实际为背景的样本正确识别为背景;FP(False Positive)为模型将实际为背景的样本错误识别为裂隙。

    主干网络直接加载官方预训练权重文件,可以有效地防止训练参数过于随机,从而提高模型的泛化能力。MobileNet、ResNet50和VGG16这3种网络都有在大规模数据集上进行预训练的版本,并提供了预训练权重文件。MobileNet是一种轻量级神经网络设计,主要采用深度可分离卷积。这种卷积方式将标准卷积分解为深度卷积和逐点卷积,使得模型在计算效率上有显著提升。ResNet50引入了残差学习的概念,通过使用跳跃连接来克服深层网络训练中的梯度消失问题。本文测试了MobileNet、ResNet50和VGG16作为UNet模型的主干网络在煤岩组合体测试集上的分割性能表现。以mIOU、mPA和Precision作为不同主干网络对比试验的评价指标,结果见表1

    表  1  不同主干网络对模型的影响
    Table  1.  Effect of different backbone on the model
    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    UNet+Mobilenet79.4684.0488.79
    UNet+Resnet5079.2383.8188.67
    UNet+VGG1680.1084.2789.07
    下载: 导出CSV 
    | 显示表格

    表1图8可知,不同主干网络对模型的裂隙分割性能都有所提升,其中以VGG16作为主干网络的网络模型性能最佳,相较于基础的UNet模型,mIOU、mPA和Precision等指标分别提高了0.93%、0.6%和0.94%。

    图  8  不同主干网络mIOU指标变化
    Figure  8.  mIOU metrics of different backbone networks change

    注意力机制增强了模型对煤岩组合体裂隙的识别能力,有效解决了煤岩组合体裂隙颜色与背景颜色接近的问题。该试验在UNet模型加强特征提取网络部分分别加入SE、ECA和ResCBAM三种注意力机制,通过定量分析对三种注意力机制进行比较。使用mIOU、mPA和Precision等指标来评估不同注意力机制模型在测试集的裂隙分割性能,具体结果见表2

    表  2  不同注意力机制对模型的影响
    Table  2.  Effect of different attention mechanisms on model
    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet 79.17 83.67 88.13
    UNet+SE 79.50 83.94 88.73
    UNet+ECA 79.56 84.20 89.06
    UNet+ResCBAM 81.27 86.22 90.32
    下载: 导出CSV 
    | 显示表格

    表2图9可以看出,将SE、ECA和ResCBAM三种注意力机制加入UNet网络中,对比基础UNet网络mIOU指标分别提高了0.33%、0.39%、2.10%,可以看出ResCBAM注意力机制对模型的分割性能提升最大。加入ResCBAM的模型相较于基础UNet模型,在mPA和Precision指标上的提升也有2.55%和2.19%。因此,由通道注意力模块、空间注意力模块以及残差连接组成的ResCBAM注意力机制能更好地提升模型对煤岩组合体裂隙的识别能力。

    图  9  不同注意力机制网络mIOU指标变化
    Figure  9.  Changes in mIOU indicator of different attention mechanism networks

    为直观展示注意力机制对模型的影响,本文通过Grad-CAM[42-43](gradient-weighted class activation map)对输出结果进行可视化。图10为UNet模型引入注意力机制前后的热力图结果对比,颜色越偏近暖色表示与裂隙相关度越高。相较于UNet热力图,加入ResCBAM注意力机制后的模型(R-UNet)热力图对裂隙的关注度更高,进一步证明了ResCBAM注意力机制能有效提升模型对裂隙的识别能力。

    图  10  注意力机制热力图
    Figure  10.  Attention mechanism heatmap

    空洞金字塔能够将图像分解成不同尺度的子图像,通过检测不同尺度下的裂隙特征和结构,实现多尺度特征的有效融合与分析,从而提高图像处理的准确性和鲁棒性。为了验证AC-ASPP模块对网络模型的提升,本文在基础UNet模型中分别加入了SPP、ASPP和AC-ASPP三种空洞金字塔模块在测试集进行定量分析。用mIOU、mPA、Precision等作为不同改进方案的评价指标。

    表3图11可知,将SPP模块引入基础UNet模型,相较于基础的UNet模型,其mIOU、mPA和Precision指标的提升幅度是最小的。ASPP作为SPP的改进版,加入到UNet模型后各项指标都得到了一定程度的提升。当AC-ASPP模块引入基础UNet模型时,由于AC-ASPP对模型参数的大幅度优化,使模型性能得到了进一步提高。因此,加入了AC-ASPP模块的UNet模型相较基础UNet模型,mIOU、mPA和Precision等指标分别提升了4.33%、6.28%和2.33%。

    表  3  不同金字塔模块对模型的影响
    Table  3.  Effect of different pyramid modules on model
    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    UNet+SPP81.9488.6089.61
    UNet+ASPP82.0989.1389.29
    UNet+AC-ASPP83.5089.9590.46
    下载: 导出CSV 
    | 显示表格
    图  11  不同金字塔结构网络mIOU指标变化
    Figure  11.  Changes in mIOU indicators for networks with different pyramid structures

    为验证VGG16主干网络、ResCBAM注意力机制和AC-ASPP模块3种改进方案对VRA-UNet模型的提升效果是否是由单一模块产生的,本文基于UNet设计了3个对比架构:① 在UNet模型中加入VGG16主干网络;② 在UNet模型中加入VGG16主干网络和ResCBAM模块;③ 在UNet模型中加入VGG16主干网络、ResCBAM注意力机制和AC-ASPP模块。

    通过表4可知,在UNet模型中引入VGG16主干网络后,模型的各项评价指标小幅提升;在此基础上,引入ResCBAM注意力机制提升模型对裂隙的关注度,进一步增强了模型的性能;通过在UNet模型中引入VGG16、ResCBAM注意力机制和AC-ASPP模块后的模型,其mIOU、mPA和Precision相较于基准UNet模型分别提升了6.05%、7.13%和3.82%,提升幅度最大;通过表4的结果验证了VRA-UNet模型在煤岩组合体裂隙识别中的卓越性能,是3个模块共同作用的结果。

    表  4  消融试验结果
    Table  4.  Results of ablation experiments
    主干网络
    VGG16
    注意力机制
    ResCBAM
    非对称空洞
    金字塔
    AC-ASPP
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    × × × 79.17 83.67 88.13
    × × 80.10 84.27 89.07
    × 83.53 89.54 90.92
    85.22 90.80 91.95
      注:“√”代表在基础UNet网络模型中引入这个模块;“×”则反之。
    下载: 导出CSV 
    | 显示表格

    为了进一步验证本文模型的裂隙分割性能,将VRA-UNet与UNet、PSPNet、DeeplabV3+、FCN、SegNet语义分割网络模型进行对比试验,模型识别结果如图12所示,试验结果见表5

    图  12  不同模型分割结果
    Figure  12.  Segmentation results of different models
    表  5  不同模型的对比试验
    Table  5.  Experimental comparison of different models
    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    PSPNet68.5277.5177.50
    DeeplabV3+74.4577.9684.55
    FCN78.3583.0486.37
    SegNet78.8283.2787.64
    VRA-UNet85.2290.8091.95
    下载: 导出CSV 
    | 显示表格

    表5图13可知,本文提出的VRA-UNet模型相较于其他网络模型具有更好的综合性能,模型收敛时mIOU、mPA和Precision等评价指标分别达到了85.22%、90.80%和91.95%。与UNet、PSPNet、DeepLabv3+、FCN和SegNet模型相比,本文模型的mIOU分别提高了6.05%、16.7%、10.77%、6.87%和6.4%,mPA分别提高了7.13%、13.29%、12.84%、7.4%和7.53%,Precision则分别提高了3.82%、14.45%、7.4%、5.58%和4.31%。

    图  13  各模型mIOU指标变化
    Figure  13.  Changes in mIOU metrics for each model

    图13可以看出,PSPNet模型在处理煤岩组合体这类复杂目标的图像时,其分割效果较为粗糙。DeeplabV3+模型在裂隙识别上有所改善,但仍然忽略了许多微小裂隙。上述2种网络模型的实现思路是将编码后的特征图直接简单地上采样至原本图像的大小,这不可避免地导致了特征图语义信息的丢失,尤其是特征图边缘识别能力的下降。本文提出的VRA-UNet模型能够较为完整地分割煤岩组合体中的裂隙,相较于UNet模型,VRA-UNet模型所分割出的裂隙更加连贯。这表明本文提出的模型在煤岩组合体CT图像数据集上具有更高的准确度和良好的鲁棒性。

    此外,本文提出的VRA-UNet模型和经典的DeeplabV3+、PSPNet、UNet、FCN、SegNet模型在煤岩组合体数据集上进行图像处理时间计算,各模型处理单张图像所需时间见表6

    表  6  不同模型单张图像处理时间
    Table  6.  Single image processing time for different models
    模型Model时间 Time/ms
    UNet176
    PSPNet132
    DeeplabV3+137
    FCN165
    SegNet171
    VRA-UNet202
    下载: 导出CSV 
    | 显示表格

    表6可知,VRA-UNet模型处理单张煤岩组合体裂隙图片的平均耗时为202 ms,耗时高于其他模型。这是因为该模型针对煤岩组合体复杂的裂隙情况,引入了大量的数据和计算资源,因此需要消耗更多的运算时间。此外,在煤岩组合体的裂隙分割任务中,分割的准确度比分割耗时更为关键,因此,牺牲部分分割速度,选择具有更高分割精度的VRA-UNet模型应是更好的选择。

    VRA-UNet模型在煤岩组合体数据集上的损失函数曲线如图14所示。图中训练损失和验证损失,用于衡量模型预测结果与真实结果之间的差异。在训练过程中,本模型采用余弦退火策略动态调整学习率大小,使得模型能够摆脱局部最优并逐渐朝向全局最优收敛,计算式如下:

    图  14  VRA-UNet模型损失函数曲线
    Figure  14.  Loss function curve of the VRA-UNet model
    $$ {\eta _{\mathrm{t}}} = {\eta _{{\mathrm{min}}}} + \frac{1}{2}\left( {{\eta _{{\mathrm{max}}}} - {\eta _{{\mathrm{min}}}}} \right)\left[ {1 + {\text{cos}}\left( {\frac{{{T_{{\mathrm{cur}}}}}}{{{T_{{\mathrm{max}}}}}}\pi } \right)} \right] $$ (9)

    式中:ηt为当前学习率;ηmin为学习率的最小限制;ηmax为学习率的最大限制;Tcur为当前训练周期的步数;Tmax为学习率调整的周期长度。

    图14可知,在模型训练初期,损失曲线迅速下降,表明模型能够迅速从初始状态中学习到有效特征,这一现象显示了VRA-UNet模型在特征信息保留方面的有效性。随着模型训练的进行,损失函数曲线逐渐趋于稳定,最终达到收敛。在整个训练过程中,训练损失和验证损失之间差距较小,说明模型在训练集和验证集上表现一致,具有良好的泛化能力。

    为了验证VRA-UNet模型在实际应用中的有效性,本研究采用编号为CR38-2的CT切片中的同一张图片,分别通过阈值分割与VRA-UNet进行裂隙识别,不同裂隙分割方法识别到的裂隙结构如图15所示。

    图  15  不同分割方法对比
    Figure  15.  Comparison of different segmentation methods

    图15可以看出,本文模型在煤岩组合体图像的分割中实现了更高的识别精度,且边缘分割更为平滑,有效克服了阈值分割方法中由于煤基质背景颜色与裂缝相近而导致的错误识别问题,以及在阈值分割过程中无法兼顾煤与岩石的阈值设定问题。

    为了进一步验证VRA-UNet方法识别的煤岩组合体裂隙优于阈值分割方法,本文采用ImageJ软件中的分形维数分析法进行评估,对图15进行分析。分形维数的计算式为

    $$ D = - \mathop {\lim }\limits_{\varepsilon \to 0} \frac{{\ln (N(\varepsilon ))}}{{\ln (\varepsilon )}} $$ (10)

    式中:ɛ为盒子的尺寸;N(ɛ)为盒子尺寸为ɛ时包含的盒子数。

    在计算分形维数时,首先对图15中的图像进行二值化处理,然后使用边长为ɛ的正方形格子覆盖孔裂隙区域。接着,通过统计不同格子边长下覆盖孔裂隙所需的总盒子数N(ɛ),计算出分形维数D。最后,通过比较煤岩组合体图像分别经过VRA-UNet分割和阈值分割后的分形维数,便可以评估这两种方法的优劣,如图16表7所示。

    图  16  不同分割方法分形维数对比图
    Figure  16.  Comparison of fractal dimensions using different segmentation methods
    表  7  不同分割方法分形维数
    Table  7.  Fractal dimensions of different segmentation methods
    方法分形维数D
    原始CT1.561
    VRA-UNet1.519
    阈值分割1.441
    下载: 导出CSV 
    | 显示表格

    图16表7可知,原始CT图像、VRA-UNet图像和阈值分割图像的分形维数分别为1.561、1.519和1.441。分形维数值代表裂隙的复杂度,阈值分割图像的分形维数1.441与原始CT图像的1.561相差7.69%,这表明阈值分割方法丢失了不少裂隙细节。而VRA-UNet图像的分形维数与原始CT图像之间的误差仅为2.69%,分形维数的准确率高达97.31%。这表明VRA-UNet图像与原始CT图像基本一致,证明采用VRA-UNet方法建立煤岩组合体三维重构模型是合理有效的。

    煤岩组合体宏观力学行为依赖于微细观裂隙结构,基于煤岩组合体CT切片进行三维重构是一种常用的微细观裂隙结构分析方法。在使用VGStudio等可视化软件处理CT图像时,通常依赖阈值分割原理。然而,煤岩组合体的混合结构使得阈值的精准界定变得困难。为了解决这一问题,本文提出了一种基于VRA-UNet模型的像素级识别方法,该方法通过对切片中的像素进行分类,避免了阈值界定过程中的复杂性和局限性,实现了对煤岩组合体中裂隙与背景更精确的分类。

    传统的三维重构方法通过将CR38-2的CT切片导入VGStudio软件,通过VGStudio软件自带的阈值分割界定出每张CT切片中的裂隙,如图15b所示,然后对界定裂隙的CT切片进行三维重构如图17a所示。本文采用基于VRA-UNet模型对CR38-2的CT切片进行裂隙提取,如图15c所示,然后将提取裂隙的CT切片进行三维重构,如图17b所示。通过VGStudio软件分别将阈值分割法三维重构和VRA-UNet三维重构中的孤立孔隙标注为紫色。

    图  17  裂隙三维重构结果对比
    Figure  17.  Comparison of 3D reconstruction results of fractures

    图17可以看出,阈值分割法三维重构模型因其结果严重依赖阈值的界定,导致其不能完整地提取到煤岩组合体中连通的裂隙结构,从而产生较多的孤立孔隙。基于上述VRA-UNet算法的三维重构,有效保留了煤岩组合体中连续的裂隙断面,使得三维重构结果更加真实可靠。

    1)提出了一种适用于煤岩组合体图像裂隙分割的VRA-UNet网络模型,实现了对煤岩组合体裂隙的精确分割。制作并通过数据增强方法扩充了煤岩组合体数据集,利用ImageJ软件对煤岩组合体数据集进行了人工标注。

    2)通过对VRA-UNet分割试验的分析,该模型展示了良好的泛化性能,即使在具有复杂裂隙的煤岩组合体中也能取得理想的分割效果。该模型在煤岩组合体数据集上mIOU、mPA和Precision指标分别达到了85.22%,90.80%与91.95%。与目前传统的语义分割网络相比,VRA-UNet在煤岩组合体裂隙的分割上取得了更好的效果,特别是在边缘和小目标裂隙的分割上表现出了明显提升。

    3)通过分形维数的方法,证实了VRA-UNet识别到的裂隙效果优于传统的阈值分割方法。采用VRA-UNet模型对煤岩组合体CT切片中的裂隙进行分割处理,并通过VGStudio软件实现了高精度裂隙三维重构,从而获取了煤岩组合体的详细内部裂隙结构信息。通过裂隙三维重构结果对比,证实了VRA-UNet方法的三维重构模型能够更加真实反映出煤岩组合体的裂隙结构特征。

  • 图  1   UNet网络模型结构

    Figure  1.   UNet network model structure

    图  2   VGG16网络模型结构

    Figure  2.   VGG16 network model structure

    图  3   ResCBAM注意力机制

    Figure  3.   ResCBAM attention mechanism

    图  4   AC-ASPP结构

    Figure  4.   AC-ASPP structure

    图  5   VRA-UNet模型结构

    Figure  5.   VRA-UNet model structure

    图  6   煤岩组合体试样

    Figure  6.   Coal-rock combinations sample

    图  7   数据集预处理

    Figure  7.   Dataset preprocessing

    图  8   不同主干网络mIOU指标变化

    Figure  8.   mIOU metrics of different backbone networks change

    图  9   不同注意力机制网络mIOU指标变化

    Figure  9.   Changes in mIOU indicator of different attention mechanism networks

    图  10   注意力机制热力图

    Figure  10.   Attention mechanism heatmap

    图  11   不同金字塔结构网络mIOU指标变化

    Figure  11.   Changes in mIOU indicators for networks with different pyramid structures

    图  12   不同模型分割结果

    Figure  12.   Segmentation results of different models

    图  13   各模型mIOU指标变化

    Figure  13.   Changes in mIOU metrics for each model

    图  14   VRA-UNet模型损失函数曲线

    Figure  14.   Loss function curve of the VRA-UNet model

    图  15   不同分割方法对比

    Figure  15.   Comparison of different segmentation methods

    图  16   不同分割方法分形维数对比图

    Figure  16.   Comparison of fractal dimensions using different segmentation methods

    图  17   裂隙三维重构结果对比

    Figure  17.   Comparison of 3D reconstruction results of fractures

    表  1   不同主干网络对模型的影响

    Table  1   Effect of different backbone on the model

    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    UNet+Mobilenet79.4684.0488.79
    UNet+Resnet5079.2383.8188.67
    UNet+VGG1680.1084.2789.07
    下载: 导出CSV

    表  2   不同注意力机制对模型的影响

    Table  2   Effect of different attention mechanisms on model

    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet 79.17 83.67 88.13
    UNet+SE 79.50 83.94 88.73
    UNet+ECA 79.56 84.20 89.06
    UNet+ResCBAM 81.27 86.22 90.32
    下载: 导出CSV

    表  3   不同金字塔模块对模型的影响

    Table  3   Effect of different pyramid modules on model

    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    UNet+SPP81.9488.6089.61
    UNet+ASPP82.0989.1389.29
    UNet+AC-ASPP83.5089.9590.46
    下载: 导出CSV

    表  4   消融试验结果

    Table  4   Results of ablation experiments

    主干网络
    VGG16
    注意力机制
    ResCBAM
    非对称空洞
    金字塔
    AC-ASPP
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    × × × 79.17 83.67 88.13
    × × 80.10 84.27 89.07
    × 83.53 89.54 90.92
    85.22 90.80 91.95
      注:“√”代表在基础UNet网络模型中引入这个模块;“×”则反之。
    下载: 导出CSV

    表  5   不同模型的对比试验

    Table  5   Experimental comparison of different models

    模型
    Model
    平均交并比
    mIOU
    像素平均值
    mPA
    精确率
    Precision
    UNet79.1783.6788.13
    PSPNet68.5277.5177.50
    DeeplabV3+74.4577.9684.55
    FCN78.3583.0486.37
    SegNet78.8283.2787.64
    VRA-UNet85.2290.8091.95
    下载: 导出CSV

    表  6   不同模型单张图像处理时间

    Table  6   Single image processing time for different models

    模型Model时间 Time/ms
    UNet176
    PSPNet132
    DeeplabV3+137
    FCN165
    SegNet171
    VRA-UNet202
    下载: 导出CSV

    表  7   不同分割方法分形维数

    Table  7   Fractal dimensions of different segmentation methods

    方法分形维数D
    原始CT1.561
    VRA-UNet1.519
    阈值分割1.441
    下载: 导出CSV
  • [1] 程远平,王成浩. 构造煤变形能及在煤与瓦斯突出中的作用[J]. 煤炭学报,2024,49(2):645−663.

    CHENG Yuanping,WANG Chenghao. Deformation energy of tectonic coal and its role in coal and gas outbursts[J]. Journal of China Coal Society,2024,49(2):645−663.

    [2] 陈光波,李谭,杨磊,等. 不同煤岩比例及组合方式的组合体力学特性及破坏机制[J]. 采矿与岩层控制工程学报,2021,3(2):84−94.

    CHEN Guangbo,LI Tan,YANG Lei,et al. Mechanical properties and failure mechanism of combined bodies with different coal-rock ratios and combinations[J]. Journal of Mining and Strata Control Engineering,2021,3(2):84−94.

    [3] 袁亮,王恩元,马衍坤,等. 我国煤岩动力灾害研究进展及面临的科技难题[J]. 煤炭学报,2023,48(5):1825−1845.

    YUAN Liang,WANG Enyuan,MA Yankun,et al. Research progress of coal and rock dynamic disasters and scientific and technological problems in China[J]. Journal of China Coal Society,2023,48(5):1825−1845.

    [4] 赵伟,董虎子,闫志达,等. 深部煤层瓦斯含量分阶赋存规律及其与突出危险的关联[J/OL]. 煤炭学报,1−14[2024−09−25]. https://doi.org/10.13225/j.cnki.jccs.2024.0161.

    ZHAO Wei,DONG Huzi,YAN Zhida,et al. The hierarchical occurrence law of gas content in deep coal seam and its association with outstanding hazards[J/OL]. Journal of China Coal Society,1−14[2024−09−25]. https://doi.org/10.13225/j.cnki.jccs.2024.0161.

    [5] 赵伟,王凯,周爱桃,等. 扩散主控型煤层定义、特征及瓦斯促抽路径分析[J/OL]. 煤炭学报,1−14[2024−09−25]. https://doi.org/10.13225/j.cnki.jccs.WK24.0320.

    ZHAO Wei,WANG Kai,ZHOU Aitao,et al. Definition,characteristics and analysis of gas pumping path of diffusion master control briquette[J/OL]. Journal of China Coal Society,1−14[2024−09−25]. https://doi.org/10.13225/j.cnki.jccs.WK24.0320.

    [6] 李伟,杨康,邓东,等. 考虑孔弹性效应的煤岩微纳米孔隙瓦斯表观渗透率模型及其在瓦斯抽采中的应用[J]. 岩石力学与工程学报,2024,43(3):587−599.

    LI Wei,YANG Kang,DENG Dong,et al. A gas apparent permeability model in coal micro/nano-pores considering the poroelastic effect and its application in gas extraction[J]. Chinese Journal of Rock Mechanics and Engineering,2024,43(3):587−599.

    [7] 陈光波,李谭,张国华,等. 煤岩组合体破坏前能量积聚规律试验研究[J]. 煤炭学报,2021,46(S1):174−186.

    CHEN Guangbo,LI Tan,ZHANG Guohua,et al. Experimental study on energy accumulation law before coal rock combination failure[J]. Journal of China Coal Society,2021,46(S1):174−186.

    [8] 王登科,张平,魏建平,等. CT可视化的受载煤体三维裂隙结构动态演化试验研究[J]. 煤炭学报,2019,44(S2):574−584.

    WANG Dengke,ZHANG Ping,WEI Jianping,et al. Experimental study on dynamic evolution of three-dimensional fracture structure of loaded coal based on CT visualization[J]. Journal of China Coal Society,2019,44(S2):574−584.

    [9] 王登科,房禹,魏建平,等. 基于深度学习的煤岩Micro-CT裂隙智能提取与应用[J]. 煤炭学报,2024,49(8):3439−3452.

    WANG Dengke,FANG Yu,WEI Jianping,et al. Intelligent extraction and application of Micro CT fractures in coal and rock based on deep learning[J]. Journal of China Coal Society,2024,49(8):3439−3452.

    [10] 王刚,陈雪畅,韩冬阳,等. 基于改进Otsu的煤体CT图像阈值分割算法的研究[J]. 煤炭科学技术,2021,49(1):264−271.

    WANG Gang,CHEN Xuechang,HAN Dongyang,et al. Research on threshold segmentation algorithm of coal CT images based on improved Otsu[J]. Coal Science and Technology,2021,49(1):264−271.

    [11] 郝晨光,郭晓阳,邓存宝,等. 基于Bi-PTI模型的CT数字煤岩孔裂隙精准识别及阈值反演[J]. 煤炭学报,2023,48(4):1516−1526.

    HAO Chenguang,GUO Xiaoyang,DENG Cunbao,et al. Precise identification and threshold inversion of pores and fissures in CT digital coal rock based on Bi-PTI model[J]. Journal of China Coal Society,2023,48(4):1516−1526.

    [12] 李国燕,梁家栋,刘毅,等. MFC-DeepLabV3+:一种多特征级联融合裂缝缺陷检测网络模型[J]. 铁道科学与工程学报,2023,20(4):1370−1381.

    LI Guoyan,LIANG Jiadong,LIU Yi,et al. MFC-DeepLabV3+:A multi feature cascade fusion crack defect detection network model[J]. Journal of Railway Science and Engineering,2023,20(4):1370−1381.

    [13] 张云,童亮,来兴平,等. 基于机器视觉的煤尘环境下掘进空间煤岩界面感知与精准识别[J]. 煤炭学报,2024,49(7):3276−3290.

    ZHANG Yun,TONG Liang,LAI Xingping,et al. Perception and precise recognition of coal rock interface in excavation space under coal dust environment based on machine vision[J]. Journal of China Coal Society,2024,49(7):3276−3290.

    [14] 杜锋,王凯,董香栾,等. 基于CT三维重构的煤岩组合体损伤破坏数值模拟研究[J]. 煤炭学报,2021,46(S1):253−262.

    DU Feng,WANG Kai,DONG Xiangluan,et al. Numerical simulation study on damage and failure of coal rock composite based on CT three-dimensional reconstruction[J]. Journal of China Coal Society,2021,46(S1):253−262.

    [15] 闫志蕊,王宏伟,耿毅德. 基于改进DeeplabV3+和迁移学习的煤岩界面图像识别方法[J]. 煤炭科学技术,2023,51(S1):429−439.

    YAN Zhirui,WANG Hongwei,GENG Yide. Coal-rock interface image recognition method based on improved DeeplabV3+ and transfer learning[J]. Coal Science and Technology,2023,51(S1):429−439.

    [16]

    JIN H X,CAO L,KAN X,et al. Coal petrography extraction approach based on multiscale mixed-attention-based residual U-net[J]. Measurement Science and Technology,2022,33(7):075402. doi: 10.1088/1361-6501/ac5439

    [17]

    BOUGOURZI F,DISTANTE C,DORNAIKA F,et al. PDAtt-unet:Pyramid dual-decoder attention unet for covid-19 infection segmentation from CT-scans[J]. Medical Image Analysis,2023,86:102797. doi: 10.1016/j.media.2023.102797

    [18]

    LI B,WU F,LIU S K,et al. CA‐Unet++:An improved structure for medical CT scanning based on the Unet++ Architecture[J]. International Journal of Intelligent Systems,2022,37(11):8814−8832. doi: 10.1002/int.22969

    [19] 李元海,徐晓华,朱鸿鹄,等. 基于计算机视觉的岩石裂隙识别表征与软件研制[J]. 岩土工程学报,2024,46(3):459−469. doi: 10.11779/CJGE20221239

    LI Yuanhai,XU Xiaohua,ZHU Honghu,et al. Identification and characterization of rock fractures based on computer vision and software development[J]. Chinese Journal of Geotechnical Engineering,2024,46(3):459−469. doi: 10.11779/CJGE20221239

    [20]

    ZHAO W,ZHANG H D,YAN Y J,et al. A semantic segmentation algorithm using FCN with combination of BSLIC[J]. Applied Sciences,2018,8(4):500. doi: 10.3390/app8040500

    [21] 王安民,高于超,邹俊超,等. 基于深度学习的煤系页岩孔隙结构定量表征[J]. 煤炭科学技术,2023,51(S2):183−190

    WANG Anmin,GAO Yuchao,ZOU Junchao,et al. Quantitative characterization of pore structure in coal bearing shale based on deep learning[J]. Coal Science and Technology,2023,51(S2):183−190

    [22] 薛东杰,唐麒淳,王傲,等. 煤岩微观相态FCN智能识别与分形重构[J]. 岩石力学与工程学报,2020,39(6):1203−1221.

    XUE Dongjie,TANG Qichun,WANG Ao,et al. FCN-based intelligent identification and fractal reconstruction of pore-fracture network in coal by micro CT scanning[J]. Chinese Journal of Rock Mechanics and Engineering,2020,39(6):1203−1221.

    [23]

    CHEN J H,LI H,PHILIP CHEN C L. Boosting sharpness-aware training with dynamic neighborhood[J]. Pattern Recognition,2024,153:110496. doi: 10.1016/j.patcog.2024.110496

    [24]

    DENG H Y,ZHU R J,QIU X R,et al. Tensor decomposition based attention module for spiking neural networks[J]. Knowledge-Based Systems,2024,295:111780. doi: 10.1016/j.knosys.2024.111780

    [25] 龙丽红,朱宇霆,闫敬文,等. 新型语义分割D-UNet的建筑物提取[J]. 遥感学报,2023,27(11):2593−2602. doi: 10.11834/jrs.20211029

    LONG Lihong,ZHU Yuting,YAN Jingwen,et al. New building extraction method based on semantic segmentation[J]. National Remote Sensing Bulletin,2023,27(11):2593−2602. doi: 10.11834/jrs.20211029

    [26] 赵志宏,何朋,郝子晔. 一种道路裂缝检测的变尺度VS-UNet模型[J]. 湖南大学学报(自然科学版),2024,51(6):63−72.

    ZHAO Zhihong,HE Peng,HAO Ziye. A variable-scale VS-UNet model for road crack detection[J]. Journal of Hunan University (Natural Sciences),2024,51(6):63−72.

    [27] 张伟光,钟靖涛,呼延菊,等. 基于VGG16-UNet语义分割模型的路面龟裂形态提取与量化[J]. 交通运输工程学报,2023,23(2):166−182.

    ZHANG Weiguang,ZHONG Jingtao,HU Yanju,et al. Extraction and quantification of pavement alligator crack morphology based on VGG16-UNet semantic segmentation model[J]. Journal of Traffic and Transportation Engineering,2023,23(2):166−182.

    [28]

    CHILLAKURU P,ANANTHAJOTHI K,DIVYA D. Three stage classification framework with ranking scheme for distracted driver detection using heuristic-assisted strategy[J]. Knowledge-Based Systems,2024,293:111589. doi: 10.1016/j.knosys.2024.111589

    [29]

    YANG J,CHEN Y,YU J L. Convolutional neural network based on the fusion of image classification and segmentation module for weed detection in alfalfa[J]. Pest Management Science,2024,80(6):2751−2760. doi: 10.1002/ps.7979

    [30]

    BAHDANAU D,CHO K,BENGIO Y. Neural machine translation by jointly learning to align and translate[J]. arxiv preprint arxiv, 2014: 1409.0473[2024−09−25]. https://doi.org/10.48550/arXiv.1409.0473

    [31]

    SHI Z Q,JIN N,CHEN D B,et al. A comparison study of semantic segmentation networks for crack detection in construction materials[J]. Construction and Building Materials,2024,414:134950. doi: 10.1016/j.conbuildmat.2024.134950

    [32]

    ZHANG G,YAN H F,ZHANG D Y,et al. Enhancing model performance in detecting lodging areas in wheat fields using UAV RGB Imagery:Considering spatial and temporal variations[J]. Computers and Electronics in Agriculture,2023,214:108297. doi: 10.1016/j.compag.2023.108297

    [33]

    HU J,SHEN L,ALBANIE S,et al. Squeeze-and-excitation networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2020,42(8):2011−2023. doi: 10.1109/TPAMI.2019.2913372

    [34]

    YANG Y K,ZHOU W,JISKANI I M,et al. Extracting unstructured roads for smart Open-Pit mines based on computer vision:Implications for intelligent mining[J]. Expert Systems with Applications,2024,249:123628. doi: 10.1016/j.eswa.2024.123628

    [35]

    SHU H,WANG K W,GUO L F,et al. Automated collection of facial temperatures in dairy cows via improved UNet[J]. Computers and Electronics in Agriculture,2024,220:108614. doi: 10.1016/j.compag.2024.108614

    [36]

    ALI J,ZHENG C H,LYU T,et al. Enhanced bioelectroremediation of heavy metal contaminated groundwater through advancing a self-standing cathode[J]. Water Research,2024,256:121625. doi: 10.1016/j.watres.2024.121625

    [37]

    MALEKMOHAMMADI A,SORYANI M,KOZEGAR E. Mass segmentation in automated breast ultrasound using an enhanced attentive UNet[J]. Expert Systems with Applications,2024,245:123095. doi: 10.1016/j.eswa.2023.123095

    [38]

    KANG S,LI D F,LI B L,et al. Maturity identification and category determination method of broccoli based on semantic segmentation models[J]. Computers and Electronics in Agriculture,2024,217:108633. doi: 10.1016/j.compag.2024.108633

    [39]

    FATMA Ş F,AYDOĞAN S,AKAY D. Investigating the carbon border adjustment mechanism transition process with linguistic summarization method:A situational analysis of exporting countries[J]. Advanced Engineering Informatics,2024,61:102528. doi: 10.1016/j.aei.2024.102528

    [40]

    FERNÁNDEZ J G,MEHRKANOON S. Broad-UNet:Multi-scale feature learning for nowcasting tasks[J]. Neural Networks,2021,144:419−427. doi: 10.1016/j.neunet.2021.08.036

    [41]

    FANG C Y,CHEN H B,LI L,et al. A novel Adaptive Zone-fusion network for precise waxberry semantic segmentation to improve automated-harvesting in a complex orchard environment[J]. Computers and Electronics in Agriculture,2024,221:108937. doi: 10.1016/j.compag.2024.108937

    [42]

    BUI N A,OH Y,LEE I. Oil spill detection and classification through deep learning and tailored data augmentation[J]. International Journal of Applied Earth Observation and Geoinformation,2024,129:103845. doi: 10.1016/j.jag.2024.103845

    [43]

    WANG D K,LI L,ZHANG H T,et al. Intelligent identification of coal fractures using an improvedU-shaped networ[J]. Advances in Geo-Energy Research,2025,15(2):129−142. doi: 10.46690/ager.2025.02.05

图(17)  /  表(7)
计量
  • 文章访问数:  84
  • HTML全文浏览量:  13
  • PDF下载量:  36
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-10-12
  • 网络出版日期:  2025-02-18
  • 刊出日期:  2025-02-24

目录

/

返回文章
返回