Construction and application of knowledge mapping of carbon emission governance technologies for coal mining and utilization
-
摘要:
煤炭是能源消费降碳的主力军,煤炭开发利用过程中产生的碳排放占全国碳排放总量的60%~70%,是我国完成碳减排任务的关键所在。煤炭开采利用碳排放治理技术知识图谱构建与应用聚焦煤炭开采利用碳排放治理技术,系统梳理出相关治理技术知识,在此基础上构建知识图谱,挖掘出不同技术间的内在联系、适用条件、实施效果及减排路径,为相关人员获取碳排放治理技术领域前沿知识提供支撑,推动煤炭行业向绿色低碳方向转型。一是广泛收集煤炭减排技术相关的专业书籍、术语字典、权威研究报告、中国知网核心期刊文献以及各类标准规范等,采用自底向上和自顶向下的混合构建法构建煤炭开采利用碳排放治理技术领域概念知识模型;二是运用BIO标注策略,并应用BERT+CRF(Bidirectional Encoder Representations from Transformers & Conditional Random Fields)模型,识别该领域实体;三是在实体识别基础上,应用BiLSTM–Attention模型进一步挖掘实体间关系,实现关系抽取;四是采用实体消歧和共指消解技术进行知识融合,消除数据中的矛盾与冗余信息;五是通过Neo4j图数据库存储实体与关系,基于上述结构化的方法与模型,由此完成煤炭开采利用碳排放治理技术领域知识图谱的构建。构建了涵盖排放特征、开采方式、利用方式和减碳技术四大类的煤炭开采利用碳排放治理技术领域知识概念模型,又将这四大类知识概念细分为12个子类,30个细类,形成了完整的概念分类体系。定义了10类命名实体及6种关系,基于提出的知识图谱构建组合方法与创新模型,抽取出
12631 个节点与32209 个实体间关系,揭示了碳排放技术与排放特征、开采方式、利用方式之间的复杂关联,并根据已构建的煤炭开采利用碳排放治理技术领域的知识图谱,支持矿山企业选取相适配的减碳技术路径。随着煤炭行业低碳发展的场景拓展、数据的积累以及人工智能和大模型的发展,本研究将在多模态数据融合的基础上,优化图谱的构建方法,拓展图谱的应用范围,提高技术路径推荐的精准度。Abstract:Coal is the main force of carbon reduction in energy consumption, and the carbon emissions generated in the process of coal exploitation and utilization account for about 60%−70% of the total national carbon emissions, which is the key to accomplishing the carbon reduction task in China. The construction and application of knowledge mapping of coal mining and utilization carbon emission management technology focuses on coal mining and utilization carbon emission management technology, systematically sorts out the knowledge of related management technology, and constructs knowledge mapping on the basis of which, to excavate the intrinsic connection, applicable conditions, implementation effect and emission reduction path of different technologies, to provide support for the relevant personnel to obtain the cutting-edge knowledge in the field of carbon emission management technology, and to push forward the transition of coal industry to the green and low-carbon direction. Transformation in the direction of green and low-carbon. First, we extensively collect professional books, terminology dictionaries, authoritative research reports, core journals on China Knowledge Network, and various standards and norms related to coal emission reduction technologies, and construct a conceptual knowledge model of coal mining and utilization of carbon emission management technologies by adopting a hybrid construction method of bottom-up and top-down; second, we use the BIO annotation strategy and apply the BERT+CRF (Bidirectional Encoder Representations from Transformer Representations) method to construct a conceptual knowledge model of coal mining and utilization of carbon emission management technologies. Encoder Representations from Transformers & Conditional Random Fields) model to recognize the entities in this domain; third, on the basis of entity recognition, the BiLSTM–Attention model is applied to further mine the relationships between entities and realize relationship extraction; fourth, entity The fourth is to use entity disambiguation and co-reference disambiguation techniques for knowledge fusion, eliminating contradictions and redundant information in the data; the fifth is to store the entities and relationships through the Neo4j graph database, based on the above structured methods and models, thus completing the construction of the knowledge map of the field of coal mining and utilization of carbon emission management technology. A conceptual model of knowledge in the field of coal mining and utilization carbon emission management technology covering 4 major categories of emission characteristics, mining methods, utilization methods and carbon reduction technologies is constructed, and the knowledge concepts of these 4 major categories are subdivided into 12 subclasses and 30 subclasses, forming a complete conceptual classification system. Ten types of named entities and six kinds of relationships are defined, and based on the proposed knowledge graph construction combination method and innovation model, 12 631 nodes and 32 209 inter-entity relationships are extracted, which reveals the complex association between carbon emission technologies and emission characteristics, mining methods, utilization methods, and based on the constructed knowledge graph in the field of coal mining and utilization of carbon emission governance technology, it can support the mining enterprises to select the appropriate carbon reduction technology path. The knowledge graph in the field of carbon emission management technology has been constructed to support mining enterprises in selecting appropriate carbon reduction technology paths. With the expansion of low-carbon development scenarios in the coal industry, the accumulation of data, and the development of artificial intelligence and big models, this study will optimize the construction method of the atlas on the basis of multimodal data fusion, expand the application scope of the atlas, and improve the accuracy of the recommendation of technology paths.
-
0. 引 言
继我国提出2030年前碳达峰,2060年前碳中和的目标后,并在气候雄心峰会上进一步宣布:“到2030年,中国单位国内生产总值二氧化碳排放将比2005年下降65%以上,非化石能源占一次能源消费比例将达到25%左右”[1–2]。目前距离2030年碳达峰不到5 a时间,同时我国碳达峰到碳中和间隔时间只有30 a,远少于西方发达国家[3]。依据国家统计局发布的数据,2024年我国煤炭产量创历史新高,约为47.6亿t,能源生产结构中煤炭占66.6%,煤炭消费占一次能源消费总量的比例为55.3%[4],煤炭依然是我国能源结构的主体。相关研究表明,化石燃料燃烧是碳排放的主要来源,贡献了碳排放总量的90%,而煤炭作为碳排放强度最高的化石能源,从开采、运输、加工到最终利用等环节,均会产生大量的碳排放,葛世荣院士等在《能源强国目标下煤炭安全保供及高效降碳效力研究》中指出:“煤炭是能源消费降碳的主力军,煤炭开发利用过程中产生的碳排放占全国碳排放总量的60%~70%,是我国完成碳减排任务的关键所在[5]”,如此庞大的碳排放量,给我国实现2030年前碳达峰、2060年前碳中和的目标带来了巨大挑战。为应对这一挑战,有关专家提出了煤炭工业数字化智能化绿色化三化协同发展的理念与架构,明确了煤炭新质生产力的核心内涵[6–9]。通过研发构建煤炭行业知识图谱与智能决策管控技术体系,深度挖掘煤炭产业上下游各业务场景的关联关系与价值,为煤炭生产利用全流程的自主决策与智能控制奠定基础,进一步赋能煤炭产业深度转型,实现数智化关键技术引领下的低碳发展模式创新[10–14],为“双碳”目标的实现提供新的技术路径。
知识图谱在碳排放领域的应用已得到广泛关注,国内外学者在这一领域进行了大量探索。如王良萸等[15]提出了碳交易领域的知识图谱构建方法,该方法为解决碳交易领域数据集成问题,通过整合碳交易相关的政策、市场机制和交易行为,将获取的知识转化为完整的碳交易领域知识图谱,并可以从碳交易领域的海量数据中检索出有用信息。吴涛等[16]以羊毛混纺面料生产为研究对象,采用流程挖掘和图谱等工业智能技术,提出一种面料生产的碳图谱建模、碳排放量化和应用方法,该方法能够通过订单信息作为线索,准确计算每个工序的碳排放量,为工业生产中的碳排放监测和优化提供了新的技术手段[17–18]。许琦等[19]的研究则着眼于知识图谱在工业领域碳排放评估和管理中的应用,提出了一种整合与分析领域相关知识的框架,通过建立全面的碳排放知识图谱,帮助企业全面评估其碳排放情况。
知识图谱在煤炭领域的研究与应用目前多集中在安全、设备维护和故障识别等领域[20–22]。刘江等[23]为解决选煤面临的生产技术知识表达复杂、信息存储分散和数据共享不足等问题,建立选煤领域法规标准的知识图谱,并基于图谱构建出选煤法规标准的智能培训平台。刘鹏等[24]将知识图谱技术初步引入煤矿安全领域,构建了煤矿安全知识图谱,为煤矿安全知识图谱构建及智能查询做了初步有益探索。曹现刚等[25]构建了煤矿装备维护知识图谱,探讨了其在智能语义搜索、智能问答及可视化决策支持等方面的应用,为煤矿装备智能化动态管理的实现提供了有力支持。蔡安江等[26]构建了煤矿综采设备故障知识图谱,为大规模、多域综采设备故障数据的有效分析、管理及应用提供支持。罗香玉等[27]从煤矿顶板灾害防治领域知识建模、知识抽取和语料库构建与知识存储3个方面,研究了煤矿顶板灾害防治知识图谱构建方法。
目前,知识图谱技术在知识抽取、融合、表示与推理等方面都取得了显著进展。付燕等[28]提出了煤矿井下不安全行为的命名实体识别方法,并结合井下不安全行为领域知识,采用BIO标注策略构建了一个包含8类实体类别、
2359 条样本的煤矿井下不安全行为语料库,并取得了较好的效果。在命名实体识别方面,QIN等[29]认为预训练模型BERT(Bidirectional Encoder Representations from Transformer)能根据当前词的上下文环境动态生成词向量,从而更好地表征词向量,并在NLP多个任务中都取得了显著的成绩。JACOB等[30]使用长短期记忆网络(Bi-directional Long Short-Term Memory, BiLSTM)提取语义信息,并使用条件随机场CRF(Conditional Random Field, CRF)来解码并构建出经典的BiLSTM–CRF架构用以识别实体,提高了识别效果。郭军成等[31]使用BERT–BiLSTM–CRF模型从中文简历中提取特定的实体,最终模型在中文简历数据集上的F1达到了97%。综上可知,知识图谱在碳排放以及煤炭的安全、设备维护和故障识别领域已经积累了一定的研究成果,然而鲜有学者对煤炭领域碳排放治理技术知识图谱进行研究,针对煤炭领域碳排放治理技术知识图谱的研究仍处于空白。
本文研究内容的创新性主要表现在以下3个方面:
一是在煤炭开采利用碳排放治理技术领域知识建模方面,笔者基于煤炭开采利用等关键流程环节,运用知识图谱的混合构建方法,聚焦碳排放治理,系统梳理与碳排放治理相关的技术体系,构建了煤炭开采利用碳排放治理技术领域知识模型,涵盖排放特征、开采方式、利用方式和减碳技术4个大类领域知识,根据煤炭开采利用碳排放治理技术领域概念之间的逻辑关系,将上述四大类中的排放特征类分为煤层气逸散、能耗排放等3个子类,开采方式类分为先抽后采、随抽随采等3个子类,利用方式类分为煤发电、煤供热等4个子类,减碳技术类分为煤炭开采减碳技术和煤炭利用减碳技术2个子类,共12个子类;再将上述12个子类细分为运输排放、斜井开拓技术、二次再热超超临界发电技术等共30个细类。
笔者首次提出并创建了煤炭开采利用碳排放治理技术领域概念分类体系,并基于该体系开创性构建出其概念之间的关系类型,即将煤炭开采利用碳排放治理技术领域概念之间的关系定义为决定、选择、降低、包含、转换和适用6种关系类型,为后续的实体识别和关系抽取工作奠定了坚实基础。
二是在命名实体识别与关系抽取方面,笔者采用命名实体识别任务中常用的序列标注方法BIO[28]标注策略逐字进行标注,并给出了包括煤层气排放(Coalbed Methane Emissions,CME)等在内的10类命名实体类别、实体描述及相关示例,这些工作为基于BERT+CRF的命名实体识别模型高效完成该领域的命名实体识别任务提供了可靠依据。接着在完成命名实体识别的基础上,进一步识别文本中不同实体之间包括“瓦斯逸散决定随采随抽”等6种主要关系,以三元组形式进行表示,并给出该领域所定义的实体间关系类别及示例,深度挖掘出碳排放技术方案与碳排放特征、开采方式、利用方式之间的关联,有力支撑了BiLSTM–Attention模型解决关系抽取问题。
三是在煤炭开采利用碳排放治理技术领域知识图谱的可视化与减排技术方案路径应用方面,基于上述知识图谱构建方法与模型,抽取出与煤炭开采利用碳排放治理技术领域的相关文本知识,构建了煤炭开采利用碳排放治理技术领域的可视化知识图谱。企业面临减排任务时,可借助可视化知识图谱,通过图数据库Neo4j执行查询语句,精准检索与当前矿山实际情况相匹配的减排技术,查询涵盖煤炭开采利用碳排放治理技术推荐、技术适用条件及其实施效果等关键信息,通过上述方式,能够切实有效地为矿山碳排放治理提供技术推荐,助力企业选取最佳减碳技术路径和相关决策支持。
笔者将知识图谱理论与技术引入煤炭开采利用环节碳排放治理技术领域,清晰定义相关实体类别与关系类型,成功构建出该领域的知识图谱,并依此设计出减碳技术推荐应用路径,填补了该领域的研究空白,为煤炭产业低碳转型与可持续发展提供了全新的理论指引与实践路径。
1. 煤炭开采利用碳排放治理技术领域知识建模
本体是特定领域中一系列概念及其相互之间关系的形式化表达[16]。概念是实体的抽象表示,用于表示实体的类型。煤炭开采利用碳排放治理技术知识建模的任务是明确该领域的概念分类和关系类型,从而确定知识图谱中包括哪些实体类型和实体对关系类型,为知识抽取奠定基础。知识图谱的构建技术主要分为3种类型,分别是自底向上法[29]、自顶向下法以及混合构建法[30]。下面结合本研究命题对这3种方法进行简要综述,见表1。
表 1 知识图谱的构建技术方法综述Table 1. Overview of technical approaches to the construction of knowledge graphs构建方法 特点 适用场景 自底
向上法从具体的数据实例出发,通过对数据进行分析、抽取,逐步识别出实体、关系和属性等,然后将这些知识进行整合,构建出知识图谱的上层概念和结构 适用于领域知识分散、难以预先确定架构的场景,如通用知识图谱的构建。该方法在需快速迭代扩展的场景中表现出色,如电商商品知识图谱的持续更新便是典型应用 自顶
向下法首先定义好知识图谱的顶层概念、框架和规则,包括本体结构、实体类型、关系类型等,然后根据这些预设的框架,从数据源中抽取具体的实体和关系等信息,填充到知识图谱中 适用于领域知识结构清晰,存在明确行业标准或规范的场景,如构建金融领域的知识图谱。此外,在对知识图谱质量和一致性要求极高的场景,如医疗知识图谱构建中,自顶向下法可有效保障知识准确性与一致性 混合
构建法结合了自底向上和自顶向下两种方法的优点,在构建知识图谱时,既利用现有的领域知识和本体框架进行顶层设计,又从实际数据中挖掘和发现新的知识,不断对知识图谱进行完善和扩展 适用于构建大型复杂领域的知识图谱中,其通过自顶向下确定总体框架,自底向上填充各领域数据,能发挥其整合优势,如构建智慧城市知识图谱。其次,适用于整合已有知识资源与新增数据的场景,如历史文化知识图谱构建,该方法可实现知识图谱的持续完善 因此,本文拟采用混合构建法进行煤炭开采利用碳排放治理技术领域的知识建模。
1.1 煤炭开采利用碳排放治理技术领域的概念分类
笔者将煤炭开采利用碳排放治理技术领域的概念分为排放特征类、开采方式类、利用方式类和减碳技术类如图1所示。排放特征类是矿山不同地质对应的不同体积分数的瓦斯类别与煤层气的构成特征,以及煤炭开采利用过程中设备的能耗排放(如:运输排放、采掘设备排放、通风设备排放和提升设备排放)和煤炭利用中发电供热的煤燃烧排放;开采方式类是不同煤层地质构造情况相对应的瓦斯开采技术分类;利用方式类是已经开采出的煤炭加工转换的途径,不同的途径和方式决定了碳排放量和其构成比例;减碳技术类是针对煤炭开采和利用2个生命周期中的关键环节对应的减碳技术方法。排放特征类可分为煤层气逸散、能耗排放、煤燃烧排放3个子类;开采方式类可分为先抽后采、随采随抽、先采后抽3个子类;利用方式类可分为煤发电、煤供热、煤炼焦、煤制气和煤制品加工5个子类;减碳技术可分为煤炭开采减碳技术和煤炭利用减碳技术2个子类。
1.2 煤炭开采利用碳排放治理技术领域的关系类型
笔者将煤炭开采利用碳排放治理技术领域概念之间的关系定义为决定、选择、降低、包含、转换和适用,关联排放特征类、开采方式类、利用方式类和减碳技术方案类概念。排放特征类概念与开采方式类概念之间的关系为“决定”,即不同矿井排放特征主要指排放源的构成决定了采用怎样的开采方式;开采方式类概念、利用方式类概念与煤炭减碳技术之间的关系为“选择”,即不同的开采方式和利用方式会优先选择不同的减碳技术;煤炭开采减碳技术、煤炭利用减碳技术与排放特征类概念之间的关系为“降低”,即实施煤炭开采减碳技术可以降低甲烷逸散,实施煤炭利用的减碳技术会降低碳排放及能耗排放;减碳技术类概念与煤炭利用减碳技术及煤炭开采减碳技术之间的关系为“包含”,即某个实体作为“整体”,包含一个或包含多个其他实体;利用方式类概念与排放特征类概念之间的关系为“转换”,即煤炭利用过程及方式与其产生的煤燃烧排放之间的关系为“转换”;煤炭减碳技术类概念与其适合条件及实施效果之间的关系为“适用”,如图2所示。
1.3 数据来源
通用领域知识图谱数据来源较为宽泛,覆盖了百科全书、开放数据库、网页数据等各类信息,粒度较大。相比之下,煤炭开采利用碳排放治理技术知识图谱的构建则要求数据具有更高的准确性和规范性,数据粒度较小,且多来自煤炭产业专业领域的参考书籍、研究报告、专业文献、标准规范等渠道,表2为具体的构建煤炭开采利用碳排放治理技术领域知识图谱的数据来源。
表 2 煤炭开采利用碳排放治理技术知识数据来源Table 2. Sources of data on technical knowledge on carbon management for coal mining and utilization数据来源 具体名称 来源1 参考书籍 《煤炭碳中和战略与技术路径》《煤矿绿色开采技术》《煤矿开采技术》《煤炭利用过程中的节能技术》《清洁煤电近零排放技术与应用》《炼焦工业碳减排技术与途径》等 来源2 研究报告 煤矿生产记录与能耗分析报告、来自矿山生产过程中的能源消耗数据、设备运行记录报告等、环境监控数据包括空气质量监测、温湿度数据、粉尘排放等报告等 来源3 专业文献 《煤炭工业数字智能绿色三化协同模式与新质生产力建设路径》《“双碳”目标下CCUS在引领煤炭行业低碳转型过程中的作用》《“双碳”背景下煤炭安全区间与绿色低碳技术路径》《“双碳”战略中煤气共采技术发展路径思考》《煤化工工艺中二氧化碳减排技术的应用研究》《煤炭地下气化碳减排技术研究进展与未来探索》《煤矿绿色开采20年研究及进展》《我国煤矿绿色开采与生态修复技术发展现状及展望》等 来源4 标准规范 《数据编码–井工煤矿数据分类及编码规范 第3部分:生产类》《温室气体排放核算与报告要求 第28部分:矿山企业》《智能化矿山数据融合共享煤矿碳排放数据应用规范》等矿山行业碳排放标准、碳排放核算规范等 2. 煤炭开采利用碳排放治理技术领域知识图谱构建步骤
2.1 数据预处理
本文数据抽取的对象主要为煤炭碳排放领域的书籍、研究报告、文献和标准规范,将这些资料统一转换为文本格式后需对其进行预处理,主要包括文本清洗和删除停用词,从而方便后续的抽取工作。
文本清洗是数据预处理的关键步骤,首先将搜集的书籍、研究报告、文献及标准文件转换为统一的文本格式。对于书籍,去除封面、目录、版权声明、致谢、索引等非正文内容,仅保留主体文本。对于报告和文献,删去封面信息、摘要、参考文献、附录等辅助性内容,仅保留核心数据和分析部分。对于标准文件,删除首页的标准编号、发布机构、发布日期等信息,同时去除前言、目录、规范性引用文件,以及附录中的图示、示例表格等补充性内容,以保留核心条文内容。此外,在文本清洗过程中,还需删除停用词,如“的”“吗”“吧”等,这些词虽频繁出现,但对文本核心信息贡献有限。由于手动处理工作量大,笔者采用Python脚本自动清理数据,并借助哈工大停用词表进行停用词筛选。
2.2 基于BERT+CRF的命名实体识别
本文实体识别任务采用基于BERT+CRF的命名实体识别模型,该模型可以充分利用BERT在理解文本上下文方面的优势,同时借助CRF进行序列标注,从而有效地完成煤炭开采利用碳排放治理技术领域命名实体识别。
笔者采用命名实体识别任务中常用的序列标注方法BIO[28]标注策略逐字进行标注,其中B(Begin)表示实体的起始位置,I(Inside)表示实体的中间或结尾位置,O(Outside)表示非实体。根据上述实体类别定义,B–Label表示煤炭开采利用碳排放治理技术领域实体的第1个字符,I–Label表示煤炭开采利用碳排放治理技术领域实体中间或结尾字符,O表示其他非实体字符。标注工具采用label-studio(https://labelstud.io),通过人工标注得到煤炭开采利用碳排放治理技术领域实体识别语料库,见表3。
表 3 命名实体类别及示例Table 3. Named entity categories and examples实体类别 实体描述 实体示例 开始标签 中间或结尾
标签煤层气排放
(Coalbed Methane Emissions, CME)描述煤层气碳排放的主要特征与构成 瓦斯(甲烷)(80%~98% )、二氧化碳(2%~20%) B–CME I–CME 能耗排放
(Energy Consumption and Emissions, ECE)在煤炭开采利用过程中,涉及不同的技术与设备以及消耗的不同的能源类型,及其能耗热值与排放因子等排放要素 煤、电、天然气、汽油、醇基燃料、煤炭碳排放因子、天然气碳排放因子、电力碳排放因子 B–ECE I–ECE 开采方式
(Mining Pattern, MP)描述基于瓦斯排放特征的开采模式和技术 先采后抽、随采随抽、先抽后采等 B–MP I–MP 利用方式
(Utilization Pattern, UP)利用方式描述开采后转换加工过程中的利用方式,主要涵盖发电、供热、炼焦等环节,导致因煤燃烧或加工过程的废弃物排放产生的碳排放 煤发电、煤供热、煤炼焦、煤制气等 B–UP I–UP 减碳开采技术
(Carbon Reduction Mining Technology, CRMT)煤炭减碳开采技术是整合优化开采工艺、清洁开采技术、伴生资源利用等以降低煤炭开采碳排放的技术体系 斜井开拓、沿空掘巷、低品位热能利用、顺层钻孔抽采、压裂抽采、采空区埋管等 B–CRMT I–CRMT 减碳开采技术适用条件
(Carbon Reduction Mining Technology Condition, CRMT–C)描述煤炭开采减碳技术方案的适用的场景及其参数 本层抽采、高透气性煤层、煤层群、单一特厚高瓦斯煤层、邻近层等 B–CRMT–C I–CRMT–C 减碳开采技术实施效果
(Carbon Reduction Mining Technology
Effect, CRMT–E)煤炭开发利用碳减排方案实施效果体现在降碳、提效、环保及满足技术经济与政策要求等方面的实际成果 推广范围、抽采量稳定性、巷道工程量、评价等级等 B–CRMT–E I–CRMT–E 减碳利用技术
(Carbon Reduction and Utilization
Technologies, CRUT)煤炭利用减碳技术是通过不同的煤炭加工转换的途径和方式以达成降低碳排放目标的一系列技术集合 二次再热超超临界发电技术、高效燃烧器技术、捣固炼焦技术、煤催化气化技术、煤加氢气化技术等 B–CRUT I–CRUT 减碳利用技术适用条件
(Carbon Reduction and Utilization
Technologies Condition, CRUT–C)煤炭利用减碳技术的适用条件受煤炭品质、项目规模和环保政策等因素综合制约 煤种特性、灰分和硫分含量、大型燃煤发电厂、民用煤炭取暖、城市集中供暖、与其他配套技术兼容性等 B–CRUT–C I–CRUT–C 减碳利用技术实施效果
(Carbon Reduction and Utilization Technologies Effect, CRUT–E)煤炭利用碳减排方案实施效果体现在降碳、提效、环保及满足技术经济与政策要求等方面的实际成果 推广范围、工程量发电效率、评价等级等 B–CRUT–E I–CRUT–E 下面将详细介绍BERT+CRF模型在进行煤炭开采利用碳排放治理技术领域实体识别中的应用过程。
2.2.1 BERT模型应用
与传统的基于单向模型不同,BERT通过双向编码(即同时考虑词汇前后的上下文),对文本中的实体类型进行精准识别。例如,对于文本“煤层气回采技术在地下煤矿的应用”,BERT能够理解“煤层气回采技术”是减碳技术,而“地下煤矿”是煤矿类型。
首先使用jieba(用于中文文本分词的Python库,提供了多种分词模式和功能,适用于文本分析、搜索引擎等场景)进行分词,对文本执行分词,得到词序列。例如文本“采用本层抽采与常规抽采相比抽采量较稳定。”经分词后形成词序列[“采用”、“本层抽采”、“与”“常规抽采”、“相比”、“抽采量较稳定”“。”]传递给BERT模型。BERT模型输入序列是一个包含$n$个词汇的序列$ X = ({x_1},{x_2}, \cdots ,{x_n}) $,其中,每个${x_i}$为输入的词汇。模型通过双向Transformer架构对输入序列进行编码。对于每个${x_i}$,BERT产生一个上下文相关的向量表示${\boldsymbol{H }}= ({h_1},{h_2},\cdots ,{h_n}){h_i} \in {R^P}$,其中,$H$为BERT计算出的隐藏层输出,是一个向量序列,对应于输入序列的每个词汇;${h_i}$为输入词汇${x_i}$在BERT编码后的上下文相关表示向量,包含了该词汇的语义信息;$P$为BERT隐藏层的维度,向量${\boldsymbol{H}}$传递给后续的CRF层。
2.2.2 CRF层模型应用
在煤炭开采利用碳排放治理技术知识图谱的实体识别中,实体之间存在依赖关系,减排技术实体和减排效果相关,如“本层抽采”和“抽采量较稳定”这两个实体可能在一句话中成对出现。CRF通过转移矩阵对这些依赖关系建模,从而优化标签预测。CRF能够根据BERT输出的标签得分以及标签之间的转移关系,选择最优的标签序列。
为了捕捉标签之间的依赖关系,CRF层接收BERT的输出${\boldsymbol{H}}$,BERT的输出是“语义向量”,但不能直接用来做预测。需通过一层线性变换得到一个“每个标签的得分”。将${\boldsymbol{H}}$映射到一个标签空间,假设标签集合为k,线性变换为
$$ {e_i} = {\boldsymbol{W}} {h_i} + b \in {R^k} $$ (1) 式中:${e_i}$为第$i$个字被打上每一个标签的打分;${\boldsymbol{W}}$为线性层的权重矩阵;$ {h_i} $为第$i$个字的BERT表示向量;$b$为偏置项。
设$A \in {R^{(K + 2) (K + 2)}}$为标签之间的转移矩阵,CRF层的目标是计算得到最大化给定输入${\boldsymbol{H}}$时,正确标签序列$y$的概率。对于一个输入序列${\boldsymbol{H}} = ({h_1},{h_2},\cdots ,{h_n})$和标签序列$y = ({y_1},{y_2}, \cdots ,{y_n})$,CRF的得分函数定义为
$$ s(H,y) = \sum\limits_{i = 1}^{n - 1} {{A_{{y_i},{y_{i + 1}}}}} + \sum\limits_{i = 1}^n {{e_i}} ({y_i}) $$ (2) 式中:${A_{{y_i},{y_{i + 1}}}}$为标签${y_i}$到${y_{i + 1}}$的转移分数,表示标签之间的依赖关系;$ {e_i}({y_i}) $为BERT输出的标签分数,表示词汇${x_i}$属于标签${y_i}$的得分。
本文的标签集$K$=[O, B–CME,I–CME,B–ECE,I–ECE,B–MP,I–MP,B–UP,I–UP,B–CRMT,I–CRMT,B–CRMT–C,I–CRMT–C,B–CRMT–E,I–CRMT–E,B–CRUT,I–CRUT,B–CRUT–C,I–CRUT–C,B–CRUT–E,I–CRUT–E],共21种标签。假设输入文本X为 [采用本层抽采与常规抽采相比抽采量较稳定],其预测标签序列y可能为[O,O,B–CRMT–C,I–CRMT–C,I–CRMT–C,I–CRMT–C,O,B–CRMT–C,I–CRMT–C,I–CRMT–C,I–CRMT–C,O,O,B–CRMT–E,I–CRMT–E,I–CRMT–E,I–CRMT–E,I–CRMT–E,I–CRMT–E,O]。
2.2.3 训练与推理过程
在训练过程中,BERT模型的参数和CRF层的参数需要联合优化。通过反向传播,模型能够根据给定的标签序列和实际标签序列之间的差异,调整权重,使得对数概率最大化[32–34]。
对于给定输入序列$X$和标签序列$y$的条件概率为
$$ p(y\mid X) = \frac{{{{\mathrm{e}}^{s(X,y)}}}}{{\displaystyle\sum\limits_{y' \in {Y_X}} {{{\mathrm{e}}^{s(X,y')}}} }} $$ (3) 其中,$s(X,y)$为标签序列$y$的得分;${Y_X}$为所有可能的标签序列集合。最后通过Viterbi算法,计算X最可能的标签序列。
2.3 基于BiLSTM Attention的实体间关系抽取
实体间关系抽取是在命名实体识别的基础上,进一步识别文本中不同实体之间的关系,关系抽取模型以已识别出的实体对和句子文本作为输入,通过对句子进行分类,输出对应的关系标签。最后将实体关系表示为三元组形式,即<实体1,关系,实体2>形式[35]。本研究中所定义的实体间关系类别见表4。
表 4 实体间关系类别及示例Table 4. Categories and examples of inter-entity relationships关系类别 关系描述 关系示例 决定 描述不同矿井排放特征,主要指排放源的构成决定了采用怎样的开采方式 瓦斯逸散–随采随抽等 选择 描述不同的开采方式会优先选择不同的减碳技术 先抽后采–巷道穿层钻孔抽采技术、随采随抽–高抽巷抽采技术、先采后抽–采空区埋管抽采技术等 适用 描述煤炭开采利用减碳技术与其适合条件及实施效果之间的关系 压裂抽采–高透气性煤层、高抽巷抽采 –巷道工程量大等 降低 描述煤炭开采和利用环节的减碳技术方案与碳排放及能耗排放之间的关系 超超临界循环流化床锅炉科技–机组二次再热超超临界发电技术–二氧化碳排放、高效燃烧器技术–能耗排放等 包含 描述一个实体包含其他实体的关系,表示某个实体作为“整体”,包含一个或包含多个其他实体 煤炭减碳技术–煤炭开采减碳技术、煤炭减碳技术–煤炭利用减碳技术、低品位热源发电技术–有机朗肯循环发电等 转换 描述煤炭利用过程及方式与其产生的排放物之间的关系 煤发电–二氧化碳排放、煤发热–煤燃烧排放等 根据上述关系类型将原始数据标注成[“<e1>有机朗肯循环发电</e1>是<e2>低品位热源发电技术<e2>的一种”包含(e2, e1)]这种结构[36]。头实体由<e1>和</e1>标注,尾实体由<e2>和</e2>标注,两实体间的关系(句子标签)通过“包含(e2, e1)”标注。
笔者采用BiLSTM–Attention模型解决关系抽取问题,BiLSTM能够同时从前向和反向对输入序列进行建模,捕捉文本中的上下文信息,尤其是长距离的依赖关系[37]。对于关系抽取任务,它解决了两个关键问题。一是捕捉上下文关系,在煤炭开采与利用碳排放技术领域,许多关系存在较长的上下文依赖。例如,“煤炭开采减碳技术”与“斜井开拓技术”关系的确定需要联系上下文[38–39],BiLSTM通过双向建模能够有效捕捉前后文信息,提取出完整的语义关系。二是长距离依赖,煤炭开采与碳排放的治理过程中,相关实体(如“煤层气减排技术”和“矿井开拓系统”)的关系可能跨越多个句子[40],BiLSTM的长期记忆能力使得模型能够记住这些重要信息,并正确地识别其中的关系。该模型包含5个层:输入层、嵌入层、LSTM层、注意力层和输出层,如图3所示。
基于该模型抽取关系的具体步骤如下:
1)定义关系识别任务公式符号
实体关系三元组为π$ = (h;r;t)\mid h,t \in E;r \in R$,其中,$E$和$R$分别为实体集和关系集;三元组π为实体对$(h;t)$与其之间的关系r,句子设为$ S = \{ {w_{_1}},{w_2},\cdots , {w_n}\} $;$ {w_i} $为句子中第$i$个词。目标是在给定一个句子$S$和一个预定义的关系集$R$中,在实体识别的基础上进行关系抽取,从句子$S$中识别出正确的三元组π。例如,在煤炭开采利用碳排放治理技术知识图谱中,$S$={“先抽后采”“一般”“选择”“巷道穿层钻孔抽采技术”}。三元组为 $\pi = ({e_1},{e_2},r)$,其中,${e_1}$和${e_2}$分别为“先抽后采”和“巷道穿层钻孔抽采技术”,“选择”是这2个实体之间的关系$r$[41–42]。
2)基于BiLSTM层设计
在煤炭开采利用过程中,某些减排技术的描述可能涉及多个步骤或较长的因果链条,BiLSTM能够帮助模型更好地理解从某一减排技术到实际效果之间的长距离关系。例如,在“压裂抽采技术用于高透气性煤层以提高瓦斯抽采效率,显著减少煤层气的泄漏量,最终减少了甲烷对环境的影响。[43–45]”在前向处理时,BiLSTM会首先理解“压裂抽采技术”与“高透气性煤层”的关系,接着识别“瓦斯抽采效率”如何受到“高透气性煤层”影响。接下来,它会捕捉到“瓦斯抽采效率”对“甲烷泄漏量”的影响,并最终理解这一过程如何减少“甲烷对环境的影响”。在反向处理中,BiLSTM会进一步理解“甲烷泄漏量”的减少的原因是“压裂抽采技术”对“高透气性煤层”的应用有效提高了抽采效率。
给定一个长度为$l$的句子$S = \{ {w_1},{w_2}, \cdots ,{w_l}\} $,第$i$个词的表示向量为$ {z_i} = [{w_{w{i_i}}};{w_{{p_i}}};{w_{{c_i}}}] $,其中,${w_{w{i_i}}} \in {R^{{d_{\mathrm{w}}}}}$为随机初始化的词嵌入;${w_{{p_i}}} \in {R^{{d_{{\mathrm{pos}}}}}}$为词性(POS)嵌入,表示基于字符的词特征[31]。
从${w_i}$的字符序列中提取字符级词特征,然后通过BiLSTM来捕捉词之间的依赖关系。BiLSTM网络${w_{{c_i}}} \in {R^{{d_c}}}$的输入为词向量表示序列$\{ {z_1},{z_2}, \cdots ,{z_l}\} $。将正向和反向LSTM隐藏状态${h_i}$拼接为上下文词向量[32]表示为
$$ {h_i} = [\overrightarrow {{\text{LSTM}}} ({z_i});\overleftarrow {{\text{LSTM}}} ({z_i})],\quad i \in [1,l] $$ (4) 式中:${h_i} \in {R^{2 {d_{{\mathrm{he}}}}}}$,${d_{{\mathrm{he}}}}$为BiLSTM隐藏状态的维度;${S_c} = \{ {h_1},{h_2}, \cdots ,{h_l}\} $为上下文的句子特征。
3)基于关系的注意力机制设计
句子中的词在不同的关系下有不同的权重。为此引入一种基于关系的注意力机制,用于在每个关系下为上下文词分配不同的权重。例如,在文本“瓦斯抽采技术在很大程度上减少了碳排放,并且对矿井安全也有重要作用”中,模型会更关注“瓦斯抽采技术”和“碳排放”之间的关系,忽略与此关系无关的词汇如“矿井安全”[46]。这种基于关系的注意力分配能够使得模型在不同关系的上下文中,自动识别最相关的词汇,从而提高实体识别和关系抽取的准确性[47]。
注意力得分的计算方式如下:
$$ {s_g} = {\text{avg}}\{ {h_1},{h_2}, \cdots ,{h_l}\} $$ (5) $$ {e_{ik}} = {v^T}\tanh ({W_r}{r_k} + {W_g}{s_g} + {W_h}{h_i}) $$ (6) $$ {\alpha _{ik}} = \frac{{\exp ({e_{ik}})}}{{\displaystyle\sum\limits_{j = 1}^l {\exp } ({e_{jk}})}} $$ (7) 其中,${r_k} \in {R^{{d_{\mathrm{r}}}}}$为第$k$个关系的可训练嵌入;$v \in {R^{{d_{{\mathrm{att}}}}}}$,${W_r} \in {R^{{d_{{\mathrm{att}}}} \times {d_{\mathrm{r}}}}}$,${W_g},{W_h} \in {R^{{d_{{\mathrm{att}}}} \times 2{d_{{\mathrm{he}}}}}}$为可训练的参数;${s_g}$为句子的全局表示。通过这种方式,注意力得分不但可以衡量每个词对关系表达的重要性,还可以衡量其对整个句子的贡献。具体的句子表示${s_k}$通过对句子单词的加权和生成:
$$ {s_k} = \sum\limits_{i = 1}^n {{\alpha _{ik}}} {h_i} $$ (8) 4)关系门控机制
关系门控机制的主要作用是控制不同关系对句子表示的影响。关系的不同可能对某些词汇产生不同的重要性,而门控机制会根据关系的相关性调节每个词对最终关系表示的贡献[33]。为了自适应地控制前一注意力层提供的关系信息,引入门控机制作为桥梁。仍以第$k$个关系为例,门控操作定义如下:
$$ {g_k} = \sigma \left( {({W_1}{s_g} + {b_1}) \oplus ({W_2}{s_k} + {b_2})} \right) $$ (9) $$ {u_k} = {g_k} \cdot \tanh ({W_3}{s_k} + {b_3}) $$ (10) 其中,${W_1},{W_2},{W_3} \in {R^{{d_{\mathrm{g}}} \times 2{d_{{\mathrm{he}}}}}}$;${b_1},{b_2},{b_3} \in {r^{{d_{\mathrm{g}}}}}$为参数;$ \oplus $为拼接操作;$ \cdot $为点积;$\sigma $为逐元素的Sigmoid激活函数,返回值在0~1,结果可以视为保留信息的百分比;$ {g_k} $的目的是衡量句子原始表示向量${s_g}$或关系的表示向量${s_k}$对实体提取的权重。$ {g_k} $会影响下游的实体提取过程,控制了关系特征对下游任务的“保留”程度。如果某个关系与句子的相关性为正值,它的门控值会较大,允许该关系特征保留下来;反之,如果关系与句子内容无关,门控值会较小,减少无关信息的干扰[48]。
${u_k}$为保留的关系特征,将${h_i}$和${u_k}$拼接得到第$i$个词的最终表示为
$$ {h_{ik}} = {h_i} \oplus {u_k} $$ (11) 式中:${h_{ik}} \in {R^{2{d_{{\mathrm{he}}}} + {d_{\mathrm{g}}}}}$;句子$S$现在表示为${S_k} = \{ {h_{1k}},{h_{2k}}, \cdots , {h_{nk}}\} $。
5)关系解码器
对词序列${S_k}$运行另一个BiLSTM网络,并将每个词映射到标签空间:
$$ {o_{ik}} = [{\text{LST}}{{\text{M}}^ + }({h_{ik}});{\text{LST}}{{\text{M}}^ - }({h_{ik}})] $$ (12) $$ P({y_{ik}}) = {\text{Softmax}}({W_o} \cdot {o_{ik}} + {b_o}) $$ (13) 式中:$i \in [1,l]$;${W_o} \in {R^{2{d_{hd}} \times {l_t}}}$;${b_o} \in {R^{{d_{lt}}}}$为参数;${d_{hd}}$为BiLSTM隐藏状态的维度;${n_l}$为标签的总数;$P({y_{ik}})$为第$i$个词在关系${r_k}$下预测标签的概率。
6)损失函数选取
损失函数表示句子中出现的关系数量远小于关系集合$R$的大小。如果在训练过程中对所有给定的关系进行实体解码,负样本的数量会非常大,这使得模型难以收敛。因此,本文应用关系负采样策略,即从当前句子的负样本集中随机选择${n_{{\text{neg}}}}$个关系。所有单词将被标记为$O$标签,对于具有${n_{{\text{sp}}}}$个正关系的句子$S$,模型将在解码过程中生成${n_{\mathrm{s}}} = {n_{{\text{sp}}}} + {n_{{\text{neg}}}}$个标签序列。使用负对数似然(NLL)损失函数来训练模型,设关系${r_k}$下的真实标签为 $ \{ y_1^k,y_2^k, \cdots ,y_n^k\} $,NLL损失函数定义如下:
$$ L = \frac{1}{{{n_{\mathrm{s}}} n}}\sum\limits_{k = 1}^{{n_{\mathrm{s}}}} {\sum\limits_{i = 1}^n - } \ln P(y_i^{\text{k}} = \hat y_i^k) $$ (14) 2.4 实体识别与关系提取
2.4.1 实体识别试验
为了评估BERT+CRF模型的有效性,将1.3节提到的数据集通过BIO标注方式进行标注,并将该标注数据集代入模型进行训练和测试。在试验中,笔者采用F1-score作为评估指标,全面衡量模型在精度和召回率上的综合表现。BERT+CRF模型参数设置见表5。
表 5 参数设置Table 5. Parameter settings模型参数 取值 优化器 Adamax 学习率 0.000 01 训练批次(epoch) 30 序列的最大长度 256 Transformer层数 12 在使用上述参数设置进行试验后,BERT+CRF模型在数据集上的F1-score达到了75.13,表明该模型在精度与召回率之间达到了一个较为平衡的状态。BERT+CRF模型在煤炭开采利用碳排放治理技术实体识别任务中,尤其是在文本数据集的标注准确性和覆盖率方面,能够有效地捕捉上下文信息,同时利用CRF层建模序列间的依赖关系,处理煤炭开采与利用领域特定术语和实体时,展现出了较强的领域适应性,有效提升了碳排放治理技术相关实体的识别准确率,为该领域的知识图谱构建和智能化决策支持提供了有力的技术保障[45]。
2.4.2 关系抽取实验
模型的性能指标同样使用F1进行评价,笔者所构建的 BiLSTM– Attention 模型的参数设置见表6。
表 6 BiLSTM– Attention模型参数设置Table 6. BiLSTM– attention model parameter settings模型参数 取值 优化器 AdaDelta 学习率 0.000 015 训练批次(epoch) 20 词向量维度 100 嵌入层dropout率 0.3 LSTM层dropout率 0.3 倒数第2层dropout率 0.5 由于数据集具有高质量的标注,并且在煤炭开采利用碳排放治理技术知识图谱领域中关系和实体比较固定,模型能够依赖这些结构化的知识,提高识别的准确性和效率[44]。表4中定义的各类实体关系的识别结果见表7。模型在各类别关系上的F1-score 均值为0.89,不同关系类别的识别效果差异不大,表明本文提出的BiLSTM–Attention模型具备强大的语义理解能力,能够准确捕捉领域中的核心关系。
表 7 实体间关系抽取结果Table 7. Inter-entity relationship extraction results关系类别 F1 决定 0.84 选择 0.91 适用 0.88 降低 0.92 包含 0.87 转换 0.93 2.5 知识融合
在煤炭开采利用碳排放治理技术领域知识图谱的构建中,实体消歧和共指消解是知识融合的关键步骤,两者旨在通过精确标识知识图谱中的实体,消除歧义并确保不同数据源中指代相同实体时的一致性[49]。
2.5.1 实体消歧
实体消歧是指在知识图谱构建过程中,对具有歧义的实体进行区分,确定其在特定语境下的准确含义。由于煤炭开采利用碳排放治理技术领域涉及多种减碳开采和利用技术、排放特征、开采方式和利用方式等实体,同一名称可能指代不同的概念,因此需要进行实体消歧[50]。以“瓦斯抽采技术”为例,在煤炭开采利用碳排放治理领域,“瓦斯抽采技术”包含多种不同的方法,如本煤层瓦斯抽采、邻近层瓦斯抽采和采空区瓦斯抽采,在构建知识图谱时,需要将“瓦斯抽采技术”这个实体进行细化,明确不同类型的瓦斯抽采技术作为不同的子实体。通过分析文本的上下文、技术细节等信息,将关于不同瓦斯抽采技术的知识分别关联到对应的子实体上,当查询知识图谱关于“本煤层瓦斯抽采技术对碳排放治理的影响”时,就能够更准确地获取与本煤层瓦斯抽采技术相关的知识,而不会受到其他类型瓦斯抽采技术知识的干扰。
2.5.2 共指消解
共指消解是指在文本中识别出指代同一实体的不同表述,并将它们合并为一个统一的实体表示。在煤炭开采利用碳排放治理技术领域的知识图谱构建中,由于不同的文献、技术报告或专家可能使用不同的术语来指代相同的事物,因此需要进行共指消解[48]。以“煤炭减排燃烧技术”为例,在不同的文献中,可能会出现“高效煤炭燃烧技术”“低碳煤燃烧技术”“低污染煤炭燃烧技术”等不同的表述,但它们实际上都在描述能够减少煤炭燃烧过程中污染物排放和碳排放的技术[51]。为了进行共指消解,可以通过分析术语的定义、技术原理、应用场景等方面的相似性来判断它们是否指代同一实体。例如,对于“高效煤炭燃烧技术”和“低碳煤燃烧技术”,通过分析发现它们都涉及提高煤炭燃烧效率、减少污染物(包括二氧化碳)排放的技术原理与应用场景,因此可以将它们消解为同一个实体“煤炭减排燃烧技术”[52]。从而实现知识的有效融合和整合,方便用户查询和利用关于煤炭减排燃烧技术的全面知识。
3. 煤炭开采利用碳排放治理技术领域知识图谱的可视化与应用
3.1 煤炭开采利用碳排放治理技术领域知识图谱的可视化
基于本文提出的知识图谱构建方法,将与煤炭开采利用碳排放治理技术领域的相关文本经过知识抽取之后,共形成12 631个节点与32 209个实体间关系,将这些三元组数据导入Neo4j图数据库中进行存储与表示,构建煤炭开采利用碳排放治理技术领域的可视化知识图谱,图4为知识图谱的部分展示。
3.2 煤炭开采利用碳排放治理技术领域知识图谱的应用
煤炭开采利用碳排放治理技术领域的知识图谱应用具有广泛的潜力,能够有效支持矿山碳排放治理技术推荐,帮助企业选取相适配的减碳技术路径[53]。当企业面临减排任务时,利用构建的知识图谱,系统通过图数据库Neo4j执行查询语句,查找是否存在与当前矿山情况匹配的减排技术。查询内容包括开采利用环节碳排放治理技术推荐、技术适用条件及其实施效果等,为管理人员提供决策支持。若在图谱中找不到匹配的技术,系统会进行推理并推荐相似的减排技术或优化方案,以达到最佳减排效果。
以下是具体的煤炭开采利用碳排放治理技术推荐过程。
3.2.1 减碳开采技术推荐
近年来,我国煤矿瓦斯(主要是甲烷)抽采利用率不断提高,但抽采瓦斯直接排空的比例依然高达50%[54]。因此,持续加强煤矿瓦斯抽采利用技术的研发和应用,进一步提高煤矿瓦斯抽采率和利用率,是降低煤炭开发过程碳排放量的必由之路。
首先,煤矿企业选择煤层气逸散(主要指瓦斯逸散)的碳排放特征,并且根据本企业地质状况确定先抽后采的开采方式,利用构建的知识图谱,系统可通过图数据库Neo4j执行查询语句,即根据预设的节点相似度计算,查找相似技术,查询到与当前矿山情况匹配的减排技术。系统会推荐巷道穿层钻孔抽采技术作为适合该矿井瓦斯抽采的最佳技术(图5),并提供相关技术的适用条件和实施效果。巷道穿层钻孔抽采技术是在煤层底板或顶板巷道中,向煤层施工穿层钻孔,将煤层中的瓦斯抽出,减少瓦斯排放的同时,也降低了因瓦斯燃烧或爆炸产生的碳排放。该技术适用于煤层赋存较稳定、地质构造相对简单的区域,在我国许多大型煤矿区得到了广泛应用,如淮北矿区、平顶山矿区等,是常规地质条件下减碳开采的代表性技术。系统输出该技术的适用条件为:适用于瓦斯含量较高(瓦斯含量大于8 m³/t)和瓦斯压力较大(瓦斯压力大于0.74 MPa)的各类煤层及煤层群[53];输出的实施效果为:通过巷道穿层钻孔技术可以同时对多个煤层进行瓦斯抽采,能够显著减少采煤工作面的瓦斯涌出量,一般情况下,瓦斯涌出量可以减少 40%~80%,实施效果较好,全国推广[54]。煤炭开采环节瓦斯抽采技术方案知识图谱的应用流程如图5所示。
3.2.2 减碳利用技术推荐
在煤炭利用过程中,尤其是煤发电,有2个途径产生碳排放,分别为燃烧产生的碳排放和运行相应设备产生的能耗排放。燃烧产生的碳排放的具体过程和特征是:煤炭燃烧时释放出大量的热能,推动汽轮机发电,当大量烟煤在锅炉中燃烧时,会产生巨量的二氧化碳,释放到大气中,常见的烟煤含碳量在70%~80%;其次是能耗排放的具体过程:煤电发电过程中有大量的辅助设备,如磨煤机、送风机、引风机和各类水泵等,这些设备的运行需要消耗电能,电能的产生也会产生碳排放,如磨煤机将煤炭磨碎成细粉,以便于在锅炉中高效燃烧,其运行过程中消耗的电能间接导致了碳排放,并且这些辅助设备通常是长时间运行的,会持续产生碳排放[55]。例如,根据上述煤发电过程中的碳排放原因和特征,系统将根据上述查询条件,推荐二次再热超超临界发电技术(图6),并提供该技术的适用条件为:煤炭企业煤的发热量、灰分、硫分等指标应保持相对稳定,装机容量在 600 MW以上,有大规模发电需求、相对稳定的发电负荷和较高的资金和技术实力支持[55];及该技术方案的实施效果:二次再热超超临界发电是在一次再热机组的基础上重新加热高温蒸汽,即在超高压缸和高压缸设置二次再热回路,将出口蒸汽再次送入锅炉内高、低压再热器进行加热,提升蒸汽整个做功过程的平均吸热温度,提高发电效率,采用二次再热超超临界发电技术后,与传统发电技术相比,每年二氧化碳排放量可减少数10万t[56]。
3.2.3 煤炭开采利用节能降耗技术推荐
节能技术对于碳排放治理、行业可持续发展及经济效益提升层面均具有不可忽视的重要性,煤炭开采作为能源消耗与碳排放集中的环节,高效能源管理系统等节能技术可精准调控各类设备能耗,避免能源浪费,降低能源获取与使用过程中的碳排放总量,提升开采效率,降低单位煤炭产出的能源投入。例如,当煤炭企业的煤矿情况为:薄煤层(厚度小于1.3 m),存在多个煤层且间距较近时,及瓦斯含量较高(大于8 m³/t)和瓦斯压力较大(大于0.74 MPa)时,一般会选择边抽边采的瓦斯抽采模式[53],该抽采模式下使用各类开采设备会引起能源消耗,导致大量碳排放,系统会根据该类情况推荐小(无)煤柱开采技术(图7),并给出小(无)煤柱开采技术的适用条件和实施效果。小(无)煤柱开采适用于煤层厚度稳定、倾角在近水平到缓倾斜范围、顶底板条件良好,且瓦斯含量相对较低、水文地质条件简单的煤层,同时需配合先进的采煤方法与支护技术[57]。在碳排放方面,其实施效果显著,通过提高煤炭资源回收率,减少煤炭开采量,降低了因煤炭开采和运输过程中产生的碳排放[58]。同时,由于减少了煤柱的开采和维护,降低了相应设备的能源消耗,进一步减少了碳排放,在煤炭开采领域的低碳化进程中发挥着重要作用。
基于构建的煤炭开采利用环节碳排放治理技术领域知识图谱,笔者给出了3种减排技术方案推荐路径的具体应用示例。若要建立更为全面的碳排放治理技术推荐体系,后续可从以下2个维度进行完善与补充,鉴于篇幅限制,在此不再展开详细论述。
首先,可以将专家经验与案例库融合。积极邀请煤炭行业资深专家,系统梳理他们在不同煤矿开展抽采技术实践的经验,构建专家知识库。同时,广泛收集并整理大量实际案例,建立案例库,详细记录不同煤矿采用各类抽采技术的实施流程、应用效果以及实施过程中遇到的问题。以专家知识库和案例库的内容对现有的领域知识图谱进行补充与完善,即在进行减排技术推荐时,不仅要参考专家基于丰富经验做出的判断,还要从案例库中检索与目标煤矿情况相似的成功案例,从而为技术推荐提供更为充实、可靠的依据[59]。
其次,不断保持煤炭开采利用环节碳排放治理技术领域知识图谱和技术推荐体系的动态更新。煤炭开采技术处于持续发展的进程中,新的抽采技术和方法不断涌现,因此,技术推荐体系及其关联的知识图谱需要定期进行更新,及时将新的技术成果和应用案例纳入其中,并持续关注行业内的技术创新动态与实践经验,运用科学的评估方法对体系中的技术进行全面评估与动态调整,确保推荐的技术始终处于行业领先水平,切实满足实际应用的多样化需求[60–61]。
4. 结 论
1)在领域知识建模上,针对煤炭开采利用碳排放治理技术领域文本中实体成分繁杂、边界界定困难的关键问题,本研究创新性地构建了煤炭开采利用碳排放治理技术领域知识的概念框架图并确定了实体之间的关系类型,填补了该领域在知识体系结构化梳理方面的部分空白。
2)在图谱构建方法上,通过整合多源数据,包括煤炭行业的学术文献、技术报告等,构建了煤炭开采利用碳排放治理技术文本语料库,运用label-studio标注工具结合BIO标注方法完成了实体标注,完成了包含10种实体类别的实体标注工作,基于 BERT+CRF的命名实体识别方法,识别出煤炭开采利用碳排放治理技术相关的各类实体,突破了传统方法在实体识别准确性与效率的局限。运用Bilstm Attention关系抽取模型,准确抽取实体间复杂关系,保障了知识图谱的语义完整性与逻辑连贯性。经过知识融合与校验流程,最终构建出的煤炭开采利用碳排放治理技术领域知识图谱,填补了该领域在知识图谱构建方面的空白。
3)在应用层面上,通过煤炭开采利用碳排放治理技术知识图谱的可视化,整合并结构化展示分散的知识,梳理出煤炭开采的瓦斯逸散到煤炭利用的高效燃烧等减碳技术,帮助企业查询选择适合矿山开采与利用过程中的碳排放治理技术。
综上所述,本文构建出煤炭开采利用碳排放治理技术领域的知识图谱并提供应用路径。不仅帮助企业快速查询并选择适合矿山开采与利用过程中的碳排放治理技术,为企业决策提供了科学依据,助力企业优化生产流程,降低生产环境风险;同时,在技术研发创新领域,知识图谱通过对节点与连线的深入分析,精准揭示技术空白点,为研发人员指引研发方向,深度挖掘技术融合点,为新技术的开发提供了创新性思路,为煤炭行业的低碳转型与可持续发展注入了新的活力与动力。
-
表 1 知识图谱的构建技术方法综述
Table 1 Overview of technical approaches to the construction of knowledge graphs
构建方法 特点 适用场景 自底
向上法从具体的数据实例出发,通过对数据进行分析、抽取,逐步识别出实体、关系和属性等,然后将这些知识进行整合,构建出知识图谱的上层概念和结构 适用于领域知识分散、难以预先确定架构的场景,如通用知识图谱的构建。该方法在需快速迭代扩展的场景中表现出色,如电商商品知识图谱的持续更新便是典型应用 自顶
向下法首先定义好知识图谱的顶层概念、框架和规则,包括本体结构、实体类型、关系类型等,然后根据这些预设的框架,从数据源中抽取具体的实体和关系等信息,填充到知识图谱中 适用于领域知识结构清晰,存在明确行业标准或规范的场景,如构建金融领域的知识图谱。此外,在对知识图谱质量和一致性要求极高的场景,如医疗知识图谱构建中,自顶向下法可有效保障知识准确性与一致性 混合
构建法结合了自底向上和自顶向下两种方法的优点,在构建知识图谱时,既利用现有的领域知识和本体框架进行顶层设计,又从实际数据中挖掘和发现新的知识,不断对知识图谱进行完善和扩展 适用于构建大型复杂领域的知识图谱中,其通过自顶向下确定总体框架,自底向上填充各领域数据,能发挥其整合优势,如构建智慧城市知识图谱。其次,适用于整合已有知识资源与新增数据的场景,如历史文化知识图谱构建,该方法可实现知识图谱的持续完善 表 2 煤炭开采利用碳排放治理技术知识数据来源
Table 2 Sources of data on technical knowledge on carbon management for coal mining and utilization
数据来源 具体名称 来源1 参考书籍 《煤炭碳中和战略与技术路径》《煤矿绿色开采技术》《煤矿开采技术》《煤炭利用过程中的节能技术》《清洁煤电近零排放技术与应用》《炼焦工业碳减排技术与途径》等 来源2 研究报告 煤矿生产记录与能耗分析报告、来自矿山生产过程中的能源消耗数据、设备运行记录报告等、环境监控数据包括空气质量监测、温湿度数据、粉尘排放等报告等 来源3 专业文献 《煤炭工业数字智能绿色三化协同模式与新质生产力建设路径》《“双碳”目标下CCUS在引领煤炭行业低碳转型过程中的作用》《“双碳”背景下煤炭安全区间与绿色低碳技术路径》《“双碳”战略中煤气共采技术发展路径思考》《煤化工工艺中二氧化碳减排技术的应用研究》《煤炭地下气化碳减排技术研究进展与未来探索》《煤矿绿色开采20年研究及进展》《我国煤矿绿色开采与生态修复技术发展现状及展望》等 来源4 标准规范 《数据编码–井工煤矿数据分类及编码规范 第3部分:生产类》《温室气体排放核算与报告要求 第28部分:矿山企业》《智能化矿山数据融合共享煤矿碳排放数据应用规范》等矿山行业碳排放标准、碳排放核算规范等 表 3 命名实体类别及示例
Table 3 Named entity categories and examples
实体类别 实体描述 实体示例 开始标签 中间或结尾
标签煤层气排放
(Coalbed Methane Emissions, CME)描述煤层气碳排放的主要特征与构成 瓦斯(甲烷)(80%~98% )、二氧化碳(2%~20%) B–CME I–CME 能耗排放
(Energy Consumption and Emissions, ECE)在煤炭开采利用过程中,涉及不同的技术与设备以及消耗的不同的能源类型,及其能耗热值与排放因子等排放要素 煤、电、天然气、汽油、醇基燃料、煤炭碳排放因子、天然气碳排放因子、电力碳排放因子 B–ECE I–ECE 开采方式
(Mining Pattern, MP)描述基于瓦斯排放特征的开采模式和技术 先采后抽、随采随抽、先抽后采等 B–MP I–MP 利用方式
(Utilization Pattern, UP)利用方式描述开采后转换加工过程中的利用方式,主要涵盖发电、供热、炼焦等环节,导致因煤燃烧或加工过程的废弃物排放产生的碳排放 煤发电、煤供热、煤炼焦、煤制气等 B–UP I–UP 减碳开采技术
(Carbon Reduction Mining Technology, CRMT)煤炭减碳开采技术是整合优化开采工艺、清洁开采技术、伴生资源利用等以降低煤炭开采碳排放的技术体系 斜井开拓、沿空掘巷、低品位热能利用、顺层钻孔抽采、压裂抽采、采空区埋管等 B–CRMT I–CRMT 减碳开采技术适用条件
(Carbon Reduction Mining Technology Condition, CRMT–C)描述煤炭开采减碳技术方案的适用的场景及其参数 本层抽采、高透气性煤层、煤层群、单一特厚高瓦斯煤层、邻近层等 B–CRMT–C I–CRMT–C 减碳开采技术实施效果
(Carbon Reduction Mining Technology
Effect, CRMT–E)煤炭开发利用碳减排方案实施效果体现在降碳、提效、环保及满足技术经济与政策要求等方面的实际成果 推广范围、抽采量稳定性、巷道工程量、评价等级等 B–CRMT–E I–CRMT–E 减碳利用技术
(Carbon Reduction and Utilization
Technologies, CRUT)煤炭利用减碳技术是通过不同的煤炭加工转换的途径和方式以达成降低碳排放目标的一系列技术集合 二次再热超超临界发电技术、高效燃烧器技术、捣固炼焦技术、煤催化气化技术、煤加氢气化技术等 B–CRUT I–CRUT 减碳利用技术适用条件
(Carbon Reduction and Utilization
Technologies Condition, CRUT–C)煤炭利用减碳技术的适用条件受煤炭品质、项目规模和环保政策等因素综合制约 煤种特性、灰分和硫分含量、大型燃煤发电厂、民用煤炭取暖、城市集中供暖、与其他配套技术兼容性等 B–CRUT–C I–CRUT–C 减碳利用技术实施效果
(Carbon Reduction and Utilization Technologies Effect, CRUT–E)煤炭利用碳减排方案实施效果体现在降碳、提效、环保及满足技术经济与政策要求等方面的实际成果 推广范围、工程量发电效率、评价等级等 B–CRUT–E I–CRUT–E 表 4 实体间关系类别及示例
Table 4 Categories and examples of inter-entity relationships
关系类别 关系描述 关系示例 决定 描述不同矿井排放特征,主要指排放源的构成决定了采用怎样的开采方式 瓦斯逸散–随采随抽等 选择 描述不同的开采方式会优先选择不同的减碳技术 先抽后采–巷道穿层钻孔抽采技术、随采随抽–高抽巷抽采技术、先采后抽–采空区埋管抽采技术等 适用 描述煤炭开采利用减碳技术与其适合条件及实施效果之间的关系 压裂抽采–高透气性煤层、高抽巷抽采 –巷道工程量大等 降低 描述煤炭开采和利用环节的减碳技术方案与碳排放及能耗排放之间的关系 超超临界循环流化床锅炉科技–机组二次再热超超临界发电技术–二氧化碳排放、高效燃烧器技术–能耗排放等 包含 描述一个实体包含其他实体的关系,表示某个实体作为“整体”,包含一个或包含多个其他实体 煤炭减碳技术–煤炭开采减碳技术、煤炭减碳技术–煤炭利用减碳技术、低品位热源发电技术–有机朗肯循环发电等 转换 描述煤炭利用过程及方式与其产生的排放物之间的关系 煤发电–二氧化碳排放、煤发热–煤燃烧排放等 表 5 参数设置
Table 5 Parameter settings
模型参数 取值 优化器 Adamax 学习率 0.000 01 训练批次(epoch) 30 序列的最大长度 256 Transformer层数 12 表 6 BiLSTM– Attention模型参数设置
Table 6 BiLSTM– attention model parameter settings
模型参数 取值 优化器 AdaDelta 学习率 0.000 015 训练批次(epoch) 20 词向量维度 100 嵌入层dropout率 0.3 LSTM层dropout率 0.3 倒数第2层dropout率 0.5 表 7 实体间关系抽取结果
Table 7 Inter-entity relationship extraction results
关系类别 F1 决定 0.84 选择 0.91 适用 0.88 降低 0.92 包含 0.87 转换 0.93 -
[1] 刘峰,郭林峰,张建明,等. 煤炭工业数字智能绿色三化协同模式与新质生产力建设路径[J]. 煤炭学报,2024,49(1):1−15. LIU Feng,GUO Linfeng,ZHANG Jianming,et al. Synergistic mode of digitalization-intelligentization-greeniation of the coal industry and it’s path of building new coal productivity[J]. Journal of China Coal Society,2024,49(1):1−15.
[2] 谢和平,任世华,谢亚辰,等. 碳中和目标下煤炭行业发展机遇[J]. 煤炭学报,2021,46(7):2197−2211. XIE Heping,REN Shihua,XIE Yachen,et al. Development opportunities of the coal industry towards the goal of carbon neutrality[J]. Journal of China Coal Society,2021,46(7):2197−2211.
[3] 谷欣博,潘卫东,阿斯哈尔·尼亚孜别克,等. 井工煤矿煤炭生产碳排放核算及减排路径研究[J/OL]. 煤炭科学技术,2024:1−11 [2024−08−29]. https://kns.cnki.net/KCMS/detail/detail.aspx?filename=MTKJ20240805004&dbname=CJFD&dbcode=CJFQ. GU Xinbo, PAN Weidong, A Sihaer·niyazibieke, et al. Study on carbon emission accounting and emission reduction path of coal production in coal mine[J/OL]. Coal Science and Technology,2024:1−11 [2024−08−29]. https://kns.cnki.net/KCMS/detail/detail.aspx?filename=MTKJ20240805004&dbname=CJFD&dbcode=CJFQ.
[4] 于胜民,朱松丽,张俊龙. 中国井工煤矿开采过程的二氧化碳逃逸排放因子研究[J]. 中国能源,2018,40(5):10−16,33. doi: 10.3969/j.issn.1003-2355.2018.05.002 YU Shengmin,ZHU Songli,ZHANG Junlong. An approach to estimate the emission factor of fugitive CO2 emissions from underground coal mining activities in China[J]. Energy of China,2018,40(5):10−16,33. doi: 10.3969/j.issn.1003-2355.2018.05.002
[5] 葛世荣,刘淑琴,刘金昌,等. 能源强国目标下煤炭安全保供及高效降碳效力研究[J]. 中国工程科学,2024,26(4):40−51. doi: 10.15302/J-SSCAE-2024.04.001 GE Shirong,LIU Shuqin,LIU Jinchang,et al. Effectiveness of secure supply and carbon reduction in the coal sector for strengthening the energy power of China[J]. Strategic Study of CAE,2024,26(4):40−51. doi: 10.15302/J-SSCAE-2024.04.001
[6] 薛香玉,王长安,邓磊,等. 基于全生命周期的富油煤原位热解碳排放[J]. 煤炭学报,2023,48(4):1773−1781. XUE Xiangyu,WANG Chang’an,DENG Lei,et al. Carbon emissions from in situ pyrolysis of tar-rich coal based on full life cycle analysis method[J]. Journal of China Coal Society,2023,48(4):1773−1781.
[7] 刘韵,师华定,曾贤刚. 基于全生命周期评价的电力企业碳足迹评估:以山西省吕梁市某燃煤电厂为例[J]. 资源科学,2011,33(4):653−658. LIU Yun,SHI Huading,ZENG Xiangang. A life-cycle carbon footprint assessment of electric power companies[J]. Resources Science,2011,33(4):653−658.
[8] YU S W,WEI Y M,GUO H X,et al. Carbon emission coefficient measurement of the coal-to-power energy chain in China[J]. Applied Energy,2014,114:290−300. doi: 10.1016/j.apenergy.2013.09.062
[9] 崔亚蕾,孙仁金,赵亚南,等. 煤制天然气全生命周期碳排放核算研究[J]. 资源与产业,2018,20(6):52−60. CUI Yalei,SUN Renjin,ZHAO Yanan,et al. Carbon emission accounting study on entire life circle of coal-made gas[J]. Resources & Industries,2018,20(6):52−60.
[10] 袁亮,张通,王玥晗,等. 深部煤炭资源安全高效开采科学问题及关键技术[J]. 煤炭学报,2025,50(1):1−12. YUAN Liang,ZHANG Tong,WANG Yuehan,et al. Scientific problems and key technologies for safe and efficient mining of deep coal resources[J]. Journal of China Coal Society,2025,50(1):1−12.
[11] MORRELL S. Helping to reduce mining industry carbon emissions:A step-by-step guide to sizing and selection of energy efficient high pressure grinding rolls circuits[J]. Minerals Engineering,2022,179:107431. doi: 10.1016/j.mineng.2022.107431
[12] BRODNY J,TUTAK M. Challenges of the Polish coal mining industry on its way to innovative and sustainable development[J]. Journal of Cleaner Production,2022,375:134061. doi: 10.1016/j.jclepro.2022.134061
[13] ZHU X J,LI J X,CHENG H,et al. Assessing the impacts of ecological governance on carbon storage in an urban coal mining subsidence area[J]. Ecological Informatics,2022,72:101901. doi: 10.1016/j.ecoinf.2022.101901
[14] 刘淑琴,刘欢,纪雨彤,等. 深部煤炭地下气化制氢碳排放核算及碳减排潜力分析[J]. 煤炭科学技术,2023,51(1):531−541. LIU Shuqin,LIU Huan,JI Yutong,et al. Carbon emission accounting and carbon reduction analysis for deep coal underground gasification to hydrogen[J]. Coal Science and Technology,2023,51(1):531−541.
[15] 王良萸. 面向碳交易领域的知识图谱构建方法[J]. 计算机与现代化,2018(8):114−119. doi: 10.3969/j.issn.1006-2475.2018.08.021 WANG Liangyu. Knowledge graph construction method for carbon trading[J]. Computer and Modernization,2018(8):114−119. doi: 10.3969/j.issn.1006-2475.2018.08.021
[16] 吴涛,李婕,鲍劲松,等. 羊毛混纺面料生产流程的碳图谱建模与应用[J]. 纺织学报,2024,45(9):97−105. WU Tao,LI Jie,BAO Jinsong,et al. Modeling of carbon footprints for producing wool blended fabrics and model applications[J]. Journal of Textile Research,2024,45(9):97−105.
[17] WU T,LI J,BAO J S,et al. CarbonKG:Industrial carbon emission knowledge graph-based modeling and application for carbon traceability of complex manufacturing process[J]. Journal of Computing and Information Science in Engineering,2024,24(8):081001. doi: 10.1115/1.4065166
[18] ZHAO Z C. Quantification of carbon emission technologies based on knowledge graph bert-BiLSTM-attention-CRF model[C]:2023 International Conference on Electronics and Devices,Computational Science (ICEDCS). Piscataway,NJ:IEEE,2023:42−47.
[19] 许琦,尹绍阳,张兴伟,等. 基于关联知识图谱的典型工业领域碳排放评估方法研究[J]. 现代工业经济和信息化,2023,13(10):31−34. XU Qi,YIN Shaoyang,ZHANG Xingwei,et al. A study on carbon emission assessment method for typical industrial sectors based on linked knowledge graph(LKG)[J]. Modern Industrial Economy and Informationization,2023,13(10):31−34.
[20] KSSJ/BM13-2023数据编码-井工煤矿数据分类及编码规范. 第3部分:生产类[S]. 北京:国家矿山安全监察局,2023. [21] 国家市场监督管理总局,国家标准化管理委员会. 温室气体排放核算与报告要求 第28部分:矿山企业:GB/T 32151.28—2024[S]. 北京:中国标准出版社,2023. [22] KSSJ/YY25-2023智能化矿山数据融合共享煤矿碳排放数据应用规范[S]. 北京:国家矿山安全监察局,2023. [23] 刘江,赵开功,张晓蕾,等. 基于知识图谱的选煤法规标准培训平台及应用[J]. 中国安全科学学报,2024,34(S1):226−233. LIU Jiang,ZHAO Kaigong,ZHANG Xiaolei,et al. Training platform for regulations and standards of coal preparation based on knowledge graph and its application[J]. China Safety Science Journal,2024,34(S1):226−233.
[24] 刘鹏,叶帅,舒雅,等. 煤矿安全知识图谱构建及智能查询方法研究[J]. 中文信息学报,2020,34(11):49−59. doi: 10.3969/j.issn.1003-0077.2020.11.007 LIU Peng,YE Shuai,SHU Ya,et al. Coalmine safety:Knowledge graph construction and its QA approach[J]. Journal of Chinese Information Processing,2020,34(11):49−59. doi: 10.3969/j.issn.1003-0077.2020.11.007
[25] 曹现刚,张梦园,雷卓,等. 煤矿装备维护知识图谱构建及应用[J]. 工矿自动化,2021,47(3):41−45. CAO Xiangang,ZHANG Mengyuan,LEI Zhuo,et al. Construction and application of knowledge graph for coal mine equipment maintenance[J]. Industry and Mine Automation,2021,47(3):41−45.
[26] 蔡安江,张妍,任志刚. 煤矿综采设备故障知识图谱构建[J]. 工矿自动化,2023,49(5):46−51. CAI Anjiang,ZHANG Yan,REN Zhigang. Fault knowledge graph construction for coal mine fully mechanized mining equipment[J]. Journal of Mine Automation,2023,49(5):46−51.
[27] 罗香玉,杜浩,华颖,等. 一种煤矿顶板灾害防治知识图谱构建方法[J]. 工矿自动化,2024,50(6):54−60. LUO Xiangyu,DU Hao,HUA Ying,et al. A method for constructing a knowledge graph of coal mine roof disaster prevention and control[J]. Journal of Mine Automation,2024,50(6):54−60.
[28] 付燕,刘佩怡,叶鸥. 煤矿井下不安全行为的命名实体识别方法[J/OL]. 计算机工程,2024:1−9 [2024−11−18]. https://link.cnki.net/doi/10.19678/j.issn.1000-3428.0069917. FU Yan,LIU Peiyi,YE Ou. The named entity recognition method of unsafe behaviors in coal mines[J/OL]. Computer Engineering,2024:1−9 [2024−11−18]. https://link.cnki.net/doi/10.19678/j.issn.1000-3428.0069917.
[29] QIN Y,SHEN G W,ZHAO W B,et al. A network security entity recognition method based on feature template and CNN-BiLSTM-CRF[J]. Frontiers of Information Technology & Electronic Engineering,2019,20(6):872−884.
[30] DEVLIN J,CHANG M W,LEE K,et al. Bert:pre-training of deep bidirectional transformers for language understanding[C]//Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies,2019:4171−4186.
[31] 郭军成,万刚,胡欣杰,等. 基于BERT的中文简历命名实体识别[J]. 计算机应用,2021,41(S1):15−19. GUO Juncheng,WAN Gang,HU Xinjie,et al. Chinese resume named entity recognition based on BERT[J]. Journal of Computer Applications,2021,41(S1):15−19.
[32] ANGLES R,GUTIERREZ C. Survey of graph database models[J]. ACM Computing Surveys,2008,40(1):1−39.
[33] 隗昊,刁宏悦,孔亮宸,等. 东北亚舆情文本细粒度命名实体识别方法研究[J/OL]. 计算机工程,2024:1−10 [2024−05−21]. https://link.cnki.net/doi/10.19678/j.issn.1000-3428.0068955. KUI/WEI) Hao,DIAO Hongyue,KONG Liangchen,et al. Research on fine-grained named entity recognition method for public opinion texts in northeast Asia[J/OL]. Computer Engineering,2024:1−10 [2024−05−21]. https://link.cnki.net/doi/10.19678/j.issn.1000-3428.0068955.
[34] 王国法,张建中,刘再斌,等. 煤炭绿色开发复杂巨系统数智化技术进展[J]. 煤炭科学技术,2024,52(11):1−16. doi: 10.12438/cst.2024-1190 WANG Guofa,ZHANG Jianzhong,LIU Zaibin,et al. Progress in digital and intelligent technologies for complex giant systems in green coal development[J]. Coal Science and Technology,2024,52(11):1−16. doi: 10.12438/cst.2024-1190
[35] 齐俊,曲睿婷,教传铭,等. 基于知识图谱增强大语言模型双碳领域服务[J]. 计算机与现代化,2024(9):8−14. doi: 10.3969/j.issn.1006-2475.2024.09.002 QI Jun,QU Ruiting,JIAO Chuanming,et al. Enhanced big language model dual carbon domain services based on knowledge graph[J]. Computer and Modernization,2024(9):8−14. doi: 10.3969/j.issn.1006-2475.2024.09.002
[36] 狄飞. 基于知识图谱的典型机电产品碳足迹标签模型研究与应用[D]. 北京:机械科学研究总院,2023. DI Fei. Research and application of carbon footprint label model of typical electromechanical products based on knowledge map[D]. Beijing:China Academy of Machinery Science & Technology,2023.
[37] 陆诗建. “双碳” 目标下CCUS在引领煤炭行业低碳转型过程中的作用[J]. 可持续发展经济导刊,2021(11):28−30. LU Shijian. The role of ccus in leading the transformation of coal industry under carbon peak and neutrality goals[J]. China Sustainability Tribune,2021(11):28−30.
[38] 康红普,王国法,王双明,等. 煤炭行业高质量发展研究[J]. 中国工程科学,2021,23(5):130−138. doi: 10.15302/J-SSCAE-2021.05.016 KANG Hongpu,WANG Guofa,WANG Shuangming,et al. High-quality development of China’s coal industry[J]. Strategic Study of CAE,2021,23(5):130−138. doi: 10.15302/J-SSCAE-2021.05.016
[39] 孙旭东,张蕾欣,张博. 碳中和背景下我国煤炭行业的发展与转型研究[J]. 中国矿业,2021,30(2):1−6. doi: 10.12075/j.issn.1004-4051.2021.02.034 SUN Xudong,ZHANG Leixin,ZHANG Bo. Research on the coal industry development and transition in China under the background of carbon neutrality[J]. China Mining Magazine,2021,30(2):1−6. doi: 10.12075/j.issn.1004-4051.2021.02.034
[40] 陈浮,于昊辰,卞正富,等. 碳中和愿景下煤炭行业发展的危机与应对[J]. 煤炭学报,2021,46(6):1808−1820. CHEN Fu,YU Haochen,BIAN Zhengfu,et al. How to handle the crisis of coal industry in China under the vision of carbon neutrality[J]. Journal of China Coal Society,2021,46(6):1808−1820.
[41] 王佟,刘峰,赵欣,等. “双碳” 背景下我国煤炭资源保障能力与勘查方向的思考[J]. 煤炭科学技术,2023,51(12):1−8. doi: 10.12438/cst.2023-0095 WANG Tong,LIU Feng,ZHAO Xin,et al. Reflection on China’s coal resource guarantee capacity and exploration work under the background of “double carbon”[J]. Coal Science and Technology,2023,51(12):1−8. doi: 10.12438/cst.2023-0095
[42] 金智新,曹孟涛,王宏伟. “中等收入” 与新“双控” 背景下煤炭行业转型发展新机遇[J]. 煤炭科学技术,2023,51(1):45−58. JIN Zhixin,CAO Mengtao,WANG Hongwei. New opportunities for coal industry transformation and development under the background of the level of a moderately developed country and a new “dual control” system[J]. Coal Science and Technology,2023,51(1):45−58.
[43] 金向阳,李杨,于雷,等. 煤矿区绿色低碳评价指标构建及应用[J]. 煤炭科学技术,2024,52(4):131−142. doi: 10.12438/cst.2023-1806 JIN Xiangyang,LI Yang,YU Lei,et al. Construction and application of green and low-carbon evaluation indicators for coal mining areas[J]. Coal Science and Technology,2024,52(4):131−142. doi: 10.12438/cst.2023-1806
[44] 李树刚,张静非,林海飞,等. 双碳战略中煤气共采技术发展路径的思考[J]. 煤炭科学技术,2024,52(1):138−153. doi: 10.12438/cst.2023-1689 LI Shugang,ZHANG Jingfei,LIN Haifei,et al. Thoughts on the development path of coal and gas co-mining technology in dual carbon strategy[J]. Coal Science and Technology,2024,52(1):138−153. doi: 10.12438/cst.2023-1689
[45] 郭榕,杨群,刘绍翰,等. 电网故障处置知识图谱构建研究与应用[J]. 电网技术,2021,45(6):2092−2100. GUO Rong,YANG Qun,LIU Shaohan,et al. Construction and application of power grid fault handing knowledge graph[J]. Power System Technology,2021,45(6):2092−2100.
[46] 李冬梅,罗斯斯,张小平,等. 命名实体识别方法研究综述[J]. 计算机科学与探索,2022,16(9):1954−1968. doi: 10.3778/j.issn.1673-9418.2112109 LI Dongmei,LUO Sisi,ZHANG Xiaoping,et al. Review on named entity recognition[J]. Journal of Frontiers of Computer Science and Technology,2022,16(9):1954−1968. doi: 10.3778/j.issn.1673-9418.2112109
[47] 刘鹏,程浩然,王莹,等. 煤矿工种知识图谱智能问答研究[J]. 计算机技术与发展,2024,34(3):185−192. doi: 10.3969/j.issn.1673-629X.2024.03.027 LIU Peng,CHENG Haoran,WANG Ying,et al. Research on intelligent question answering based on knowledge graph of coalmine occupation[J]. Computer Technology and Development,2024,34(3):185−192. doi: 10.3969/j.issn.1673-629X.2024.03.027
[48] 焦凯楠,李欣,朱容辰. 中文领域命名实体识别综述[J]. 计算机工程与应用,2021,57(16):1−15. doi: 10.3778/j.issn.1002-8331.2103-0127 JIAO Kainan,LI Xin,ZHU Rongchen. Overview of Chinese domain named entity recognition[J]. Computer Engineering and Applications,2021,57(16):1−15. doi: 10.3778/j.issn.1002-8331.2103-0127
[49] 朱西平,肖丽娟,高昂,等. 基于MacBERT的碳中和实体关系联合抽取[J]. 数据分析与知识发现,2024,8(11):126−135. ZHU Xiping,XIAO Lijuan,GAO Ang,et al. MacBERT-based joint extraction of carbon neutrality entities and relationships[J]. Data Analysis and Knowledge Discovery,2024,8(11):126−135.
[50] 李鑫. 煤炭开发环节碳排放测算及低碳路径研究[J]. 煤炭经济研究,2021,41(7):39−44. LI Xin. Research on carbon emission calculation and low-carbon pathway in coal development[J]. Coal Economic Research,2021,41(7):39−44.
[51] 刘峰,郭林峰,赵路正. 双碳背景下煤炭安全区间与绿色低碳技术路径[J]. 煤炭学报,2022,47(1):1−15. LIU Feng,GUO Linfeng,ZHAO Luzheng. Research on coal safety range and green low-carbon technology path under the dual-carbon background[J]. Journal of China Coal Society,2022,47(1):1−15.
[52] 胡敏. 《煤电节能减排升级与改造行动计划(2014—2020年)》发布实施[J]. 炼油技术与工程,2015,45(1):42. HU Min. The action plan for upgrading and transformation of coal-fired power plant energy saving and emission reduction (2014—2020) was promulgated and implemented[J]. Petroleum Refinery Engineering,2015,45(1):42.
[53] 姚帆. 煤化工工艺中二氧化碳减排技术的应用探究[J]. 中国石油和化工标准与质量,2024,44(19):183−185. doi: 10.3969/j.issn.1673-4076.2024.19.061 YAO Fan. Application of carbon dioxide emission reduction technology in coal chemical process[J]. China Petroleum and Chemical Standard and Quality,2024,44(19):183−185. doi: 10.3969/j.issn.1673-4076.2024.19.061
[54] 秦勇,易同生,周永锋,等. 煤炭地下气化碳减排技术研究进展与未来探索[J]. 煤炭学报,2024,49(1):495−512. QIN Yong,YI Tongsheng,ZHOU Yongfeng,et al. Research progress and future study of carbon emission reduction for UCG[J]. Journal of China Coal Society,2024,49(1):495−512.
[55] 谢金龙. 煤矿采矿工程中的采矿工艺分析[J]. 内蒙古煤炭经济,2024(7):46−48. doi: 10.3969/j.issn.1008-0155.2024.07.017 XIE Jinlong. Analysis of mining technology in coal mining engineering[J]. Inner Mongolia Coal Economy,2024(7):46−48. doi: 10.3969/j.issn.1008-0155.2024.07.017
[56] 许家林. 煤矿绿色开采20年研究及进展[J]. 煤炭科学技术,2020,48(9):1−15. XU Jialin. Research and progress of coal mine green mining in 20 years[J]. Coal Science and Technology,2020,48(9):1−15.
[57] 钱鸣高. 绿色开采的概念与技术体系[J]. 煤炭科技,2003,24(4):1−3. doi: 10.3969/j.issn.1008-3731.2003.04.001 QIAN Minggao. Technological system and green mining concept[J]. Coal Sci-tech,2003,24(4):1−3. doi: 10.3969/j.issn.1008-3731.2003.04.001
[58] 康红普,李全生,张玉军,等. 我国煤矿绿色开采与生态修复技术发展现状及展望[J]. 绿色矿山,2023,1(1):1−24. KANG Hongpu,LI Quansheng,ZHANG Yujun,et al. Development status and prospect of greenmining and ecological restoration technology of coal mines in China[J]. Journal of Green Mine,2023,1(1):1−24.
[59] 侯荡. 我国煤炭资源绿色开采效率与保障对策研究[D]. 北京:中国矿业大学(北京),2021. HOU Dang. Research on green mining efficiency and guarantee mechanism of coal resources in China[D]. Beijing:China University of Mining & Technology-Beijing,2021.
[60] 钱鸣高,许家林,王家臣. 再论煤炭的科学开采[J]. 煤炭学报,2018,43(1):1−13. QIAN Minggao,XU Jialin,WANG Jiachen. Further on the sustainable mining of coal[J]. Journal of China Coal Society,2018,43(1):1−13.
[61] 汪莹,祖子帅,王振华. 基于智能化矿山数据分类与编码规范的元数据标准构建方法[J]. 工矿自动化,2024,50(7):130−135,146. WANG Ying,ZU Zishuai,WANG Zhenhua. A metadata standard construction method based on intelligent mine data classification and coding standards[J]. Journal of Mine Automation,2024,50(7):130−135,146.