MEASUREMENT

发布时间:2025-06-28 19:56  浏览量:2

Qiao, L., Li, X., Wang, X., & Peng, K. (2024). Root cause diagnosis and fault propagation path identification for complex industrial processes based on data space.Measurement226, 114219.

PART.00文章信息

期刊信息:

MEASUREMENT(中科院2区, JCR 1, IF=5.6)

作者单位:

Key Laboratory of Knowledge Automation for Industrial Processes of Ministry of Education, School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing, 100083, PR China

Department of Management and Information Technology , Ansteel Group Co., Ltd, Anshan, Liaoning Province, 114003, PR China

Key Laboratory of Metallurgical Industry Safety Risk Prevention and Control of Ministry of Emergency Management, University of Science and Technology Beijing, Beijing, 100083, PR China

DOI:

10.1016/j.measurement.2024.114219

PART.01摘要

故障诊断在确保工业安全和提高社会效益方面发挥着至关重要的作用。然而,由于过程耦合和复杂的流程,准确识别故障路径变得具有挑战性。本文提出了一种基于数据的故障诊断和路径识别方法。它涉及通过从数据中提取因果关系来构建多层、多因果的数据空间。基于注意力的卷积神经网络有效地捕捉了因果关系。修剪和专业知识有助于构建一个精致的结构。使用LSTM最小二乘法(OLS)确定故障传方向,有助于快速定位问题。对浮法玻璃生产和田纳西伊士曼公司的实验验证显示了显著的结果,支持提高工业过程的可靠性和效率。

Index Terms—数据空间、卷积神经网络、层次因果图、故障路径识别、根本原因诊断

PART.02背景与贡献

现代工业的技术发展逐渐成熟,工业过程日益一体化。工业过程中有许多相互作用的回路,一旦回路中的某个设备发生异常,就会导致回路中其他设备的变化,甚至可能导致一系列衍生故障,如设备瘫痪。只有及时发现故障的传播路径,有效抑制故障的传播,才能确保工业设备的安全稳定运行。由于生产过程中会收集大量分布式数据,如何有效地管理和使用这些数据在故障跟踪中尤为重要,因为传统数据库无法对各种数据进行统一存储和管理,也无法挖掘数据之间的联系。为了解决这些挑战,提出了数据空间的概念,并在数据空间中实现了数据存储和数据挖掘之间的连接,并在此基础上进行了故障跟踪。

数据空间最早由中山大学孙伟教授于2013年提出,是底层框架整个对象生命周期的分布式多标签数据存储。在数据空间建模方面,跨组织数据空间[1]通过层次结构处理数据关系、关联和应用程序,基于语义的异构数据管理[2]通过语义解释词汇将用户语义与数据连接起来;链接数据空间[3]结合异构数据来映射数据空间,并强调数据关系的重要性。这三个构建的模型分别侧重于层次处理、语义关联和链接数据,并为处理不同的数据结构和关系提供了多种有效的方法。在数据空间的具体实现方面,采用元数据提取来感知数据空间[4],通过建立数据关系和数据服务映射有效地组织多源异构数据。基于本体的数据访问框架[5]用于数据集成、存储、语义查询和知识推理。工业数据空间[6]以过程工件为中心,通过知识模式描述和去中心化数据仓库连接去中心化的数据库和知识模式。这些实现方法不仅有助于数据的统一表示和管理,而且为数据的语义理解和跨源关联提供了有效的解决方案。一般来说,当前的数据空间侧重于多维异构数据的集成和统一管理。随着现代工业在自动化、信息化和智能化方向上的快速发展,生产过程中将产生大量多维异构数据。因此,有必要分析和研究工业过程数据空间的结构,挖掘数据之间的因果关系,分析和训练收集到的数据,并确定数据之间的原因关系。为工业过程的故障追踪奠定了良好的基础。

目前,故障追踪方法主要包括知识库方法、数据驱动方法和组合方法。基于知识的方法是指通过已知的过程知识、专家经验和机制模型,对工业过程中存在的相关性和因果关系信息进行分析和挖掘,从而建立过程拓扑模型,实现故障根诊断和传输路径识别。主要有符号图方法[7]、Petri网[8]、故障树方法[9]和多层流模型方法[10]。对于复杂的工业过程,这些方法难以有效地建模和判断变量的因果强度。基于数据的方法使用历史数据来挖掘变量之间的关系,以构建故障诊断和路径识别的因果拓扑图[11-13]。其中,GrangerCausality(GC)、贝叶斯网络(BN)和转移熵被广泛使用,这些方法大多是针对平稳时间序列开发的。目前,它在非平稳方面也得到了多次应用。Chen等人[14]通过将高斯过程回归与多元GC方法相结合实现了非平稳根诊断。Li等人[15]通过在动态时间积分和GC上发现的方法实现了非稳态过程的故障跟踪。这些方法可以挖掘工业过程的非平稳特征信息,并破坏非平稳过程的因果关系,但大多数计算相对复杂。

基于知识和数据驱动的质量异常根诊断和跟踪方法有效地融合了上述两种方法的优点[16-18]。Lobato等人[19]将非线性因果关系嵌入到扩展特征空间中,从而可以使用线性模型进行因果引用。Han等人[20]在图神经网络模型中添加了一个过程知识约束项,使构建的因果图与实际领域知识相匹配,解决了因果发现中的边缘冗余问题。Peng等人[2l]提出了一种基于特征融合的故障检测和评估方法,该方法结合了数据的全局-局部特征。通过比较分析,该方法比分析单一特征结构具有更精确的检测。Zhang等人[22]提出了一种基于改进的Hessian局部线性嵌入的非线性过程监测和性能评估方法,旨在解决工业数据中普遍存在的高维性和强非线性问题。目前,大多数方法都是基于过程知识和历史数据分析来提取变量之间的因果关系,以构建原子图。当故障发生时,使用全局搜索策略来识别故障传播路径。在构建因果图方面,传统的因果推理方法可能受到线性假设或特定函数形式的限制,这限制了对非线性关系建模的能力[19]。随着数据维数的增加,传统方法面临着维数灾难,导致计算和推理困难[23]。一些传统方法可能需要手动选择特征或假设因果关系。在现实世界中,准确性并不总是可靠的[24]。随着深度学习的兴起,因果分析领域的研究倾向于使用深度神经网络来捕捉复杂的因果关系。Nauta等人[25]提出了时间因果发现框架(TCFD),该框架使用基于注意力的因果卷积神经网络从多个变量中提取非线性因果关系。Tank等人[26]探索了使用分量神经网络发现因果关系的方法。Chen等人[27]提出了稀疏残差卷积神经网络(SCRNN),旨在同时分析多个lagstages中的线性和非线性因果关系。此外,Tang等人[28]提出了一种深度因果图(DCG)建模方法,该方法使用多层感知器(MLP)和门控循环单元(GRU)为每个过程变量建立概率预测模型,并在模型中引入一组稀疏惩罚项来自动检测变量之间的因果关系。这些新方法可以避免传统方法的局限性。卷积神经网络具有更强的非线性建模能力,可以在数据中捕捉复杂的非线性因果关系[29]。这种网络可以适应从数据中学习因果关系,而无需严格的假设或预先指定的模型结构,使其在处理复杂的现实世界因果关系时更加灵活,并更好地处理高维数据[30],特别是具有大量特征或变量的数据集。传统的故障传播路径识别的全局搜索方法可能需要大量的计算资源和时间[31],在搜索过程中很容易陷入局部最优解,特别是当搜索空间大而复杂时,可能会错过全局最优故障路径[32]。然而,将递归神经网络与传统的故障识别方法相结合,不仅可以节省时间和资源,还可以提高获得最优故障路径的机会。这种融合为因果分析提供了更多机会,可以更有效地处理多个变量之间的复杂关系,并提高路径识别的准确性。因此,本文以实际生产中的这些复杂特征为出发点,提出将基于注意力的卷积神经网络集成到数据空间中,构建层次因果图,并借助递归神经网络识别故障路径,从而提高路径识别的准确性,增强因果分析的可解释性。当通过数据空间生成的多级因果图进行路径识别时,LSTM和OLScan的结合有效地处理了上游原因变量中多个影响变量的情况。我们使用LSTM来预测影响变量,并充分考虑预测精度对路径识别的重要性。这使得我们的方法能够更好地适应工业过程的复杂性和可变性。引入OLS来测量预测值和真实值之间的角度差,从而测量因果关系强度,然后进行路径识别。这些特征被整合到我们的方法中,突显了它在处理复杂工业场景方面的优势。因此,本文的主要贡献如下:

本文提出了一种基于数据空间的根诊断和故障路径识别方法,挖掘过程数据中的隐藏关系,准确识别故障传播路径和故障原因。

建议构建一个多层多因果数据空间,可以确定直接因果关系并消除间接因果关系。同时,多层因果图对于实际行业中的根本原因诊断更具可解释性。

提出了一种基于LSTM-OLS的故障路径识别方法,该方法不仅可以有效地去除冗余连接,还可以通过上游自变量和下游影响变量之间的因果强度来找出传播方式。

PART.03实验PART.04总结

本文提出构建多层多因果数据空间,用于根本原因诊断和故障路径识别。对于如此复杂的过程,数据呈现出多维、多阶段和多源的分布,只有通过使用数据空间,才能对收集到的数据进行管理、关联挖掘和有效利用,以实现研究目标。基于分布式传感器数据和过程参数等数值数据,构建了全局因果图,其中不仅包含正确的因果关系,还包含间接甚至错误的因果关系。因此,需要对因果图进行修剪,并根据调度信息和专家经验等知识数据将其划分为局部因果图。LSTM和least-square linearity用于在构建的因果图中找到故障传播的方式。这种方法可以更有效地去除间接因果图中的其余连接,简化因果图,更好地满足实际需求。