基于传感器优化选择和数据驱动的质子交换膜燃料电池故障诊断

b0d369e43dca6575d5eb13b47a56a868.png

基于传感器优化选择和数据驱动的质子交换膜燃料电池故障诊断

61885b963e362565fa75ce596188f734.jpg

原文链接:

https://doi.org/10.1109/TEC.2022.3143163

前言

在过去的几十年里,替代能源受到了广泛的关注。在这些替代能源中,氢能源和燃料电池技术,尤其是质子交换膜燃料电池(PEMFC),因其功率密度高、工作温度低、响应速度快而备受关注。PEMFC在多领域中得到应用,然而其可靠性和耐用性仍然是大规模商业化过程中的两个重要阻碍因素。故障诊断,特别是在线故障诊断被认为是保证燃料电池系统安全运行的关键技术之一。为了实现PEMFC系统的在线诊断,必须考虑在线诊断方法的计算效率,因为在线诊断算法面对的通常是计算能力有限的嵌入式系统。另一方面,故障诊断的关键是从系统中收集和利用足够且可靠的信息,从历史研究中可知,不同的故障机制可能导致不同传感器的变化,使用多传感器可以为燃料电池故障提供更多可区分信息,因此对于复杂耦合系统的健康管理通常会在其上安装各类传感器,如电流传感器、电压传感器、热电偶、流量计、压力表、加湿传感器等,用以收集系统信息,这使得系统运行过程中形成高维数据集。

本研究提出一种基于传感器优化选择和人工神经网络(ANN)算法的PEMFC系统故障诊断方法。首先研究传感器历史监测数据中的信息,以选择对PEMFC系统状态变化更为敏感的传感器作为诊断模型的输入,这一过程通过对系统传感器数据的时-频域特征分析完成,经过优化选择后的传感器将不再包含对故障场景不敏感的变量类型,大幅度减少后续诊断用时。然后,基于Levenberg-Marquardt训练算法的反向传播神经网络(LM-BPNN)被训练用于故障识别与分类。最后还从实际应用出发分析讨论样本数据类型不平衡对于诊断结果的影响。

研究方法

本文提出的故障诊断方法流程如图1所示。首先为消除奇异样本的影响,对原始数据做归一化处理,接着对传感器历史监测数据做时-频域分析,分别提取其时域统计特征和小波包能量特征,如图2所示。

5bda45dfa38d2e897b209170e4efd9ef.jpg

图1. 利用多传感器数据进行PEMFC故障诊断的流程图

图2中横坐标数字分别对应表1中的传感器,与每个横坐标所对应的三种系统状态取值的区分度越大,则说明传感器对系统状态变化的响应越敏感,换言之,传感器和系统状态变化之间的相关性随着四个特征区分度的增加而增加。

8f5264f81fc225a755890531fdab82fe.png

图2. 20个传感器数据在PEMFC不同健康状态下的统计特征(a)均方根(b)标准差(c)偏态系数(d)峰度

为了更好地量化差值,研究中将其转换为二进制矩阵,按照十二个元素中被标记为1的比例将传感器划为三类。在频域分析中,使用三层小波包分解,并选定能量区分度以及鲁棒性最高的序号为7的小波包以作进一步分析。耦合时域及频域分析结果,将表1中序号为1、2、3、4、11、13、20的传感器滤除。

表1. PEMFC系统传感器监测量

7c04807e21b22c0554a316e364d61a2b.jpg

将经过优化选择后的其余监测数据作为输入量用以训练分类模型,在训练阶段分别采用了监督学习中常用的LM算法、SCG算法和RP算法。训练算法的目的是调整参数使损失函数最小化。为了评价参数的性能,选择均方误差(MSE)作为损失函数。结果如图3所示,从图中可以看出LM算法在训练过程中收敛速度更快且误差始终小于其它两类算法,这对于建立更加精准的故障分类模型,以及模型在实际使用过程中随数据积累增加后的更新迭代,都具有一定的实用价值。

ef2a8b5d2f9aaf868e18c41a3ec81a28.jpg

图3. 不同训练算法的学习曲线

为了验证所提出的传感器优化选择算法以及LM-BPNN模型的有效性,将分别选用两种被广泛应用的故障分类模型——支持向量机(SVM)和逻辑回归(LR),以及未进行传感器预选择的LM-BPNN模型来与之比较,为方便起见,将经过传感器优化选择后的诊断模型缩写为LM-BPNN,未经传感器预选择的诊断模型缩写为LM-BPNN-all。最终诊断结果如表2所示。

表2. 四种分类算法的诊断结果

ae4420122fcc68337d8ee0958f28edf8.jpg

从表中可见基于传感器优化选择的LM-BPNN模型具有最佳诊断效果,其准确率达到99.2%,精确率达到99.5%,召回率达到98.3%。较高的召回率表明,该模型对于系统故障的识别具有较高的敏感性,也就是说该方法可以诊断出绝大部分系统故障。作为故障检测与隔离中最常用的方法,SVM分类模型也取得了较好的效果,在诊断精度上达到了与LM-BPNN相当的水平。然而,其较低的召回率意味着SVM并不能很好地区分燃料电池系统的故障和未知状态,也就是说其较高的诊断精确率实际上是对于系统健康状态的正确识别所造成的,由于健康状态(也就是系统正常运行状态)在数据集中占比较大,因此容易达成较高的诊断精确率。另外,SVM作为一种中小样本的学习方法,其时间成本随着训练数据样本量的增加而迅速增加,这使得它在高纬度、大样本容量的数据集处理上具有一定的局限性。

f2443f35fc9ad31165a156ce2a39ef25.jpg

图4. 不同训练样本大小对诊断结果的影响

最后还探讨了训练样本大小及数据集比例对诊断结果的影响,结果表明,想要获得良好的在线诊断效果在进行模型离线训练时,除了要积累更多的系统历史数据用作训练样本,同时也要注意数据质量以及数据的平衡。