陈家超, 陈庆奎
(上海理工大学 光电信息与计算机工程学院, 上海 200093)
随着信息化产业快速发展,智能设备的规模不断增长、集成化水平也在提升,故障发生已然成为一种常态[1],例如无人机传动器故障[2]、铁路牵引器故障[3]、同步发电机滤波器故障[4]等。
车载终端是提供车辆位置信息、视频监控等功能的智能设备[5],由于设备运作时间长,且经常受到车辆行驶颠簸等环境因素的影响,其内部功能模块容易产生损耗,从而引发故障,例如:定位模块故障、4G 模块故障等。
本文将车载终端传感数据的异常或丢失作为证据,行车异常事件作为现象,建立包含证据、现象和故障的分层模型。
传感数据易受信号干扰,为了减少故障误报,保证模型的容错能力,结合模糊逻辑与累计度变化规律构建知识库,通过知识库中的规则[6-7]实现由若干种证据累计形成现象、再由若干种现象累计形成故障的推导过程,从而有效检测车载终端故障。
考虑到根据专家经验设置的规则初始参数存在估计偏差,在模型运行过程中采用修正算法动态调节参数,进一步提升模型的可靠性。
现阶段,工人仍然采用定期巡检的方式来维护车载终端,导致故障发现不及时,整体检测效率较低,该模型减少了工人巡检大批设备所需的工作量,能够可靠检测设备故障,因此具有重要的实际意义。
模糊逻辑与传统二值逻辑相比,更符合人对客观事物的思维认知,能够针对具备模糊不确定性概念的问题给出有效解决方法,在故障检测及故障诊断领域中被广泛使用。
文献[8]提出一种基于模糊逻辑的输电网络定向接地故障检测方法,将电压测量数据匹配模糊规则,从而实现故障分类检测。
文献[9]提出一种基于直觉模糊脉冲神经P(IFSNP)系统的设计方法,能够有效诊断电力系统中复杂故障的成因。
文献[10]提出一种融合多尺度模糊熵的特征提取方法,实现了旋转机械的轴承故障诊断。文献[11]针对道路施工装备存在故障人工处理难度大、成本高等问题,采用T-S 模糊故障树实现了基于GPRS 网络的远程故障诊断系统及方法。
文献[12]提出一种将多分辨率分析与模糊-ARTMAP 神经网络相结合的方法,实现了电气设备故障的检测及分类。
文献[13]提出一种神经网络与模糊PID控制相结合的方法,从控制角度定位自动驾驶车辆的执行器故障。
本文的故障检测模型区别于上述文献,通过对证据、现象和故障三种事件类型进行定义,采用累计的方式实现模型分层推导,并以此检测车载终端故障,其特点包括:
(1)具有包含证据、现象和故障的分层结构,相比神经网络的“黑箱”模型[14],整个故障推导过程更加清晰,可解释性更强。
(2)针对若干种证据形成现象、若干种现象形成故障的变化规律,根据不同时间粒度实现累计,使故障检测过程更具层次性。
(3)结合反馈结果修正模型参数,通过运行时参数的不断优化,提升了模型的可靠性。
分层故障检测模型的总体结构如图1 所示。
首先,对时间段内的若干种证据进行累计,并计算相应的证据累计度;
其次,为证据累计度设置关联权重,匹配证据-现象规则并推导现象;
然后,结合现象反馈动态修正证据-现象规则;
最后,通过若干种现象同理推导故障,并动态修正现象-故障规则。
图1 分层故障检测模型总体结构Fig. 1 Overall structure of layered fault detection model
2.1 分层模型事件
分层模型包含若干种事件,例如:GPS 定位数据异常、车辆不定位、定位器模块故障等。
按不同事件类型将其分为证据、现象和故障。
对此拟做阐释分述如下。
(1)证据:车载终端提供多种传感数据,且不同数据类型具备相应的传输协议,当数据不满足协议传输标准时产生证据。
证据按性质可分为异常类证据和丢失类证据,前者表示传感数据不符满足协议约定的数值范围,后者表示传感数据不满足协议约定的数据传输频次。
例如:协议标准要求GPS 定位数据不能超过行驶线路sm 的范围外,若当前GPS定位数据超出该范围,形成“GPS 定位数据异常”证据;
协议标准要求每ts 完成一次通讯链路数据上传,若远端未能在规定时间内接收到该数据,形成“通讯链路数据丢失”证据。
(2)现象:现象表示车辆或设备的异常工作状态,例如:车辆定位漂移、视频监控图像闪烁等。
若干种证据频繁出现时可以说明现象产生。
例如:“GPS定位数据异常”证据和“通讯链路数据丢失”证据频繁出现时,可以说明“车辆定位漂移”现象产生。
(3)故障:车载终端包含多个传感模块,例如:定位模块、通讯模块等。
若干种现象频繁出现时可以说明故障产生。
例如:“车辆定位漂移”现象和“车辆不定位”现象频繁产生时,可以说明“定位模块”故障产生。
2.2 累计度计算
累计度表示时间片段中同一事件的累计数量程度,根据事件的不同类型,分为证据累计度和现象累计度。
设时间片段W大小为p,证据类别数为n,对于第j种证据Cj(1 ≤j≤n),建立累计窗口SWj,并将W划分为q个等长子片段,SWj={sj,ta,sj,ta+1,…,sj,ta+q}(a≥1),其中ta表示W中的第a个子片段(1 ≤a≤q),sj,ta表示ta中证据Cj的产生标志,若证据Cj产生,sj,ta=1;
否则sj,ta=0。
统计SWj中q个子片段的证据产生标志,可知证据Cj的总累计数。在长度为p的时间范围内,根据专家经验估计证据Cj的总累计数λj,p, 记证据Cj对应的累计度为cj,SWj中cj的计算方法如式(1)所示:
其中,sum表示SWj中所有sj,tq的数值总和。
车载终端传感数据具备时效性,SWj中证据的产生标志随着时间片段变化不断更新,证据累计度亦不断更新。
若初始状态下SWj={sj,t1,sj,t2,…,sj,tq},在当前时刻超出子片段tq作用的时间范围时,第t1个子片段中证据Cj的产生标志sj,t1失效,同时形成第tq+1个子片段,对应证据Cj的产生标志sj,tq+1,此时SWj更新为{sj,t2,sj,t3,…,sj,tq+1}。
累计窗口SWj在时间轴上的位置动态变化,其不断移动的过程实现了证据累计度的连续计算。
通过统计时间片段中的现象产生标志可以完成现象累计度的连续计算,其计算方法和累计窗口更新过程同理。
2.3 知识库结构及规则推导
2.3.1 知识库结构
知识库是用于表示事件之间关联的集合[15],对于证据、现象和故障三种事件,集合包含了证据与现象,以及现象与故障之间的多对多关联及对应关联的强弱。
证据与现象之间存在多对多关联,在表1 证据与现象的示例中,“GPS 定位数据异常”证据和“通讯链路数据丢失”证据可能与“车辆定位漂移”现象有关,也可能与“车辆不定位”现象有关。
证据与现象之间存在关联强弱,例如:“GPS 定位数据异常”证据与“通讯链路数据丢失”证据相比,前者对“车辆定位漂移”现象的关联更强,而后者对“车辆不定位”现象的关联更强。
表1 证据与现象示例Tab. 1 Evidence and phenomenon samples
记证据和现象的类别数分别为n和m,对于第j种证据Cj与第i种现象Di(1 ≤j≤n,1 ≤i≤m),采用关联权重αi,j来表示证据Cj与现象Di之间的关联强弱,其满足约束条件越大表示关联越强;
反之亦然。
当αi,j=0 时,说明证据Cj与现象Di之间不存在关联;
当0<αi,j<1 时,说明证据Cj与现象Di之间存在关联;
当αi,j=1 时,说明证据Cj与现象Di之间是唯一关联。
若干种证据通过累计形成现象,当证据累计度不足时,对应现象无法产生,例如:“GPS 定位数据异常”证据与“通讯链路数据丢失”证据的累计度都很低时,说明证据没有频繁出现,该情况下现象不会产生。
根据式(1)中证据累计度cj的计算方法,当SWj中证据Cj的产生数量和专家估计值相同时,标准累计度值为1,此时证据Cj相对于现象Di的标准加权累计度可以直接表示为αi,j。
累计度并不是精确的、固定的,其取值大小具备模糊不确定性[16-17],即累计度可能稍高,也可能稍低。
记bi,j为αi,j的初始中心偏移量,为加权累计度阈值区间,bi,j]。
证据-现象规则结构如式(2)所示:
其中,“⊕”表示若干个证据条件项之间的“与”关系,ωi表示现象Di产生的可能性,即现象Di的可信度,其满足0<ωi≤1。
现象与故障之间存在多对多关联,在表2 现象与故障的示例中,“车辆定位漂移”现象和“车辆不定位”现象可能与“定位模块”故障有关,也可能与“4G 模块”故障有关。
现象与故障之间存在关联强弱,例如:“车辆定位漂移”现象与“车辆不定位”现象相比,前者对“定位模块”故障的关联更强,而后者对“4G 模块”故障的关联更强。
表2 现象与故障示例Tab. 2 Phenomenon and fault samples
现象-故障知识库由若干条现象-故障规则组成,其结构与证据-现象知识库同理。
2.3.2 规则推导
若干种证据计算加权累计度后匹配证据-现象规则。
当n种证据的加权累计度分别隶属于加权累计度阈值区间时,认为该规则的条件生效,得到ωi可信度的现象Di。在证据-现象知识库中存在使多条规则同时生效的情况,进而导致多种现象同时形成。
设置数量阈值e(1 ≤e≤m),表示选取最可能产生的e种现象。
由于证据累计度的浮动偏差会影响现象实际产生的可能性。
记第i种现象的加权可信度为的区间上限为, 区间下限为。α^i,j越接近,说明现象Dj越可能产生,对应的取值也就越大。
将的重要度记作βi,j,βi,j的计算方法可写为如下公式:
2.4 规则动态修正
(1)扩张法。
用于增大加权累计度分布点覆盖范围,提升规则适用性,即保持覆盖范围中心不变,减小的同时增大,如图2 所示;
但若覆盖范围过大,则会掺杂较多的异常分布点,导致规则准确性降低。
图2 采用扩张法修正阈值区间Fig. 2 Using expansion method to modify the threshold interval
(2)收缩法。
用于减小加权累计度分布点覆盖范围,提升规则准确性,即保持覆盖范围中心不变,增大的同时减小,如图3 所示;
但若覆盖范围过小,则会遗漏较多的正常分布点,导致规则适用性降低。
图3 采用收缩法修正阈值区间Fig. 3 Using shrinkage method to modify the threshold interval
图4 平移法修正阈值区间Fig. 4 Using translation method to modify the threshold interval
现以证据-现象规则为例,根据3 种阈值区间修正方法,给出加权累计度阈值区间,j的修正算法迭代步骤:
Step 1首先,将区间 [0,1] 等分为r段,每个子区间的大小为,将其作为区间单侧扩张或收缩的步长。
然后,在各子区间中初始化区间计数器tcnt、fcnt及循环计数器qnt, 初始值均为0。将第k(1 ≤k≤r) 个子区间对应tcnt、fcnt记作tcntk,fcntk。
其中,tcntk用于统计正常分布点命中了第k个子区间的次数;
fcntk用于统计异常分布点命中了第k个子区间的次数。
最后,建立集合S存放中的正常分布点,执行Step 2。
Step 2根据累计窗口SW计算若干种证据的累计度,并根据加权累计度匹配证据-现象规则。当通过规则推导出现象时,qnt =qnt +1,同时由专家确认该现象是否实际发生。
若实际发生,将该添加到集合S中,若其对应第k个子区间,tcntk=tcntk+1;
若实际未发生,fcntk=fcntk+1。由于初始状态下的个数较少,无法有效估计点位分布情况,因此重复执行Step 2,直到qnt满足迭代启动阈值QTHRESHOLD,执行Step 3。
Step 3假设当前,分别对覆盖 范 围 下 的 若 干 个tcnt和fcnt求 和。
若>ωi,说明的覆盖范围较小,采用扩张法增大覆盖范围,执行Step 4;
若<ωi,说明的覆盖范围较 大 或 覆 盖 范 围 中 心 偏 离, 执 行 Step 5;
若,执行Step 8。
Step 4以ε的步长扩张区间上下限,扩张后阈值区间为[hs- ε,hl+ε], 且满足约束条件hs- ε≥0,hl+ε≤1。
然后,执行Step 8。
Step 5在左半区间和右半区间中 分 别 统 计sum(tcnt), 记 作lsum(tcnt) 和rsum(tcnt) 。
若或时,说明正常分布点主要集中在区间左侧或右侧,采用平移法更新的覆盖范围中心,执行Step 6,其中T表示比例阈值,T越接近1,说明分 布 越 均 匀;
若且时,说明正常分布点并未出现左偏或右偏的情况,采用收缩法减小覆盖范围,执行Step 7。
Step 6在集合S中查找隶属于当前的若干个分布 点并计 算覆盖 范围中 心,记S =, 更 新 后 的 中 心 点 为, 平 移 后 的 阈 值 区 间 为,且满足约束条件1。
然后,执行Step 8。
Step 7以ε的步长收缩区间上下限,收缩后的阈值区间为[hs+ε,hl- ε], 且满足约束条件hs+ε≤hl- ε。
然后,执行Step 8。
Step 8将循环计数器qnt置为0,本轮修正结束,开始下一轮迭代,执行Step 2。
3.1 实验数据集及准备工作
3.1.1 实验数据集
实验数据集由某车载终端公司提供,包含100台车载终端的300 日历史数据,数据类别有:GPS 数据、到离站数据、通讯链路数据和DVR 数据。
表3、表4 和表5 分别就不同数据类别给出证据、现象和故障的实例。
表3 证据实例Tab. 3 Evidence examples
表4 现象实例Tab. 4 Phenomenon examples
表5 故障实例Tab. 5 Fault examples
3.1.2 准备工作
这里,结合专家经验初始化证据-现象知识库和现象-故障知识库中若干条规则的标准加权累计度和中心偏移量,参数见表6、表7,表6、表7 的每行代表规则,其中αi(1 ≤i≤6) 表示规则中第i个条件项对应的初始权重,ω表示可信度。
初始权重的中心偏移量b均设置0.1。
以表7 中的现象-故障知识库中的规则No.1 为例,即表示当“车辆定位漂移”现象的加权累计度在0.3 ~0.5 范围内,且“车辆不定位”现象的加权累计度在0.5~0.6 范围内时,产生“定位模块”故障的可信度为0.8。
表6 证据-现象知识库初始参数Tab. 6 Evidence-phenomenon knowledge base initial parameters
表7 现象-故障知识库初始参数Tab. 7 Phenomenon-fault knowledge base initial parameters
3.2 评价指标
3.2.1 区间偏差率
区间偏差率是衡量阈值区间修正前后偏差程度的单位。
记初始阈值区间为[a,b],修正后的阈值区间为[c,d]。
阈值下限偏差LB、 阈值上限偏差HB的计算方法可用式(6)、式(7)来表示:
根据LB和HB计算区间偏差率BR,研究推得公式为:
3.2.2 查准率和查全率
模型的可靠性通过知识库中规则的查准率PC和查全率RC来体现。
对于证据-现象知识库,其评价指标具体描述如下:
车辆从起点场站行驶至终点场站的时间片段称为全程。
将车载终端历史数据按全程进行划分,设全程数为M,现象类别数为N,对于第i次全程中的第j种现象(1 ≤i≤M,1 ≤j≤N),γi,j表示规则推导出的现象结论。
当通过规则得出现象时,γi,j=1,否则表示实际的现象结论,当实际现象存在时,,否则。
真正例TP、 假正例FP、 假反例FN和真反例TN的计算方法的数学公式可写为:
其中,A∈{TP,FP,FN,TN}。
当γi,j=1 且时,TPi,j=1;
当γi,j=1 且时,FPi,j=1;
当γi,j=0 且时,FNi,j=1;
当γi,j=0 且时,TNi,j=1。
平均查准率和查全率的计算方法可用式(10)、式(11)进行描述:
对于现象-故障知识库,将车载终端历史数据按日进行划分,其评价指标的计算方法同理。
3.3 实验结果
实验涉及4 种现象和3 种故障,对于多条证据-现象规则同时生效时的数量阈值e, 将e设置为4,表示选取所有可能产生的现象;
对于现象-故障规则,将e设置为1,表示只选取最可能产生的故障。经过前期测试,加权累计度阈值区间的子区间大小ε设置为0.01,比例阈值T设置为2,即两侧分布点在呈现2 倍数量差时认为出现了左偏或右偏。
图7 证据-现象规则No.1 的1,3阈值区间Fig. 7 Evidence-phenomenon rule No.1 for threshold interval1,3
根据60 台车载终端的300 日历史数据,分别以证据-现象规则No.1 和现象-故障规则No.1 为例,当αi,j≠0 时(αi,j即规则No.j对应的αi),给出2种规则在20 次迭代过程中加权累计度阈值区间的修正过程,图5 ~图8 展示了证据-现象规则No.1 中各条件项对应阈值区间的变化。从图5 中可知,对于“GPS 定位数据异常”证据的加权累计度阈值区间1,1, 在第1 次和第2 次迭代修正后,由于若干个实际加权累计度分布点1,1在1,1中散布得较为均匀,且通过算法得出的可信度未达到初始可信度取值0.8,因此区间发生了收缩;
在第3 次迭代修正后,阈值上下限和中心位置都呈现相同幅度的增长,这是因为此时1,1主要集中于1,1的右侧区间,即分布点右偏,因此中心位置发生了平移;
在第7 次迭代修正后,可以看出阈值下限减小、阈值上限增大,说明通过算法计算出的可信度已经超过了0.8,认为1,1收缩得过小,因此区间发生了扩张。
图8 证据-现象规则No.1 的1,4阈值区间Fig. 8 Evidence-phenomenon rule No.1 for threshold interval1,4
图6 证据-现象规则No.1 的1,2阈值区间Fig. 6 Evidence-phenomenon rule No.1 for threshold interval1,2
表8 证据-现象知识库的阈值区间修正结果Tab. 8 Results of threshold interval modification of evidencephenomenon knowledge base
图9 和图10 展示了现象-故障规则No.1 中各条件项对应阈值区间的变化,表9 展示了现象-故障知识库在20 次迭代后的阈值区间修正结果、即。
迭代修正过程的解释同理,不再赘述。
表9 现象-故障知识库的阈值区间修正结果Tab. 9 Results of threshold interval modification of phenomenonfault knowledge base
图9 现象-故障规则No.1 的1,1阈值区间Fig. 9 Phenomenon-fault rule No.1 for threshold interval1,1
图10 现象-故障规则No.1 的1,2阈值区间Fig. 10 Phenomenon-fault rule No.1 for threshold interval1,2
根据40 台车载终端的300 日历史数据,结合相关评价指标给出规则阈值区间修正前后的对比分析。
表10 展示了针对证据-现象知识库的各阈值区间实验结果,对于每种现象,第一行数据是采用初始阈值区间得出的评价指标,第二行是采用修正后阈值区间得出的评价指标,其中,AVG(BR) 表示规则各条件项区间偏差率的平均值。
表10 证据-现象知识库相关评价指标对比结果Tab. 10 Comparative results for related evaluation indicators of evidence-phenomenon knowledge base %
观察表10 的第二列数据可以发现,修正后的查准率更高,通过平均区间偏差率AVG(BR) 可知,当偏差率越高时,查准率修正后的增幅越大,这说明专家经验给出的初始参数准确性较低,而对区间进行修正后,通过规则推导出的现象更为准确,即更接近专家给出的可信度(表6 中的ω)。
表10 的第三列数据表示修正前后的查全率,总体变化幅度不大,对于“车辆不定位”现象(Y2) 和“车辆监控无图像”现象(Y4), 查全率有所下降,这是因为准确率较高时,规则往往会忽略距离集中分布范围较远的数值点,造成规则泛化能力的下降。
表11 展示了现象-故障知识库中各规则阈值区间修正前后的实验对比结果,表中相关数据的解释同理,不再赘述。
表11 现象-故障知识库相关评价指标对比结果Tab. 11 Comparative results for related evaluation indicators of phenomenon-fault knowledge base %
根据表10 和表11 中修正后的规则阈值区间,分别统计现象和故障的查准率和查全率,模型在当前数据集上的现象平均查准率和查全率约为85%和69%,故障平均查准率和查全率约为81%和72%,对比修正前的评价指标计算结果(现象平均查准率和查全率约为75%和70%,故障平均查准率和查全率约为73%和72%),修正前后平均查全率相接近,平均查准率显著增长,能够说明模型可靠性的提升。
本文通过统计时间片段中的若干种证据实现证据累计度计算;
对证据累计度设置关联权重,结合模糊逻辑实现规则匹配与现象推导;
根据修正算法动态调整规则的阈值区间。
若干种现象推导故障与修正规则的过程同理。
模型通过证据、现象和故障之间的累计变化规律,实现车载终端故障检测,且在运行过程中不断修正参数,在现有数据集上具备较好的表现效果。
作为初步研究结果,仍有部分问题有待探究,如规则可信度调整问题,规则扩充与筛选问题等。
猜你喜欢知识库修正区间你学会“区间测速”了吗中学生数理化·八年级物理人教版(2022年9期)2022-10-24Some new thoughts of definitions of terms of sedimentary facies: Based on Miall"s paper(1985)Journal of Palaeogeography(2022年1期)2022-03-25修正这一天快乐语文(2021年35期)2022-01-18合同解释、合同补充与合同修正法律方法(2019年4期)2019-11-16全球经济将继续处于低速增长区间中国外汇(2019年13期)2019-10-10基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用制造技术与机床(2019年6期)2019-06-25软件修正摄影之友(影像视觉)(2017年1期)2017-07-18高速公路信息系统维护知识库的建立和应用中国交通信息化(2016年9期)2016-06-06区间对象族的可镇定性分析北京信息科技大学学报(自然科学版)(2016年6期)2016-02-27基于Drupal发布学者知识库关联数据的研究图书馆研究(2015年5期)2015-12-07