秦 静,马雪倩,高福杰,季长清,3,汪祖民*
(1.大连大学 软件工程学院,辽宁 大连 116622;
2.大连大学 信息工程学院,辽宁 大连 116622;
3.大连大学 物理科学与技术学院,辽宁 大连 116622)
帕金森病(Parkinson"s Disease,PD)是患者数量仅次于阿尔茨海默症(Alzheimer"s Disease,AD)的年龄相关性和神经退行性疾病[1]。1817 年,James Parkinson 在他的专著Essay on the Shaking Palsy中描述了PD 的相关核心临床特征[2],PD因此而得名。据统计,全世界有700 多万人患有PD[3]。PD在50 岁之前的人群中发病率较低,但是自60 岁之后,PD 发病率会增加5~10 倍。预计2030 年,全球将有900 万人患有PD[4]。随着病情的发展,PD 患者会因为身体机能丧失和行动受限而产生各种不良的情绪,进而影响患者的身体状况。PD 早期难以发现,容易被忽视,导致错过最佳的治疗时间,且PD 病程长、致残率高,目前尚无有效的治疗方法,给患者家庭和社会带来的负担极为沉重。
Niyogi 等[5]最早利用步态信息作为特征进行身份识别,此后,步态识别得到快速的发展,并涌现出大量的步态识别方法[6]。近年来,研究人员逐渐将步态分析应用于PD 的智能诊断。目前,学术界已有不少基于步态分析的PD 诊断相关综述文章,但大多数是对步态分析方法的某一方面的概述,并没有进行全面系统的归纳。例如,文献[7-8]中只回顾了可穿戴设备在评估PD 患者步态时空参数的应用,归纳了可穿戴设备在检测患者步态冻结和跌倒的应用研究,忽略了非可穿戴设备在PD 诊断上的应用;
同时,现有的基于非可穿戴设备的步态分析方法的综述文章较少。为了弥补上述不足,本文总结了基于步态分析的PD 辅助诊断方法,对近年关于步态分析的文献进行了汇总和分析,讨论了PD 的严重性及异常步态的特征,将基于步态分析的PD 辅助诊断方法分为基于可穿戴设备的方法和基于非可穿戴设备的方法,并且针对现有步态分析方法存在的问题指明了未来的发展趋势。图1 为本文基于步态分析的PD 辅助诊断方法的整体框架。
图1 基于步态分析的PD辅助诊断方法Fig.1 Auxiliary diagnosis methods of PD based on gait analysis
步态分析是一种有效的生物特征识别方式,它可以通过人体走路的姿势识别人体身份。正常的步态具有周期性和节奏性,而异常步态特征十分复杂;
研究表明,使用时空、运动学参数可以有效识别PD 患者的异常步态[3]。根据临床表现可以将异常步态分为偏瘫步态、截瘫步态和慌张步态等,而PD 则会出现慌张步态的症状[9]。PD 患者的运动性障碍主要包含4 种:静止性震颤、僵硬、运动迟缓和姿势不稳定[7]。与健康对象相比,PD 患者会出现步态变化,如步幅缩短、行走时速度变慢和步频加快。随着疾病的发展,这些步态障碍会更加突出,甚至导致患者的跌倒,从而产生较多负面影响,如受伤、活动能力下降等[10],严重会导致骨折,甚至威胁生命安全。
传统的PD 治疗方案主要包括手术、药物或者是积极的身心锻炼[11]。在临床上,专业医生会利用运动康复评估中常用的评价量表统一帕金森氏病评定量表(Unified Parkinson’s Disease Rating Scale,UPDRS)[12]、步态冻结量表(Freezing of Gait Questionnaire,FoG-Q)[13]、新步态冻结量表(New FoG-Q,NFoG-Q)[14]、功能性步态评价(Functional Gait Assessment,FGA)量表[15]、站立行走(Time Up and Go,TUG)测试[16]和H&Y 量表(Hoehn and Yahr scale)[17]等评判PD 患者的运动障碍。整个过程会因医生的主观判断造成评估结果差异。
随着技术的快速发展,方便、可穿戴的传感器已经能够集成到临床应用和日常生活活动中[18]。加速度、陀螺仪和磁强计等传感器可作为惯性测量单元(Inertial Measurement Unit,IMU)单独或组合使用,已成为基于室内量化步态模式方法的常见替代方法[19]。此外,基于视觉的步态识别方法通过PD 患者行走的视频序列,从视频中准确提取患者的步态特征,评估PD 患者的步态[20]。图2 为基于步态分析的基本步骤。
图2 步态分析的基本步骤Fig.2 Basic steps of gait analysis
可穿戴传感器由于体积小、功耗低、准确率高和便于穿戴等特点,可长时间地动态监测PD 患者,在PD 早期诊断、鉴别诊断和病情评估等方面具有重要的意义。
2.1 可穿戴设备步态数据集
为了验证和评估各种步态分析方法的可行性,研究人员搜集了不同的数据集,这些数据集中涵盖了各种类型的步态数据,如加速度、角速度和垂直地面反作用力等。表1 整理了目前研究中常用的步态数据集。
表1 可穿戴设备步态数据集Tab.1 Gait datasets of wearable devices
2.2 智能手机传感器设备
随着移动互联网技术的快速发展,智能终端设备如智能手机、平板电脑等越来越普及。这些设备中存在各种内置的传感器,如GPS(Global Positioning System)传感器、加速度计和陀螺仪等。加速度计传感器的三维(Three-Dimensional,3D)方向如图3 所示。这些传感器可以协同合作获取患者在行走时步态数据,从而识别PD 患者的异常步态。
图3 智能手机加速度计的3D方向Fig.3 3D orientations of smartphone accelerometer sensor
文献[26-28]中开发并评估了基于智能手机的步态冻结(Freezing of Gait,FoG)检测系统,利用智能手机中内置的3D加速度计或者陀螺仪,在人体的踝关节、腿关节和腰部等不同部位搜集PD 患者线速度和角速度,并应用机器学习算法检测FoG 事件和PD 的严重程度。文献[26]中为了避免手动设置阈值,引入AdaBoost.M1 算法生成弱学习分类器,并使用十倍交叉验证以评估算法在实践中的总体性能;
文献[27]中为了能更好地区分病理步态和生理步态,将设备中的数据采集和过滤与数据融合和模式识别技术相结合,并采用线性判别分析等9 种分类算法进行对比分析,实验结果显示,概率神经网络(Probabilistic Neural Network,PNN)得到最高的准确率,可远程监测患者的步态情况;
文献[28]中开发了一个应用程序“PD Dr”,将采集到的数据发送到云服务器中存储和处理,使用支持向量机(Support Vector Machine,SVM)识别PD 患者的异常步态,并使用Lasso 回归算法检测PD 的严重程度。文献[29-30]中同样利用智能手机内置的传感器,开发了基于智能手机的体系框架进行步态分析和检测FoG 事件。文献[29]中在采集受试者步态数据的同时,使用视频记录TUG 测试,同步视频和加速度记录数据,使用Moore-Bachlin 算法和添加有关步长信息的改进算法识别FoG 事件,实验结果表明,改进后的算法性能得到明显提升;
文献[30]中TUG 通过计算冻结阈值(FIth)和能量阈值(EIth)确定FoG 的发生,并将通过智能手机获得的步态分析结果与现有的惯性仪器获得的结果以及将检测到的FoG 事件与临床专业人员的评估进行比较分析,验证FoG 检测系统的准确性。表2 汇总了基于智能手机设备的步态分析方法,包含了具体的步态实验方法和结果。其中,健康对照组为阴性(N)组,帕金森组为阳性(P)组,本文指标使用以下变量。
表2 基于智能手机设备的步态分析方法Tab.2 Gait analysis methods based on smartphone devices
1)真阳性数TP(number of True Positive):PD 患者被正确分类的数量。
2)真阴性数TN(number of True Negative):健康对照者被正确分类的数量。
3)假阳性数FP(number of False Positive):健康对照者被错误分类为PD 患者的数量。
4)假阴性数FN(number of False Negative):PD 患者被错误分类为健康对照者的数量。
本文指标敏感性(Sensitivity)、特异性(Specificity)和准确率(Accuracy)的计算方式如下:
2.3 使用可穿戴传感器
对于不会使用智能手机的老年人,IMU 是应用最广泛的可穿戴传感器,小腿和脚是传感器安放位置的首要选择[18]。此外,也可以采用基于感知的压力传感器,将传感器安装在受试者的鞋上,提取患者的足部压力特征,图4[8]为带有IMU的可穿戴传感器电路板。
图4 带有IMU的可穿戴传感器电路板Fig.4 Wearable sensor circuit board with IMU
2.3.1 四肢可穿戴设备
文献[31-33]中提出一种新型的FoG 检测系统,利用可绑定在人体背部、臀部和脚踝等四肢的三轴加速度计传感器获取患者的步态数据作为输入,从原始数据中提取步态参数等特征,再使用较优的分类算法检测FoG 事件。文献[31]中以多通道加速度计信号作为输入,使用一维深度卷积神经网络(Convolutional Neural Network,CNN)自动学习特征表示,利用长短期记忆(Long Short-Term Memory,LSTM)网络建模特征激活之间的时间依赖关系,并使用数据扩充消除不平衡数据集对模型训练的影响,可以有效地检测FoG 事件;
文献[32]中通过数据窗口和非线性降维,从原始数据中提取步态特征,再使用K近邻(K-Nearest Neighbor,KNN)算法将步态分为pre-FoG、non-FoG 和FoG 这3 类,以减小FoG 发生的概率;
文献[33]中开发了一个不依赖于训练集标签的小批量k均值(k-means)聚类算法的可穿戴检测系统,使用滑动窗口提取加速度计数据的熵作为检测特征,通过k-means 聚类算法实现了在不标记训练集的情况下自动生成FoG 和non-FoG聚类。文献[34-35]中提出了PD 患者可穿戴的无线传感系统,这些传感系统均由若干个IMU 组成,用于搜集PD 患者的步态数据,通过步态分类算法识别被动的FoG 事件,在危险的情况下产生振动刺激的信号或者提供听觉刺激,防止患者跌倒。文献[34]中为了解决传感器和PC 之间通信最大距离的问题,使用便捷式接收器(智能手机)与无线局域网连接,将数据传输到PC 端,对加速度计和陀螺仪信号融合获得的数据进行时域分析,将角速度低通滤波后得到指数K,与校准后的阈值进行比较;
文献[35]中构建了一个由IMU 组成的无线传感系统,将采集的步态数据存储在处理器中,并通过蓝牙传输到智能手机中,使用离散小波变换(Discrete Wavelet Transform,DWT)对步态数据进行处理以识别FoG事件。文献[36]中提出了一个基于机器学习的评估步态特征的方法,使用可穿戴加速度计收集步态数据,根据评估的步态将PD 患者从健康老年对照组中分类出来,并使用Tinetti 移动测试(Tinetti Mobility Test,TMT)和3D 运动捕捉系统进行验证。基于人体四肢的可穿戴设备所使用的传感器、具体的步态分析方法和实验结果如表3 所示,实验结果的计算方法同表2。
表3 基于四肢可穿戴设备的步态分析方法Tab.3 Gait analysis methods based on limb wearable devices
2.3.2 足部可穿戴设备
尽管上述传感器可搜集到较为准确的步态数据,但将传感器固定到人体四肢等关键部位,尤其是腿部,会给人造成不舒服的感觉。为此,研究人员提出基于感知的压力传感器技术,这种传感器灵敏性较高,并通常被认为是检测步态的标准,图5[37]为基于加速度计传感器的足底压力鞋垫。
图5 基于加速度计传感器的足底压力鞋垫Fig.5 Plantar pressure insole based on accelerometer sensor
文献[37-38]中开发了配有3D 加速度计的压力鞋垫传感器系统,通过这些设备获取加速度计数据并分析受试者在行走过程中的足部压力变化,有效成为PD 患者在日常生活中的步态检测系统。文献[37]中应用了两种能够自动检测FoG 事件的算法,一种是时域法[37],另一种是Bächlin 等[39]的频域法。在所建议的时域法中,使用1D 垂直加速度信号和3D 信号分别与确定的阈值进行比较,确定是否出现FoG 事件;
相较于传统的频域算法,时域法的计算量明显减少。文献[38]中采集了足部压力分布、加速度和其他测量值等数据,使用了OpenGo(由Moticon 公司提供的创新纯无线智能鞋垫传感器和突破性的专业分析软件)的一种算法,该算法可以通过压力和加速度自动检测各种FoG 的类型,并将采集的经过处理的数据与临床医生在视频记录中标记的数据进行比较,验证该系统是否有效。不同于文献[37-38]中是从正常步态中检测FoG 事件,文献[40-41]中开发并评估了新型的用于预测FoG 事件的方法,可以在早期预测跌倒并提前警示PD 患者。文献[40]中提出并评估了一种利用步态过程中采集的足底压力数据进行FoG 预测的新方法,将足底压力数据作为二维图像处理,并使用CNN 将它分类为pre-FoG、FoG 和non-FoG;
文献[41]通过对受试者的行走节奏、步幅大小和足部压力分布等步态行走阶段参数进行时域分析,提取主要参数,分析足部的重量分布,从而检测步态模式。表4汇总了足部可穿戴设备使用的传感器、具体的步态分析方法和实验结果,实验结果计算方法同表2。
表4 基于足部可穿戴设备的步态分析方法Tab.4 Gait analysis methods based on foot wearable devices
与基于可穿戴设备的方法相比,基于非可穿戴设备的方法不需要穿戴额外的设备,避免了因穿戴设备而造成的运动限制,同时,基于视频的步态分析方法能够远程监测PD 患者运动状况,在PD 患者远程诊断评估中有着重大意义[42]。大多数基于视频的步态识别方法都是基于人体轮廓和基于人体关键点的步态分析方法,基本流程如图6 所示。
图6 基于视频的步态分析流程Fig.6 Video-based gait analysis flowchart
3.1 非可穿戴步态数据集
基于视频的步态分析方法使用的数据集涵盖了不同视角、环境条件和受试者的外观条件等参数,数据类型大致可分为RGB(Red Green Blue)图像、人体轮廓和人体骨骼节点等,常用的基于视频的步态数据集如表5。
表5 基于非可穿戴设备的步态数据集Tab.5 Gait datasets based on non-wearable devices
3.2 基于人体轮廓的步态分析方法
基于人体轮廓的步态分析方法主要采用前景、背景差分方法或光流处理方法[48],即去除图像背景,提取并分析人物轮廓再进行步态识别。
为了从视频序列中准确检测步态事件,文献[49-50]中提出了基于视频的步态事件检测方法。文献[49]中提出了一种基于单个二维视觉相机系统的步态事件检测方法,从视频帧中提取多个连续行人轮廓进行组合,不同数量的连续行人轮廓产生不同类型的连续轮廓差分图(Consecutive Silhouettes Difference maps,CSD-maps),以描述步态模式,再使用CNN 从CSD-maps 中学习特征并检测出步态事件;
文献[50]中提出了一种纯视频的方法自动检测拖曳步态,将只包含腿和脚的RGB 轮廓输入特征提取模块,提取帧序列的多层次时空特征,该时空特征由特征融合模块聚合,能够有效识别异常步态和步态的严重等级。上述的步态分析方法易受视角、衣着服饰和遮挡物等因素的影响,为了解决这个问题,文献[51-53]中提出了不同的步态分析方法。文献[51]中提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的GaitGAN 方法,应用PixelDTGAN(Pixel-level Domain Transfer GAN)模型[54]将视觉输入转换为不同的形式,通过生成的像素级图像进行可视化。不同于传统GAN,GaitGAN 包含两种鉴别器:一种用于生成逼真的步态图像;
另一种用于确保生成的步态图像包含人类识别信息。该方法可以将从任何角度获得的步态图像转换为侧视图,避免了事先估计受试者的视角、服装和携带物等条件带来的影响。文献[52]中提出了一种基于视频传感器的DeepGait 步态表示方法,对原始轮廓图像进行归一化处理,然后将识别出的每个步态周期轮廓图像输入预先训练的VGG(Visual Geometry Group)-D 网络,提取步态特征,生成一种通用的步态表示方法,降低了因视角、服装或者背包带来的影响。文献[53]中提出了一种三维卷积神经网络(3D CNN,3D-CNN)多视角步态识别网络,该网络是一个二级网络,第一级网络从视频中采样16 个帧作为输入,识别任何步态视频的视角;
第二级网络针对11 个不同的视角中每个受试者对应的角度进行训练,实现了从不同的视角识别步态事件。表6 给出了基于人体轮廓的具体步态分析方法以及实验结果。其中,准确率的计算方法同表2,精确率(Precision)的计算公式如下:
表6 基于人体轮廓的步态分析方法Tab.6 Gait analysis methods based on human silhouette
3.3 基于人体关键点的分析方法
基于人体关键点的步态分析方法,主要是从视频中提取人体关键点坐标数据,再从中分析患者的运动特征[48]。该方法可以很好地解决因衣着外观或者遮挡物等原因造成的识别率较低的问题。
文献[42,55]中提出了一种用于评估人体运动障碍的时空图卷积网络(Spatial-Temporal Graph Convolution Network,ST-GCN),从视频中提取受试者的人体骨骼序列,在临床实践中实现评估PD 患者的步态运动障碍。文献[42]中在ST-GCN 结构的基础上提出了双流时空注意图卷积网络(Two-stream Spatial-Temporal Attention Graph Convolutional Network,2s-ST-AGCN)构建人体关节和骨骼序列的拓扑结构,自动捕获关节和骨骼中的静态空间信息和动态时间变化,并引入深度监督下的多尺度时空注意感知机制,提高模型学习特征的鉴别能力和鲁棒性,有效识别PD 患者的异常步态;
文献[55]中则将ST-GCN 模型建立在骨架图之上,构建了一个以关节为图节点、以人体结构中符合关节自然连接性的空间边和在连续的时间中连接相同关节的时间边为图边的时空图,对输入数据应用多层ST-GCN 运算,生成更高级别的特征图,提高了受试者动作识别的性能。文献[56-57]中提出了基于图卷积网络(Graph Convolution Network,GCN)的步态冻结检测方法,可以有效地用于FoG 事件检测的细粒度人体动作识别等问题。文献[56]中构造了一种新的基于GCN 的网络结构,将每个视频表示为一个有向图,图中的顶点表示解剖关节,加权边表示这些关节之间的相互作用,采用弱监督学习策略处理在顶点层次上的预测,并提出数据驱动方法获得可学习的加权邻接矩阵,消除了昂贵的数据标注并且降低了模型的复杂度;
文献[57]中根据人体姿势评估的最新进展,结合骨架姿势和GCN 提出了GaitGraph 方法,使用HRNet(High-Resolution Network)[58]作为人体姿势估计器,然后将提取的姿势序列送入ResGCN(Residual GCN)[59]生成特征嵌入,提取步态信息,有效地解决了轮廓图像丢失细粒度空间信息的问题。为了能够有效提取数据中的关键信息,降低无效冗余信息,文献[60]中提出了一个端到端的STA-LSTM(Spatial-Temporal Attention LSTM)网络,并嵌入时空注意力机制,通过空间注意力模块自动选择每个帧中的关键关节点,通过时间注意力模块为不同帧分配不同的重要程度,并引入正则化交叉熵,确保网络的有效训练。表7 给出基于人体关节的具体步态分析方法和实验结果,实验结果计算方法同表2,文献[42]中的受试者是基于MDS-UPDRS(Movement Disorder Society-Unified Parkinson’s Disease Rating Scale)。
表7 基于人体关节的步态分析方法Tab.7 Gait analysis methods based on human joints
准确识别异常步态对PD 患者的诊断具有极大的实际意义,近年来也引起了广大科研人员的广泛关注,针对现有工作中存在的不足,本文作了如下总结和展望。
1)可穿戴设备旨在监测患者室内和室外的步态参数,需要PD 患者长时间佩戴传感器,这就要求可穿戴设备功耗低、续航时间长。此外,长时间的佩戴可能会引起患者的不适。因此,为了能够实现长时间监测PD 患者步态状况,低成本、低功耗、测量数据精度高和穿戴舒适的可穿戴设备仍是研究人员未来的重点研究方向。
2)基于视觉的步态分析方法易受光照环境、视角、衣着服饰、背景和遮挡物等协变量因素的影响,复杂真实环境也会对结果造成影响,导致识别率较低,不能满足实际应用的需要。而人体骨骼关键点的检测技术通过抽象人体的姿态信息,很好地避免了因为服饰、携带物和遮挡物带来的影响。
3)步态数据库的样本量较少,存在数据样本不均衡的情况,且数据都是在患者已知的情况下采集的,可能会引起患者不自觉的姿态变化,影响最终数据的准确性。为了解决数据样本较少的问题,研究人员致力于寻找新的方法,例如,通过深度学习方法中的GAN,可以生成大量不同的步态数据样本。因此,获取行人在自然状态下的步态信息也是未来数据采集一个重要发展方向。
随着新技术的发展,有望实现基于步态的全自动化、客观PD 评估方法,以改进现有疾病评分方法。本文主要从量表、可穿戴设备和非可穿戴设备这3 个方面分析总结了步态在PD 诊断上的应用,其中:可穿戴设备的成本和功耗都较低,适合长时间动态监测PD 患者的步态状况,但是该方法需要患者在四肢穿戴相应的传感器设备,在一定程度上影响患者的日常活动;
非可穿戴设备可以全面地获得患者的步态信息,无需患者穿戴任何设备,方便患者日常行动,但是在采集数据时,易受光照等外部环境的干扰,不能长时间对患者进行跟踪识别。尽管人们对步态分析进行了长期的探索,但目前大多数步态分析方法还存在一些不足。未来的研究方向将专注于改进步态采集方式,提高步态分析方法的准确度和模型的泛化性,为PD 辅助诊断提供智能化决策系统。