人工智能在帕金森病构音障碍研究中的应用进展2025
帕金森病(Parkinsonsdisease)是一种常见的神经退行性疾病,影响运动功能的同时也伴随着多种非运动症状,比如构音障碍,又称为帕金森病性构音障碍,主要特征包括:鼻音[1]、声音嘶哑、音调波动、语速减慢、节奏不规律、发音清晰度下降乃至难以分辨、语音强度不规律(音量减小、颤抖和嘶哑)[2-3],言语障碍比典型的运动症状早几年发生[4-5],且不能通过左旋多巴治疗恢复[6]。因此言语分析有助于帕金森病的早期诊断。对发声障碍的远程监测可以实现对帕金森病临床状况的有效跟进。传统上对帕金森病患者的言语评估主要依赖于感知测试和人工分析,既主观又耗费人力。然而,人工智能(artificialintelligence)与这一领域的结合改变了研究和管理构音障碍的方式,其在帕金森病构音障碍的评估、诊断、治疗和康复中的应用日益受到重视[7]。文中将探讨人工智能在帕金森病构音障碍研究中的应用,包括语音特征分析、机器学习模型、智能手机应用、合成语音生成以及远程评估等,旨在为未来的研究方向提供参考。
我们检索了PubMed数据库、中国知网知识资源总库、中华医学期刊全文数据库。使用的英文检索词包括“Parkinsonsdisease“artificialintelligencedeeplearningmachinelearningneuralnetworks,computer”“heuristics”“supportvectormachine”“dysarthria”
“dysphonia”“speechdisorders“languagedisorders”“diagnosis”assessment“differentialdiagnosis,中文检索词包括“帕金森病”
“人工智能”“构音障碍”,检索起止年限为自建库至2024年5月2日,共检索到76篇文献。
一、人工智能在帕金森病构音障碍研究中的方法和技术人工智能技术,特别是机器学习和语音信号处理,已经在帕金森病构音障碍的研究中展现出巨大潜力。通过自动化语音分析,人工智能能够从患者的语音样本中提取关键特征,如音高、音量、语速和发音清晰度等,这些特征与帕金森病构音障碍的严重程度密切相关[8]。通过分析帕金森病患者的语音和语言数据来识别疾病相关的生物标志物,开发早期检测和监测帕金森病构音障碍的可靠而客观的方法。这些技术可以帮助医生更准确地诊断帕金森病,监测病情进展,并为患者提供个性化的治疗方案。
(一)语音信号处理和语音特征提取2010年前后的研究[9]即开始利用人工智能研究帕金森病构音障碍,主要利用机器学习算法来分析帕金森病患者的语音数据,将原始语音信号转化为机器学习模型可以理解的形式,通过声学分析和模式识别,识别与健康人群的差异。语音信号处理是人工智能在帕金森病构音障碍研究中的核心技术之一。例如,基频 (fundamentalfrequency)可以反映患者的音调控制能力及变异性;频率微扰(requencyperturbation)、振幅微扰(amplitudeperturbation)及声门噪声比(glottal-to-noiseratio,GNR)可反映语音强度的不规律性[2](如颤抖和嘶哑)和呼吸声的异常[3],提示声带功能障碍。在帕金森病构音障碍研究中,常用非线性动态复杂度、信号分形缩放指数、
梅尔频率倒谱系数、线性预测编码系数(linearpredictivecoefficients)、相对频谱变换感知线性预测系数,极端学习机(extremelearning
machine)、决策树(decisiontree)、朴素贝叶斯(naiveBayes)、高斯混合模型(Gaussianmixturemodel)、隐马尔可夫模型(hiddenMarkovmodel)、光梯度增强及逻辑回归(Logisticregression)等多种学习模型于评估声学特征与帕金森病状态的关系[10-12]。
(二)分类算法及机器学习模型对语音特征提取后,使用机器学习算法对提取的特征进行训练,以区分构音障碍的帕金森病患者和健康个体,在帕金森病构音障碍的分类和自动诊断中起到核心作用。2015年后,随着深