ISCA - International Speech
Communication Association


ISCApad Archive  »  2018  »  ISCApad #245  »  Jobs  »  (2018-10-09) Stage Master Recherche: L' évaluation des troubles de la parole dans la maladie de Parkinson, Avignon, France

ISCApad #245

Saturday, November 10, 2018 by Chris Wellekens

6-38 (2018-10-09) Stage Master Recherche: L' évaluation des troubles de la parole dans la maladie de Parkinson, Avignon, France
  

Stage Master Recherche – 6 mois Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr)
Sujet  : Traitements automatiques appliqués à l'évaluation des troubles de la parole dans la maladie de Parkinson
Le terme « troubles de la parole » fait référence à l'ensemble des déficiences affectant la production de la parole chez un être humain. Le bégaiement est un exemple de troubles de la parole.
 
Le LIA travaille depuis une dizaine d'années sur les troubles de la parole, et plus particulièrement sur la manière dont les outils de traitements automatiques peuvent aider les cliniciens et les phonéticiens dans leur analyse acoustico-phonétique du signal de parole et/ou perceptive des productions de parole en vue de mieux comprendre les dégradations inhérentes aux troubles de la parole. Les travaux les plus récents portent notamment sur l'étude d'un système de détection automatique de déviances dans des productions de parole dégradée [Laaridh et al., 2015] ou d'un système automatique de prédiction du degré d'intelligibilité basé sur des i-vecteurs [Laaridh et al., 2017 ; Laaridh et al., 2018]. Dans un premier temps, ces approches ont été appliquées sur des productions de parole dégradée produites par des patients atteints de lésions neurologiques localisées dans le système nerveux central ou périphérique. On parle alors de trouble moteur de la parole d'origine neurologique, désigné sous le terme de dysarthrie. La dysarthrie peut être l'un des symptômes de différentes maladies telles que la maladie de Parkinson, la Sclérose Latérale Amyotrophique (SLA), les Accidents Vasculaires Cérébraux, etc. Ces différentes maladies se distinguent notamment par la localisation des lésions neurologiques et, par conséquent, par le type de troubles moteur (faiblesse musculaire, mouvements involontaires, imprécision des mouvements …) et le type de dégradations de la parole qu'elles peuvent engendrer (distorsion des voyelles, imprécision des consonnes, altération du débit, hypernasalité, …). Ces approches ont été, dans un deuxième temps, évaluées sur des productions de parole dégradées issues de patients atteints de cancers des voies aérodigestives supérieures (présence de tumeurs) et/ou suite à des traitements thérapeutiques inhérents (exérèse, radiothérapie, etc).
En fonction de la maladie et de son évolution, les troubles moteur du patient pourront être évalués perceptivement par le clinicien sur une échelle de sévérité allant d'une dysarthrie légère à sévère. Sur une échelle similaire, le clinicien pourra juger du degré d'intelligibilité de la parole d'un patient ie sa capacité à transmettre un message oral à un auditeur.
La revue de la littérature sur l'application des outils de traitement automatique de la parole dans le cadre de troubles de la parole montre que la communauté scientifique souffre d'un manque cruel de données cliniques disponibles. En effet, les systèmes automatiques nécessitent pour une majorité d'entre eux une quantité importante de données pour l'apprentissage des modèles sur lesquels ils reposent. La mise à disposition de grands corpus de parole normale (des centaines d'heures d'enregistrements accompagnées d'annotations manuelles) a d'ailleurs permis les améliorations de ces dernières années des systèmes de reconnaissance de la parole et leur utilisation dans le cadre d'applications grand public. Dans le contexte clinique, la constitution de corpus pose un certain nombre de problèmes : accès aux patients pour leur enregistrement au travers de collaborations avec des cliniciens de centres hospitaliers, demande d'autorisation de commissions hospitalières pour la mise en place d'un programme de recherche impliquant des patients, mise en place de protocoles particuliers prenant en compte les contraintes cliniques, collecte des données audio mais également de données cliniques nécessaires (informations personnelles du patient, pathologie, stade de progression, prise en charge thérapeutique, évaluation perceptive menée par les cliniciens, …) pour l'analyse des résultats.  Ces difficultés expliquent le nombre très restreint de corpus actuellement disponibles. Le LIA dispose, grâce à ces collaborations avec d'autres laboratoires de recherche et des établissements
hospitaliers de quelques corpus, comptabilisant un peu plus d'une centaine de locuteurs, enregistrés principalement sur une tâche de lecture d'un texte et pour quelques un sur de la parole spontanée. Néanmoins, cela reste insuffisant pour une application efficiente des outils de traitement de la parole.
Le Laboratoire Parole et Langage (LPL) d'Aix-en-Provence enregistre depuis de très nombreuses années des patients atteints de dysarthrie et de dysphonie (altération de la voix). Il a ainsi accumulé des enregistrements de plus de 2500 patients, dont 600 d'entre eux sont atteints de la maladie de Parkinson. Ces données audio sont accompagnées dans leur grande majorité des données cliniques du patient. Le LPL a fait un énorme travail depuis une dizaine d'années d'homogénéisation et de structuration de ces données au travers d'une base de données conséquente permettant le stockage et la pérennisation de ces données. L'objectif du LIA est à présent d'exploiter cette masse de données en se focalisant dans un premier temps sur les quelques 600 patients atteints de la maladie de Parkinson. Il s'agira dans le cadre de ce stage d'établir très rapidement une cartographie de ces patients, décrivant leur âge, genre, nombre d'enregistrements, quantité de parole disponibles, type de tâches, évaluations perceptives disponibles… Cette première phase très préliminaire permettra au candidat de se familiariser avec le contexte particulier des données cliniques. La deuxième phase du stage reposera sur une revue de la littérature faisant référence au Challenge COMPARE Interspeech 2015 [Schuller et al., 2015], dédié à la prédiction de l’état neurologique de patients atteints de la maladie de Parkinson sur la base de l’échelle UPDRS (Unified Parkinson's Disease Rating Scale). Cette revue permettra de faire état des différentes approches proposées dans ce contexte particulier  pour extraire de l'information pertinente pour la caractérisation de la dysarthrie chez des sujets atteints de la maladie de Parkinson et pour la prédiction de la sévérité de leur dysarthrie. Il s'agira pour le candidat d'évaluer le comportement de quelques unes de ces approches sur le corpus de patients à notre disposition voire d'en proposer de nouvelles le cas échéant. Une analyse par type de tâche proposé dans le protocole d'enregistrement pourra également faire partie du travail (lecture d'un texte, lecture de mots, répétition de syllabes, ...).
A l'issue de ce stage, un financement de thèse pourra être proposé au candidat.
Références bibliographiques
[Laaridh et al., 2015] I. Laaridh, C. Fredouille, C. Meunier, « Automatic Detection of Phone-Based Anomalies in Dysarthric Speech », ACM Transactions on Accessible Computing (TACCESS), (Volume : 6 Issue 3), June 2015.
[Laaridh et al., 2017] I. Laaridh, W. Ben-Kheder, C. Fredouille, C. Meunier, « Automatic Prediction of Speech Evaluation Metrics for Dysarthric Speech », Interspeech'2017, Stockholm, Sweden. August 2017.
[Laaridh et al., 2018] I. Laaridh, C. Fredouille, A. Ghio, M. Lalain, V. Woisard, « Automatic evaluation of speech intelligibility based on i-vectors in the context of Head and Neck Cancers », Interspeech'2018, Hyderabad, India. September 2018.
[Schuller et al., 2015] B. Schuller, S. Steidl, A. Batliner, S. Hantke, F. Hönig, J. R. OrozcoArroyave, E. Nöth, Y. Zhang, et F.Weninger, 2015. The interspeech 2015 computational paralinguistics challenge : Nativeness, Parkinson’s & eating condition. Proceedings of Interspeech’15, Dresden, Germany.


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA