ISCApad #181 |
Wednesday, July 10, 2013 by Chris Wellekens |
Le labex Brain and Language Research Institute (BLRI) financera à la rentrée prochaine deux sujets
de thèse dont l'un des sujets pourra être celui proposé ci-dessous (en fonction des candidatures
retenues).
Calendrier :. date limite des candidatures : 10 juin.
auditions des candidats retenus : 24 juin
Bourse : 1 684.93€ brut mensuel (1 368€ nets)
Dossier des candidats :. CV détaillé. Notes. Motivation et/ou projet scientifique correspondant au sujet Contact scientifique : Corinne Fredouille et Christine Meunier
Contact administratif : nadera.bureau@blri.fr
Description du sujet :
Titre : Détection de zones de déviance dans la parole pathologique : apport du traitement automatique face à l'expertise humaine Superviseurs : Corinne Fredouille, Christine Meunier Laboratoire d'accueil : Laboratoire Informatique d'Avignon (collaboration avec le Laboratoire Parole et Langage –Aix-en-Provence) Discipline et école doctorale : Informatique, école doctorale ED536 de l'Université d'Avignon Calendrier : . date limite des candidatures : 10 juin . auditions des candidats retenus : 24 juin Bourse : 1 684.93€ brut mensuel (1 368€ nets) Description scientifique Si la définition de l'étendue de la variabilité en parole normale est une question fondamentale pour les théories linguistiques actuelles, une façon d'aborder ses limites est d'essayer de déterminer ses frontières par le biais de la variation pathologique. Comme le soulignent Duffy et Kent, 2001 « Science often takes advantages of nature’s accidents to learn the principles of a process ». Sur ce principe, la connaissance de la parole pathologique s'appuyant sur la compréhension des phénomènes d'altération « observables » dans la production de parole de patients atteints de troubles de la parole devient une nécessité. La parole dysarthrique correspond à une altération de la commande motrice d’origine centrale ou périphérique des gestes de la parole. Des variations importantes existent dans la parole dysarthrique en relation avec un déficit de l’exécution temporo-spatiale des mouvements de la parole et qui peuvent affecter différents niveaux de production (respiratoire, laryngé et supralaryngé). La grande majorité des travaux ayant porté sur l'étude de la parole dysarthrique repose sur des analyses perceptives. La raison principale tient dans le fait qu'un patient dysarthrique est dysarthrique parce qu'il « s'entend/a l'air » dysarthrique. Les travaux les plus connus au niveau international sont ceux de Darley et al., 1975. Ils ont conduit à l'élaboration d'une organisation des dysarthries en 6 classes (complétée par deux classes supplémentaires par Duffy, 1995) sur la base de clusters physiopathologiques définis à partir de la concomitance de caractéristiques les plus déviantes perçues par un jury d'écoute. L’hypothèse sous-jacente à la construction de ces clusters est qu’un ensemble de paramètres perturbés simultanément, mis en relation avec l’atteinte neurologique, reflèterait un processus physiopathologique particulier. Si cette classification reste d'actualité encore aujourd'hui pour évaluer notamment la parole dysarthrique en pratique clinique, elle reste néanmoins sujette à controverses pour deux raisons principales : la subjectivité des évaluations perceptives d'une manière générale et la difficulté pour un être humain, même expérimenté, à distinguer et à juger perceptivement les multiples dimensions à prendre en compte dans l'évaluation de la parole dysarthrique. En conséquence, différents travaux ont été menés à partir des années 80 à aujourd'hui dans l'objectif de combiner ces analyses perceptives à des méthodes plus objectives et quantitatives telles que les analyses instrumentales basées sur des mesures acoustiques ou physiologiques (revue de la littérature dans Kay, 2012). Si les analyses instrumentales peuvent s'appuyer sur des traitements semi- voire entièrement automatiques, l'analyse acoustique fine nécessaire pour comprendre les phénomènes déviants inhérents à la dysarthrie dans le signal de parole demeure encore très coûteuse en temps par un expert humain. Dans ce contexte, une grande part des études présentes dans la littérature repose soit sur un nombre très restreint de patients ou sur une pathologie bien ciblée. Pourtant, la grande variabilité des phénomènes déviants observés dans la parole dysarthrique en fonction de la pathologie du patient, de l'avancement de la maladie ou de la sévérité de la dysarthrie requiert d'analyser une large population de patients. L'objectif de cette thèse est d'étudier comment les outils du traitement automatique de la parole pourraient permettre de traiter de larges populations de patients dysarthriques et de focaliser l'attention des experts humains sur des zones de déviance bien identifiées du signal en vue d'analyses plus fines. Ces travaux reposeront notamment sur le système de transcription automatique du LIA et ses activités de recherche autour des mesures de qualité des transcriptions (Lecouteux, 2008 et Senay, 2011). La granularité de la détection des zones de déviance – ici potentiellement le mot ou la séquence de mots – sera dans un second temps affiner par des outils travaillant à des niveaux inférieurs allant jusqu'au phonème (Fredouille, 2011). Ces travaux devront tenter de répondre à différentes questions : • Face à la variabilité des phénomènes de déviance observés dans la parole dysarthrique et répertoriés dans la littérature, quels sont ceux qu'un système de détection automatique est capable de déceler ? • Est ce qu'un système automatique est capable de mettre en évidence les mêmes phénomènes de déviance qu'un expert humain lors d'une évaluation perceptive ? • Les déviances détectées par le système automatique sont-elles pertinentes pour les phonéticiens ? • Est-il possible de mettre en relation les déviances détectées avec la physiopathologie du patient (ex : indices hypokinéthiques pour la maladie de Parkinson, indices paralytiques pour la SLA, …) ? Les travaux autour du système de transcription automatique du LIA devraient également ouvrir des perspectives sur la mise en place d'un système de mesures objectives de l'intelligibilité des patients dysarthriques. Ces travaux de thèse seront réalisés dans le cadre d'une collaboration étroite entre le LIA (Corinne Fredouille) pour son expertise autour des systèmes automatiques, le LPL (Christine Meunier et Alain Ghio) pour son expertise sur les analyses acoustico-phonétiques et les évaluations perceptives, les hôpitaux de la Timone (Dr Danièle Robert) et des Pays d'Aix (François Viallet) pour leur expertise clinique. Ils seront basés sur le corpus de patients dysarthriques élaborés dans le cadre du projet ANR DesPhoAPady (2009-2012 – Fougeron, 2010). Ce corpus présente un large panel de patients souffrant de différentes pathologies (maladie de Parkinson, Sclérose Latérale Amiotrophique, syndrôme cérébelleux) et différents niveaux de sévérité de dysarthrie. Références : J. R. Duffy, R. D. Kent, « Darley's contributions to the understanding, differential diagnosis, and scientific study of the dysarthrias », Aphasiology 15(3):275 – 289, 2001. F. L. Darley, A. E. Aronson, J. R. Brown, « Motor Speech Disorders », Philadelphia: W.B. Saunders, 1975. J. R. Duffy, « Motor speech disorders : substrates, differential diagnosis and management », Motsby- Yearbook, St Louis, 1e édition, 1995. T. S. Kay, « Spectral analysis of stop consonants in individuals with dysarthria secondary to stroke », PhD thesis, Department of Communication Sciences and Disorders, Faculty of the Louisiana State University and Agricultural and Mechanical College, USA, 2012. B. Lecouteux, « Reconnaissance automatique de la parole guidée par des transcriptions a priori », Thèse de doctorat, Université d'Avignon et des Pays Vaucluse, 2008. G. Senay, « Approches semi-automatiques pour la recherche d’information dans les documents audio », Thèse de doctorat, Université d'Avignon et des Pays Vaucluse, 2011. C. Fredouille, G. Pouchoulin, « Automatic detection of abnormal zones in pathological speech », International Congress of Phonetic Sciences (ICPHs'11), Hong Kong, 17-21 Août 2011. C. Fougeron et al., « Developing an acoustic-phonetic characterization of dysarthric speech in French », LREC'10 (international conference on Language Resources and Evaluation), Malte, Mai 2010. Dossier des candidats : . CV détaillé . Notes . Motivation et/ou projet scientifique correspondant au sujet Contact scientifique : Corinne Fredouille et Christine Meunier Contact administratif : nadera.bureau@blri.fr
Title: Detection of deviant zones in pathological speech : contribution of the automatic speech processing against the Human expertise Supervisor : Corinne Fredouille, Christine Meunier Host laboratory : Laboratoire Informatique d'Avignon (collaboration with the Laboratoire Parole et Langage – Aix-en-Provence) Field and doctoral school : computer sciences, doctoral school ED536 of the University of Avignon Date : . deadline for the application : 10th of june . auditions of chosen candidates : 24th of june Grant : 1 684.93€ montly gross (1 368€ net) Scientific description If the definition of the variability range in normal speech is a key issue for the current linguistic theories, a way of dealing with its limits is to attempt to determine its frontiers through pathological variation. As reported by Duffy and Kent, 2001 « Science often takes advantages of nature’s accidents to learn the principles of a process ». Based on this, the knowledge of the pathological speech, based on the understanding of alteration phenomena, « observable » on the speech production of patients suffering of speech disorders becomes a necessity. Dysarthria is a group of speech disorders resulting from neurological impairments of speech motor control. Substantial variations occur in dysarthric speech due to a deficit in the spatio-temporal execution of speech movements that affects different levels of speech production (respiratory, laryngeal and supralaryngeal). The vast majority of research work dedicated to the study of the dysarthric speech relies on perceptual analyses. The main reason is that a dysarthric patient is dysarthric because he/she sounds dysarthric. The most known study, at international level, was done by Darley et al., 1975. This work leads to organize dysarthria into 6 classes (completed with 2 additional classes by Duffy, 1995) on the basis of physiopathological clusters defined from the co-occurrences of the most deviant features perceived by a perceptual jury. The hypothesis underlying the building of these clusters is that a set of simultaneously disturbed features, connected with the neurological injuries, should reflect a typical physiopathological process. If this classification is still used nowadays to evaluate dysarthric speech in clinical practice notably, it remains controversal for a couple of reasons : the subjectivity of perceptual evaluation and the difficulty for a Human being, even with a high expertise, of distinguishing and assessing perceptually the multiple dimensions to take into account when dealing with dysarthric speech. Consequently, different research work has been conducted since the 1980s until now which aims at combining these perceptual analyses with more objective and quantitative approaches such as the instrumental analyses based on acoustic or physiological measure (review of the literature can be found in Kay, 2012). Contrary to the instrumental analyses which can rely on some semi- or full-automatic process, in-depth acoustic analysis of speech necessary to understand the deviant phenomena related to dysarthria still remains very timeconsuming for a Human expert. Based on this, a signifiant proportion of studies in the literature are conducted on a limited number of patients or on a focused pathology. However, the large variability of deviant phenomena observed in dysarthric speech according to the patient’s pathology, the stage of the disease, or the dysarthria severity require the analysis of a large patient population. The aim of this thesis is to study how the automatic speech processing tools could permit to treat large populations of dysarthric patients and to focus Human experts’ attention on speech zones well identified as deviant for further in-depth analyses. This work will rely on the automatic speech transcription developed at the LIA and its activities on the quality measure of transcriptions (Lecouteux, 2008 et Senay, 2011). The granularity of the deviant zone detection – here the word or set of words – will be refined, in a second step, by applying existing detection tools working at lower levels like the phoneme (Fredouille, 2011). This work will attempt to answer the following key issues : • Given the variability of deviant phenomena observed on dysarthric speech and reported in literature, which ones is an automatic detection system able to capture ? • Is an automatic system able to highlight the same deviant phenomena as a Human expert will detect perceptually ? • Are deviant speech zones detected by an automatic system relevant for a phonetician ? • Does a correlation between the type of deviant phenomena detected and the patient’s physiopathology exist (e.g : hypokinetic feature for the Parkinson disease, paralytic features for ALS, …) ? Studies relating to the automatic speech transcription should open up new perspectives on the implementation of an objective system dedicated to the evaluation of the dysarthric patient’s intelligibility. This thesis work will be carried out within a close collaboration between the LIA (Corinne Fredouille) for her expertise on the automatic system dedicated to speech processing, the LPL (Christine Meunier and Alain Ghio) for their expertise on acoustic-phonetic analyses and perceptual evaluations, both the hospitals of La Timone (Dr Danièle Robert) and desPays d’Aix (Pr. François Viallet) for their clinical expertise. It will be based on the dysarthric patient corpus designed for the ANR DesPhoAPady project (2009-2012 – Fougeron, 2010). This corpus includes a large population of patients suffering from various pathologies (Parkinson disease, ALS, cerebelar syndrom, …) and different levels of dysarthria severity. Bibliography : J. R. Duffy, R. D. Kent, « Darley's contributions to the understanding, differential diagnosis, and scientific study of the dysarthrias », Aphasiology 15(3):275 – 289, 2001. F. L. Darley, A. E. Aronson, J. R. Brown, « Motor Speech Disorders », Philadelphia: W.B. Saunders, 1975. J. R. Duffy, « Motor speech disorders : substrates, differential diagnosis and management », Motsby- Yearbook, St Louis, 1e édition, 1995. T. S. Kay, « Spectral analysis of stop consonants in individuals with dysarthria secondary to stroke », PhD thesis, Department of Communication Sciences and Disorders, Faculty of the Louisiana State University and Agricultural and Mechanical College, USA, 2012. B. Lecouteux, « Reconnaissance automatique de la parole guidée par des transcriptions a priori », Thèse de doctorat, Université d'Avignon et des Pays Vaucluse, 2008. G. Senay, « Approches semi-automatiques pour la recherche d’information dans les documents audio », Thèse de doctorat, Université d'Avignon et des Pays Vaucluse, 2011. C. Fredouille, G. Pouchoulin, « Automatic detection of abnormal zones in pathological speech », International Congress of Phonetic Sciences (ICPHs'11), Hong Kong, 17-21 Août 2011. C. Fougeron et al., « Developing an acoustic-phonetic characterization of dysarthric speech in French », LREC'10 (international conference on Language Resources and Evaluation), Malte, Mai 2010. Candidate application form : . detailed CV . marks . Motivation and/or scientific project related to the topic Scientific Contact : Corinne Fredouille et Christine Meunier Administrative Contact : nadera.bureau@blri.fr |
Back | Top |