ISCA - International Speech
Communication Association


ISCApad Archive  »  2013  »  ISCApad #181  »  Jobs  »  (2013-06-03) 2 Ph D's Université d'Avignon

ISCApad #181

Wednesday, July 10, 2013 by Chris Wellekens

6-33 (2013-06-03) 2 Ph D's Université d'Avignon
  
Le labex Brain and Language Research Institute (BLRI) financera à la rentrée prochaine deux sujets 
de thèse dont l'un des sujets pourra être celui proposé ci-dessous (en fonction des candidatures
 retenues).
Calendrier :. date limite des candidatures : 10 juin. 
auditions des candidats retenus : 24 juin
Bourse : 1 684.93€ brut mensuel (1 368€ nets)
Dossier des candidats :. CV détaillé. Notes. Motivation et/ou projet scientifique correspondant au sujet
Contact scientifique : Corinne Fredouille et Christine Meunier
Contact administratif : nadera.bureau@blri.fr
Description du sujet : 
 
 

Titre : Détection de zones de déviance dans la parole pathologique : apport du traitement automatique face à l'expertise humaine

Superviseurs : Corinne Fredouille, Christine Meunier

Laboratoire d'accueil : Laboratoire Informatique d'Avignon (collaboration avec le Laboratoire Parole et Langage –Aix-en-Provence)

Discipline et école doctorale : Informatique, école doctorale ED536 de l'Université d'Avignon

Calendrier :

. date limite des candidatures : 10 juin

. auditions des candidats retenus : 24 juin

Bourse : 1 684.93brut mensuel (1 368nets)

Description scientifique

Si la définition de l'étendue de la variabilité en parole normale est une question fondamentale pour les théories

linguistiques actuelles, une façon d'aborder ses limites est d'essayer de déterminer ses frontières par le biais de la

variation pathologique. Comme le soulignent Duffy et Kent, 2001 « Science often takes advantages of nature’s

accidents to learn the principles of a process ». Sur ce principe, la connaissance de la parole pathologique s'appuyant sur

la compréhension des phénomènes d'altération « observables » dans la production de parole de patients atteints de

troubles de la parole devient une nécessité.

La parole dysarthrique correspond à une altération de la commande motrice d’origine centrale ou périphérique des

gestes de la parole. Des variations importantes existent dans la parole dysarthrique en relation avec un déficit de

l’exécution temporo-spatiale des mouvements de la parole et qui peuvent affecter différents niveaux de production

(respiratoire, laryngé et supralaryngé). La grande majorité des travaux ayant porté sur l'étude de la parole dysarthrique

repose sur des analyses perceptives. La raison principale tient dans le fait qu'un patient dysarthrique est dysarthrique

parce qu'il « s'entend/a l'air » dysarthrique. Les travaux les plus connus au niveau international sont ceux de Darley et

al., 1975. Ils ont conduit à l'élaboration d'une organisation des dysarthries en 6 classes (complétée par deux classes

supplémentaires par Duffy, 1995) sur la base de clusters physiopathologiques définis à partir de la concomitance de

caractéristiques les plus déviantes perçues par un jury d'écoute. L’hypothèse sous-jacente à la construction de ces

clusters est qu’un ensemble de paramètres perturbés simultanément, mis en relation avec l’atteinte neurologique,

reflèterait un processus physiopathologique particulier. Si cette classification reste d'actualité encore aujourd'hui pour

évaluer notamment la parole dysarthrique en pratique clinique, elle reste néanmoins sujette à controverses pour deux

raisons principales : la subjectivité des évaluations perceptives d'une manière générale et la difficulté pour un être

humain, même expérimenté, à distinguer et à juger perceptivement les multiples dimensions à prendre en compte dans

l'évaluation de la parole dysarthrique. En conséquence, différents travaux ont été menés à partir des années 80 à

aujourd'hui dans l'objectif de combiner ces analyses perceptives à des méthodes plus objectives et quantitatives telles

que les analyses instrumentales basées sur des mesures acoustiques ou physiologiques (revue de la littérature dans Kay,

2012). Si les analyses instrumentales peuvent s'appuyer sur des traitements semi- voire entièrement automatiques,

l'analyse acoustique fine nécessaire pour comprendre les phénomènes déviants inhérents à la dysarthrie dans le signal de

parole demeure encore très coûteuse en temps par un expert humain. Dans ce contexte, une grande part des études

présentes dans la littérature repose soit sur un nombre très restreint de patients ou sur une pathologie bien ciblée.

Pourtant, la grande variabilité des phénomènes déviants observés dans la parole dysarthrique en fonction de la

pathologie du patient, de l'avancement de la maladie ou de la sévérité de la dysarthrie requiert d'analyser une large

population de patients.

L'objectif de cette thèse est d'étudier comment les outils du traitement automatique de la parole pourraient permettre de

traiter de larges populations de patients dysarthriques et de focaliser l'attention des experts humains sur des zones de

déviance bien identifiées du signal en vue d'analyses plus fines. Ces travaux reposeront notamment sur le système de

transcription automatique du LIA et ses activités de recherche autour des mesures de qualité des transcriptions

(Lecouteux, 2008 et Senay, 2011). La granularité de la détection des zones de déviance – ici potentiellement le mot ou

la séquence de mots – sera dans un second temps affiner par des outils travaillant à des niveaux inférieurs allant

jusqu'au phonème (Fredouille, 2011).

Ces travaux devront tenter de répondre à différentes questions :

Face à la variabilité des phénomènes de déviance observés dans la parole dysarthrique et répertoriés dans la

littérature, quels sont ceux qu'un système de détection automatique est capable de déceler ?

Est ce qu'un système automatique est capable de mettre en évidence les mêmes phénomènes de déviance qu'un

expert humain lors d'une évaluation perceptive ?

Les déviances détectées par le système automatique sont-elles pertinentes pour les phonéticiens ?

Est-il possible de mettre en relation les déviances détectées avec la physiopathologie du patient (ex : indices

hypokinéthiques pour la maladie de Parkinson, indices paralytiques pour la SLA, …) ?

Les travaux autour du système de transcription automatique du LIA devraient également ouvrir des perspectives sur la

mise en place d'un système de mesures objectives de l'intelligibilité des patients dysarthriques.

Ces travaux de thèse seront réalisés dans le cadre d'une collaboration étroite entre le LIA (Corinne Fredouille) pour son

expertise autour des systèmes automatiques, le LPL (Christine Meunier et Alain Ghio) pour son expertise sur les

analyses acoustico-phonétiques et les évaluations perceptives, les hôpitaux de la Timone (Dr Danièle Robert) et des

Pays d'Aix (François Viallet) pour leur expertise clinique. Ils seront basés sur le corpus de patients dysarthriques

élaborés dans le cadre du projet ANR DesPhoAPady (2009-2012 – Fougeron, 2010). Ce corpus présente un large panel

de patients souffrant de différentes pathologies (maladie de Parkinson, Sclérose Latérale Amiotrophique, syndrôme

cérébelleux) et différents niveaux de sévérité de dysarthrie.

Références :

J. R. Duffy, R. D. Kent, « Darley's contributions to the understanding, differential diagnosis, and scientific study of the

dysarthrias », Aphasiology 15(3):275 – 289, 2001.

F. L. Darley, A. E. Aronson, J. R. Brown, « Motor Speech Disorders », Philadelphia: W.B. Saunders, 1975.

J. R. Duffy, « Motor speech disorders : substrates, differential diagnosis and management », Motsby- Yearbook, St

Louis, 1e édition, 1995.

T. S. Kay, « Spectral analysis of stop consonants in individuals with dysarthria secondary to stroke », PhD thesis,

Department of Communication Sciences and Disorders, Faculty of the Louisiana State University and Agricultural and

Mechanical College, USA, 2012.

B. Lecouteux, « Reconnaissance automatique de la parole guidée par des transcriptions a priori », Thèse de doctorat,

Université d'Avignon et des Pays Vaucluse, 2008.

G. Senay, « Approches semi-automatiques pour la recherche d’information dans les documents audio », Thèse de

doctorat, Université d'Avignon et des Pays Vaucluse, 2011.

C. Fredouille, G. Pouchoulin, « Automatic detection of abnormal zones in pathological speech », International Congress

of Phonetic Sciences (ICPHs'11), Hong Kong, 17-21 Août 2011.

C. Fougeron et al., « Developing an acoustic-phonetic characterization of dysarthric speech in French », LREC'10

(international conference on Language Resources and Evaluation), Malte, Mai 2010.

Dossier des candidats :

. CV détaillé

. Notes

. Motivation et/ou projet scientifique correspondant au sujet

Contact scientifique : Corinne Fredouille et Christine Meunier

Contact administratif : nadera.bureau@blri.fr

 

 

Title: Detection of deviant zones in pathological speech : contribution of the automatic speech processing against the

Human expertise

Supervisor : Corinne Fredouille, Christine Meunier

Host laboratory : Laboratoire Informatique d'Avignon (collaboration with the Laboratoire Parole et Langage – Aix-en-Provence)

Field and doctoral school : computer sciences, doctoral school ED536 of the University of Avignon

Date :

. deadline for the application : 10th of june

. auditions of chosen candidates : 24th of june

Grant : 1 684.93montly gross (1 368net)

Scientific description

If the definition of the variability range in normal speech is a key issue for the current linguistic theories, a way of

dealing with its limits is to attempt to determine its frontiers through pathological variation. As reported by Duffy and

Kent, 2001 « Science often takes advantages of nature’s accidents to learn the principles of a process ». Based on this,

the knowledge of the pathological speech, based on the understanding of alteration phenomena, « observable » on the

speech production of patients suffering of speech disorders becomes a necessity.

Dysarthria is a group of speech disorders resulting from neurological impairments of speech motor control. Substantial

variations occur in dysarthric speech due to a deficit in the spatio-temporal execution of speech movements that affects

different levels of speech production (respiratory, laryngeal and supralaryngeal). The vast majority of research work

dedicated to the study of the dysarthric speech relies on perceptual analyses. The main reason is that a dysarthric patient

is dysarthric because he/she sounds dysarthric. The most known study, at international level, was done by Darley et al.,

1975. This work leads to organize dysarthria into 6 classes (completed with 2 additional classes by Duffy, 1995) on the

basis of physiopathological clusters defined from the co-occurrences of the most deviant features perceived by a

perceptual jury. The hypothesis underlying the building of these clusters is that a set of simultaneously disturbed

features, connected with the neurological injuries, should reflect a typical physiopathological process.

If this classification is still used nowadays to evaluate dysarthric speech in clinical practice notably, it remains

controversal for a couple of reasons : the subjectivity of perceptual evaluation and the difficulty for a Human being,

even with a high expertise, of distinguishing and assessing perceptually the multiple dimensions to take into account

when dealing with dysarthric speech. Consequently, different research work has been conducted since the 1980s until

now which aims at combining these perceptual analyses with more objective and quantitative approaches such as the

instrumental analyses based on acoustic or physiological measure (review of the literature can be found in Kay, 2012).

Contrary to the instrumental analyses which can rely on some semi- or full-automatic process, in-depth acoustic

analysis of speech necessary to understand the deviant phenomena related to dysarthria still remains very timeconsuming

for a Human expert. Based on this, a signifiant proportion of studies in the literature are conducted on a

limited number of patients or on a focused pathology. However, the large variability of deviant phenomena observed in

dysarthric speech according to the patient’s pathology, the stage of the disease, or the dysarthria severity require the

analysis of a large patient population.

The aim of this thesis is to study how the automatic speech processing tools could permit to treat large populations of

dysarthric patients and to focus Human experts’ attention on speech zones well identified as deviant for further in-depth

analyses. This work will rely on the automatic speech transcription developed at the LIA and its activities on the quality

measure of transcriptions (Lecouteux, 2008 et Senay, 2011). The granularity of the deviant zone detection – here the

word or set of words – will be refined, in a second step, by applying existing detection tools working at lower levels like

the phoneme (Fredouille, 2011).

This work will attempt to answer the following key issues :

Given the variability of deviant phenomena observed on dysarthric speech and reported in literature, which

ones is an automatic detection system able to capture ?

Is an automatic system able to highlight the same deviant phenomena as a Human expert will detect

perceptually ?

Are deviant speech zones detected by an automatic system relevant for a phonetician ?

Does a correlation between the type of deviant phenomena detected and the patient’s physiopathology

exist (e.g : hypokinetic feature for the Parkinson disease, paralytic features for ALS, …) ?

Studies relating to the automatic speech transcription should open up new perspectives on the implementation of an

objective system dedicated to the evaluation of the dysarthric patient’s intelligibility.

This thesis work will be carried out within a close collaboration between the LIA (Corinne Fredouille) for her expertise

on the automatic system dedicated to speech processing, the LPL (Christine Meunier and Alain Ghio) for their expertise

on acoustic-phonetic analyses and perceptual evaluations, both the hospitals of La Timone (Dr Danièle Robert) and desPays d’Aix (Pr. François Viallet) for their clinical expertise. It will be based on the dysarthric patient corpus designed

for the ANR DesPhoAPady project (2009-2012 – Fougeron, 2010). This corpus includes a large population of patients

suffering from various pathologies (Parkinson disease, ALS, cerebelar syndrom, …) and different levels of dysarthria

severity.

Bibliography :

J. R. Duffy, R. D. Kent, « Darley's contributions to the understanding, differential diagnosis, and scientific study of the

dysarthrias », Aphasiology 15(3):275 – 289, 2001.

F. L. Darley, A. E. Aronson, J. R. Brown, « Motor Speech Disorders », Philadelphia: W.B. Saunders, 1975.

J. R. Duffy, « Motor speech disorders : substrates, differential diagnosis and management », Motsby- Yearbook, St

Louis, 1e édition, 1995.

T. S. Kay, « Spectral analysis of stop consonants in individuals with dysarthria secondary to stroke », PhD thesis,

Department of Communication Sciences and Disorders, Faculty of the Louisiana State University and Agricultural and

Mechanical College, USA, 2012.

B. Lecouteux, « Reconnaissance automatique de la parole guidée par des transcriptions a priori », Thèse de doctorat,

Université d'Avignon et des Pays Vaucluse, 2008.

G. Senay, « Approches semi-automatiques pour la recherche d’information dans les documents audio », Thèse de

doctorat, Université d'Avignon et des Pays Vaucluse, 2011.

C. Fredouille, G. Pouchoulin, « Automatic detection of abnormal zones in pathological speech », International Congress

of Phonetic Sciences (ICPHs'11), Hong Kong, 17-21 Août 2011.

C. Fougeron et al., « Developing an acoustic-phonetic characterization of dysarthric speech in French », LREC'10

(international conference on Language Resources and Evaluation), Malte, Mai 2010.

Candidate application form :

. detailed CV

. marks

. Motivation and/or scientific project related to the topic

Scientific Contact : Corinne Fredouille et Christine Meunier

Administrative Contact : nadera.bureau@blri.fr


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA