ISCA Services

ISCA - International Speech
Communication Association

ISCApad Archive » 2011 » ISCApad #151 » Jobs » (2010-07-07) Doctorat au LORIA Nancy France (fluency in french required))

ISCApad #151

Monday, January 10, 2011 by Chris Wellekens

6-2 (2010-07-07) Doctorat au LORIA Nancy France (fluency in french required))

Sujet de thèse

Motivations

Dans le cadre d'une collaboration avec une entreprise qui commercialise des morceaux de

documentai res vidéo (rushes), nous nous intéres sons à la reconnaissance automatique

des dialogues de ces rushes afin de pouvoir les indexer.

L'équipe parole a développé un système de transcription automa tique de bulletins

d'information : ANTS [2,3]. Si les performances des systèmes de transcription

automatique actuels sont satisfaisantes dans le cas de la parole lue ou

« préparée » (bulletins d'informations, discours), elles se dégradent fortement dans le cas

de la parole spontanée [1,4,5]. Par rappor t à la parole préparée, la parole spontanée se

caractérise par:

• des insertions (hésitations, pauses, faux dépar t s de mots, reprises),

• des variations de prononciations comme la contraction de mots ou de syllabes

(/monsieur / => /m' sieu / ),

• des variations de la vitesse d'élocution (réduction de l'articulation de certains

phonèmes et allongement s d'aut res phonèmes),

• des environnement s sonores difficiles (parole superposée, rires, bruits

d'ambiance...).

Ces spécificités sont peu ou pas prises en compte par les systèmes de reconnaissance

actuels. Tous ces phénomène s provoquent des erreur s de reconnais sance et peuvent

entraîner une indexation erronée.

Sujet

Le but du sujet de thèse est de prendre en compte un ou plusieurs des phénomènes

spécifiques décrits ci- dessus, afin d'améliorer le taux de reconnaissance [4,6,7]. Les

phénomène s seront choisis et traités au niveau acoustique ou linguistique en fonction du

profil du candidat. Le travail consistera à :

• comprendre l'architecture de ANTS,

• pour les phénomène s choisis, faire un état de l'art et proposer de nouveaux

algorithmes,

• réaliser un prototype de reconnaissance de parole spontanée et le valider sur un

corpus de parole spontanée étiqueté.

Cadre du travail

Le travail s'effectuera au sein de l'équipe Parole de l'Inria - Loria à Nancy

(http: / / p a role.loria.fr). L'étudiant utilisera le logiciel ANTS de reconnaissance

automatique de la parole développé dans l'équipe.

Profil souhaité

Les candidat s devront maîtriser le français et l'anglais et savoir programme r en C ou en

Java dans un environnement Unix. Des connaissances en modélisation stochas tique ou en

traitement automatique de la parole seront un plus.

Contacts : illina@loria.fr , fohr@loria.fr ou mella@loria.fr

[1] S. Galliano, E. Geoffrois, D.Mostefa , K. Choukri, JF. Bonastre and G. Gravier, The ESTER Phase II Evaluation

Campaign for Rich Transcription of French broadcas t news, EUROSPEECH 2005,

[2] I. Irina, D. Fohr, O. Mella and C.Cerisara, The Automatic News Transcription System: ANTS some realtime

experiment s, ISCPL2004

[3] D. Fohr, O. Mella, I. Irina and C. Cerisara, Experiment s on the accuracy of phone models and liaison

proces sing in a French broadcas t news transcription systems, ISCPL2004

[4] J.- L Gauvain, G. Adda, L. Lamel, L. F. Lefevre and H. Schwenk, Transcription de la parole conversationnelle

Revue TAL vol 45 n° 3

[5] M. Garnier - Rizet, G. Adda, F. Cailliau, J.- L. Gauvain, S. Guillemin- Lanne, L. Lamel, S. Vanni, C. Waaste -

Richard CallSurf: Automatic transcription, indexing and structuration of call center conversational speech for

knowledge extraction and query by content. LREC 2008

[6] J.Ogata, M.Goto, The use of acous tically detected filled and silent pauses in spontaneous speech

recognition ICASSP 2009

[7] F. Stouten, J. Duchateau, J.- P. Martens and P. Wambacq, Coping with disfluencies in spontaneous speech

recognition: Acoustic detection and linguistic context manipulation, Speech Communication vol 48, 2006

Back

Top

Organisation	Events	Membership	Help
> Board	> Interspeech	> Join - renew	> Sitemap
> Legal documents	> Workshops	> Membership directory	> Contact
> Logos			> FAQ
			> Privacy policy