|    | 
Sujet de these 
Motivations 
Dans le cadre d'une collaboration avec une entreprise qui commercialise des morceaux de 
documentai res vidéo (rushes), nous nous intéres sons à la reconnaissance automatique 
des dialogues de ces rushes afin de pouvoir les indexer. 
L'équipe parole a développé un système de transcription automa tique de bulletins 
d'information : ANTS [2,3]. Si les performances des systèmes de transcription 
automatique actuels sont satisfaisantes dans le cas de la parole lue ou 
« préparée » (bulletins d'informations, discours), elles se dégradent fortement dans le cas 
de la parole spontanée [1,4,5]. 
  
Cadre du travail
Le travail s'effectuera au sein de l'équipe Parole de l'Inria - Loria à Nancy 
(http: / / parole.loria.fr). L'étudiant utilisera le logiciel ANTS de reconnaissance 
automatique de la parole développé dans l'équipe. 
Profil souhaité 
Les candidat s devront maîtriser le français et l'anglais et savoir programme r en C ou en 
Java dans un environnement Unix. Des connaissances en modélisation stochas tique ou en 
traitement automatique de la parole seront un plus. 
Contacts 
: illina@loria.fr , fohr@loria.fr ou mella@loria.fr
[1] S. Galliano, E. Geoffrois, D.Mostefa , K. Choukri, JF. Bonastre and G. Gravier, The ESTER Phase II Evaluation 
Campaign for Rich Transcription of French broadcas t news, EUROSPEECH 2005, 
[2] I. Irina, D. Fohr, O. Mella and C.Cerisara, The Automatic News Transcription System: ANTS some realtime 
experiment s, ISCPL2004 
[3] D. Fohr, O. Mella, I. Irina and C. Cerisara, Experiment s on the accuracy of phone models and liaison 
proces sing in a French broadcas t news transcription systems, ISCPL2004 
[4] J.- L Gauvain, G. Adda, L. Lamel, L. F. Lefevre and H. Schwenk, Transcription de la parole conversationnelle 
Revue TAL vol 45 n° 3 
[5] M. Garnier - Rizet, G. Adda, F. Cailliau, J.- L. Gauvain, S. Guillemin- Lanne, L. Lamel, S. Vanni, C. Waaste - 
Richard CallSurf: Automatic transcription, indexing and structuration of call center conversational speech for 
knowledge extraction and query by content. LREC 2008 
[6] J.Ogata, M.Goto, The use of acous tically detected filled and silent pauses in spontaneous speech 
recognition ICASSP 2009 
[7] F. Stouten, J. Duchateau, J.- P. Martens and P. Wambacq, Coping with disfluencies in spontaneous speech 
recognition: Acoustic detection and linguistic context manipulation, Speech Communication vol 48, 2006 
  |