![]()  | 
ISCApad Archive  »  2011  »  ISCApad #151  »  Jobs  »  (2010-07-07) Doctorat au LORIA Nancy France (fluency in french required))  | 
ISCApad #151 | 
| Monday, January 10, 2011 by Chris Wellekens | 
Sujet de thèse 
Motivations 
Dans  le cadre d'une collaboration avec une entreprise qui commercialise des  morceaux de 
documentai res vidéo (rushes), nous nous intéres  sons à la reconnaissance automatique 
des dialogues de ces  rushes afin de pouvoir les indexer. 
L'équipe parole a  développé un système de transcription automa tique de bulletins 
d'information  : ANTS [2,3]. Si les performances des systèmes de transcription 
automatique  actuels sont satisfaisantes dans le cas de la parole lue ou 
«  préparée » (bulletins d'informations, discours), elles se dégradent  fortement dans le cas 
de la parole spontanée [1,4,5]. Par  rappor t à la parole préparée, la parole spontanée se 
caractérise  par: 
• des insertions (hésitations, pauses, faux dépar t s de  mots, reprises), 
• des variations de prononciations comme la  contraction de mots ou de syllabes 
(/monsieur / => /m' sieu  / ), 
• des variations de la vitesse d'élocution (réduction de  l'articulation de certains 
phonèmes et allongement s d'aut  res phonèmes), 
• des environnement s sonores difficiles  (parole superposée, rires, bruits 
d'ambiance...). 
Ces  spécificités sont peu ou pas prises en compte par les systèmes de  reconnaissance 
actuels. Tous ces phénomène s provoquent des  erreur s de reconnais sance et peuvent 
entraîner une  indexation erronée. 
Sujet 
Le but du sujet de thèse  est de prendre en compte un ou plusieurs des phénomènes 
spécifiques  décrits ci- dessus, afin d'améliorer le taux de reconnaissance [4,6,7].  Les 
phénomène s seront choisis et traités au niveau  acoustique ou linguistique en fonction du 
profil du candidat.  Le travail consistera à : 
• comprendre l'architecture de ANTS, 
•  pour les phénomène s choisis, faire un état de l'art et proposer de  nouveaux 
algorithmes, 
• réaliser un prototype de  reconnaissance de parole spontanée et le valider sur un 
corpus  de parole spontanée étiqueté. 
Cadre du travail 
Le  travail s'effectuera au sein de l'équipe Parole de l'Inria - Loria à  Nancy 
(http: / / p a role.loria.fr). L'étudiant utilisera le  logiciel ANTS de reconnaissance 
automatique de la parole  développé dans l'équipe. 
Profil souhaité 
Les  candidat s devront maîtriser le français et l'anglais et savoir  programme r en C ou en 
Java dans un environnement Unix. Des  connaissances en modélisation stochas tique ou en 
traitement  automatique de la parole seront un plus. 
Contacts :  illina@loria.fr , fohr@loria.fr ou mella@loria.fr 
[1] S.  Galliano, E. Geoffrois, D.Mostefa , K. Choukri, JF. Bonastre and G.  Gravier, The ESTER Phase II Evaluation 
Campaign for Rich  Transcription of French broadcas t news, EUROSPEECH 2005, 
[2]  I. Irina, D. Fohr, O. Mella and C.Cerisara, The Automatic News  Transcription System: ANTS some realtime 
experiment s,  ISCPL2004 
[3] D. Fohr, O. Mella, I. Irina and C. Cerisara,  Experiment s on the accuracy of phone models and liaison 
proces  sing in a French broadcas t news transcription systems, ISCPL2004 
[4]  J.- L Gauvain, G. Adda, L. Lamel, L. F. Lefevre and H. Schwenk,  Transcription de la parole conversationnelle 
Revue TAL vol 45  n° 3 
[5] M. Garnier - Rizet, G. Adda, F. Cailliau, J.- L.  Gauvain, S. Guillemin- Lanne, L. Lamel, S. Vanni, C. Waaste - 
Richard  CallSurf: Automatic transcription, indexing and structuration of call  center conversational speech for 
knowledge extraction and  query by content. LREC 2008 
[6] J.Ogata, M.Goto, The use of  acous tically detected filled and silent pauses in spontaneous speech 
recognition  ICASSP 2009 
[7] F. Stouten, J. Duchateau, J.- P. Martens and  P. Wambacq, Coping with disfluencies in spontaneous speech 
recognition:  Acoustic detection and linguistic context manipulation, Speech  Communication vol 48, 2006 
 | 
![]()  | Back | Top |