|  | Titre : Sous-titrage automatique de parole dans une 'smart class' pour l'accessibilité des personnes sourdes
 
 Responsable(s) :
 Isabelle Estève (LIDILEM) : isabelle.esteve@u-grenoble3.fr
 François Portet & Benjamin Lecouteux (LIG-GETALP) : Francois.Portet@imag.fr,
 benjamin.lecouteux@imag.fr
 
 Mots-clés : Reconnaissance automatique de la parole, surdité, Communication améliorée et
 alternative, accessibilité, smart space.
 Durée du projet : 4/5/6 mois
 Nombre maximal d'étudiants : 1 ou 2
 
 Lieu du stage : Laboratoire d'Informatique de Grenoble, UMR CNRS 5217, 110 av. de la
 Chimie - Domaine Universitaire de Saint-Martin-d?Hères
 
 Description
 
 Le but de ce projet est de mettre en place un système de reconnaissance automatique de la
 parole pour le sous-titrage en direct de cours académiques. Ce système s'adresserait en
 priorité aux personnes sourdes pour remédier aux difficultés d'accessibilité au discours
 en français oral de l'enseignant et pour favoriser ainsi l'accès à l'enseignement
 supérieur de ce public. En complément à la réalisation du système de sous-titrage, le
 projet comporte la réalisation d'une interface de communication pour permettre à une
 personne sourde, de poser des questions ou faire des remarques pendant le déroulement du
 cours. La surdité ayant des implications communicatives fortes, notamment concernant
 l'accès à la langue française dans ses dimensions orales mais également écrites. Une
 adaptation aux besoins des utilisateurs sourds des sous-titrages fera partie intégrante
 du projet.
 A terme, d'autres applications pourraient également être envisagées : public FLS/FLE
 notamment pour lesquels le suivi de cours en langue française orale peut poser difficulté.
 
 Le déroulement du stage consistera à :
 - étude bibliographique des solutions existantes et des besoins spécifiques aux personnes
 sourdes
 - prise en main du système de reconnaissance vocale automatique KALDI
 - prise en main du système d'analyse sonore Cirdox
 - tests sur des corpus enregistrés
 - connexion des sorties de reconnaissance à un système de sous-titrage
 - tests en-ligne
 - tests dans la 'smart class' avec un professeur et des étudiants
 - si le temps le permet, étude de réalisation d'interface d'interaction.
 
 Profil du candidat :
 - Master/Ingénieur en Informatique, télécommunication ou traitement du signal
 - Intérêt avéré pour les technologies vocales et ou la Communication améliorée et
 alternative
 - Maîtrise du langage C impérative, connaissance de Linux.
 - Esprit d'équipe, ouverture et autonomie
 
 Références
 
 [1] D. Povey, A. Ghoshal, G. Boulianne, L. Burget, O. Glembek, N. Goel, M.  Hannemann, P.
 Motlicek, Y. Qian, P. Schwarz, J. Silovsky, G. Stemmer and K. Vesely. The Kaldi Speech
 Recognition Toolkit,  Idiap-RR-04-2012
 [2] B. Lecouteux, G. Linares, and S. Oger. Integrating imperfect transcripts into speech
 recognition systems for building high-quality corpora. Computer Speech and Language, 2011.
 [3] F. Aman, M. Vacher, S. Rossato, R. Dugheanu, F. Portet, J. Le Grand, Y. Sasa. Étude
 de la performance des modèles acoustiques pour des voix de personnes âgées en vue de
 l'adaptation des systèmes de RAP. JEP-TALN-RECITAL 2012, volume 1: JEP, Jun 2012,
 Grenoble, France. ATALA/AFCP, pp.707--714.
 |