| Titre : Sous-titrage automatique de parole dans une 'smart class' pour l'accessibilité des personnes sourdes
Responsable(s) : Isabelle Estève (LIDILEM) : isabelle.esteve@u-grenoble3.fr François Portet & Benjamin Lecouteux (LIG-GETALP) : Francois.Portet@imag.fr, benjamin.lecouteux@imag.fr
Mots-clés : Reconnaissance automatique de la parole, surdité, Communication améliorée et alternative, accessibilité, smart space. Durée du projet : 4/5/6 mois Nombre maximal d'étudiants : 1 ou 2
Lieu du stage : Laboratoire d'Informatique de Grenoble, UMR CNRS 5217, 110 av. de la Chimie - Domaine Universitaire de Saint-Martin-d?Hères
Description
Le but de ce projet est de mettre en place un système de reconnaissance automatique de la parole pour le sous-titrage en direct de cours académiques. Ce système s'adresserait en priorité aux personnes sourdes pour remédier aux difficultés d'accessibilité au discours en français oral de l'enseignant et pour favoriser ainsi l'accès à l'enseignement supérieur de ce public. En complément à la réalisation du système de sous-titrage, le projet comporte la réalisation d'une interface de communication pour permettre à une personne sourde, de poser des questions ou faire des remarques pendant le déroulement du cours. La surdité ayant des implications communicatives fortes, notamment concernant l'accès à la langue française dans ses dimensions orales mais également écrites. Une adaptation aux besoins des utilisateurs sourds des sous-titrages fera partie intégrante du projet. A terme, d'autres applications pourraient également être envisagées : public FLS/FLE notamment pour lesquels le suivi de cours en langue française orale peut poser difficulté.
Le déroulement du stage consistera à : - étude bibliographique des solutions existantes et des besoins spécifiques aux personnes sourdes - prise en main du système de reconnaissance vocale automatique KALDI - prise en main du système d'analyse sonore Cirdox - tests sur des corpus enregistrés - connexion des sorties de reconnaissance à un système de sous-titrage - tests en-ligne - tests dans la 'smart class' avec un professeur et des étudiants - si le temps le permet, étude de réalisation d'interface d'interaction.
Profil du candidat : - Master/Ingénieur en Informatique, télécommunication ou traitement du signal - Intérêt avéré pour les technologies vocales et ou la Communication améliorée et alternative - Maîtrise du langage C impérative, connaissance de Linux. - Esprit d'équipe, ouverture et autonomie
Références
[1] D. Povey, A. Ghoshal, G. Boulianne, L. Burget, O. Glembek, N. Goel, M. Hannemann, P. Motlicek, Y. Qian, P. Schwarz, J. Silovsky, G. Stemmer and K. Vesely. The Kaldi Speech Recognition Toolkit, Idiap-RR-04-2012 [2] B. Lecouteux, G. Linares, and S. Oger. Integrating imperfect transcripts into speech recognition systems for building high-quality corpora. Computer Speech and Language, 2011. [3] F. Aman, M. Vacher, S. Rossato, R. Dugheanu, F. Portet, J. Le Grand, Y. Sasa. Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l'adaptation des systèmes de RAP. JEP-TALN-RECITAL 2012, volume 1: JEP, Jun 2012, Grenoble, France. ATALA/AFCP, pp.707--714. |