ISCA Services

ISCA - International Speech
Communication Association

ISCApad Archive » 2015 » ISCApad #200 » Jobs » (2015-01-22) Internship: Sous-titrage automatique de parole dans une 'smart clas ' pour l'accessibilité des personnes sourdes, Laboratoire d'Informatique de Grenoble,France

ISCApad #200

Friday, February 13, 2015 by Chris Wellekens

6-35 (2015-01-22) Internship: Sous-titrage automatique de parole dans une 'smart clas ' pour l'accessibilité des personnes sourdes, Laboratoire d'Informatique de Grenoble,France

Titre : Sous-titrage automatique de parole dans une 'smart class' pour l'accessibilité
des personnes sourdes

Responsable(s) :
Isabelle Estève (LIDILEM) : isabelle.esteve@u-grenoble3.fr
François Portet & Benjamin Lecouteux (LIG-GETALP) : Francois.Portet@imag.fr,
benjamin.lecouteux@imag.fr

Mots-clés : Reconnaissance automatique de la parole, surdité, Communication améliorée et
alternative, accessibilité, smart space.
Durée du projet : 4/5/6 mois
Nombre maximal d'étudiants : 1 ou 2

Lieu du stage : Laboratoire d'Informatique de Grenoble, UMR CNRS 5217, 110 av. de la
Chimie - Domaine Universitaire de Saint-Martin-d?Hères

Description

Le but de ce projet est de mettre en place un système de reconnaissance automatique de la
parole pour le sous-titrage en direct de cours académiques. Ce système s'adresserait en
priorité aux personnes sourdes pour remédier aux difficultés d'accessibilité au discours
en français oral de l'enseignant et pour favoriser ainsi l'accès à l'enseignement
supérieur de ce public. En complément à la réalisation du système de sous-titrage, le
projet comporte la réalisation d'une interface de communication pour permettre à une
personne sourde, de poser des questions ou faire des remarques pendant le déroulement du
cours. La surdité ayant des implications communicatives fortes, notamment concernant
l'accès à la langue française dans ses dimensions orales mais également écrites. Une
adaptation aux besoins des utilisateurs sourds des sous-titrages fera partie intégrante
du projet.
A terme, d'autres applications pourraient également être envisagées : public FLS/FLE
notamment pour lesquels le suivi de cours en langue française orale peut poser difficulté.

Le déroulement du stage consistera à :
- étude bibliographique des solutions existantes et des besoins spécifiques aux personnes
sourdes
- prise en main du système de reconnaissance vocale automatique KALDI
- prise en main du système d'analyse sonore Cirdox
- tests sur des corpus enregistrés
- connexion des sorties de reconnaissance à un système de sous-titrage
- tests en-ligne
- tests dans la 'smart class' avec un professeur et des étudiants
- si le temps le permet, étude de réalisation d'interface d'interaction.

Profil du candidat :
- Master/Ingénieur en Informatique, télécommunication ou traitement du signal
- Intérêt avéré pour les technologies vocales et ou la Communication améliorée et
alternative
- Maîtrise du langage C impérative, connaissance de Linux.
- Esprit d'équipe, ouverture et autonomie

Références

[1] D. Povey, A. Ghoshal, G. Boulianne, L. Burget, O. Glembek, N. Goel, M. Hannemann, P.
Motlicek, Y. Qian, P. Schwarz, J. Silovsky, G. Stemmer and K. Vesely. The Kaldi Speech
Recognition Toolkit, Idiap-RR-04-2012
[2] B. Lecouteux, G. Linares, and S. Oger. Integrating imperfect transcripts into speech
recognition systems for building high-quality corpora. Computer Speech and Language, 2011.
[3] F. Aman, M. Vacher, S. Rossato, R. Dugheanu, F. Portet, J. Le Grand, Y. Sasa. Étude
de la performance des modèles acoustiques pour des voix de personnes âgées en vue de
l'adaptation des systèmes de RAP. JEP-TALN-RECITAL 2012, volume 1: JEP, Jun 2012,
Grenoble, France. ATALA/AFCP, pp.707--714.

Back

Top

Organisation	Events	Membership	Help
> Board	> Interspeech	> Join - renew	> Sitemap
> Legal documents	> Workshops	> Membership directory	> Contact
> Logos			> FAQ
			> Privacy policy