| *Sujet* Modèles profonds pour la reconnaissance et l'analyse de la parole spontanée
Le traitement de la parole spontanée est l'un des défis majeurs que doit relever le domaine de la reconnaissance automatique de la Parole (RAP). La parole spontanée est significativement différente de la parole préparée (lecture, film, discours radiophonique, commande vocale, etc) notamment à cause des disfluences (pause, répétition, réparation, faux départ). Ces caractéristiques mettent en défaut les systèmes de RAP traditionnels car la structure de la parole spontanée est beaucoup plus difficile à modéliser que celle de la parole préparée.
Dans ce projet de doctorat nous nous intéresseront aux méthodes sans lexique basées sur des architectures de séquence à séquence pour, dans un premier volet, améliorer les performances de la RAP sur la parole spontanée et, dans un deuxième volet, étudier les structures internes des modèles neuronaux pour faire émerger de nouvelles hypothèses sur la parole spontanée. Dans le premier volet, les modèles séquence à séquence seront conçu et appris en s?appuyant sur les corpus transcrits existants (plus de 300 heures) enregistrés dans la communication quotidienne (enregistrements de discours au sein d'une famille, dans un magasin, lors d'un entretien, etc.) pour apprendre des modèles profonds de la parole spontanée.
Le deuxième volet de la thèse consistera à analyser les représentations apprises par les modèles pour les confronter aux théories et modèles linguistiques sur la parole spontanée au niveau prosodique, phonétique et grammatical. Les contributions de la thèse seront de produire des systèmes de reconnaissance de parole adapté à la parole spontanée, de permettre d'expliquer ces modèles par rapport à la connaissance actuelle sur la parole spontanée, de faire ressortir des caractéristiques linguistiques intrinsèques à la parole spontanée.
La thèse s'effectuera en collaboration avec des enseignants chercheurs du Lidilem pour des applications en socio-linguistique et linguistique de terrain.
*Environnement scientifique* La thèse sera menée au sein de l'équipe Getalp du laboratoire LIG (http: // www. liglab.fr/en/research/research-areas-and-teams/getalp) en collaboration avec le Laboratoire LIDILEM (https://lidilem.univ-grenoble-alpes.fr/). Le/la doctorant?e recruté?e bénéficiera également du soutien de la Chaire Artificial Intelligence & Language de l'intitut MIAI (https://miai.univ-grenoble-alpes.fr).
*Comment postuler ?* Les candidats doivent être titulaires d'un Master en informatique ou en traitement du langage naturel. Ils devraient idéalement avoir une solide expertise en traitement automatique de la parole. Ils doivent également avoir une très bonne connaissance des langues française et anglaise. Les candidatures sont attendues avant le 9 octobre 2020 et doivent être adressées à François Portet à Francois.Portet@imag.fr et Solange Rossato Solange.Rossato@imag.fr Les candidat?es doivent joindre : - une lettre de candidature expliquant pourquoi ils/elles se considèrent capables de poursuivre ce projet de thèse, - leur dernier diplôme, - un CV. Ils/elles peuvent également ajouter des lettres de recommandation.
Le comité de sélection informera les candidat?es de sa décision avant le 15 octobre 2020. Si vous avez d'autres questions sur le poste et le projet, veuillez contacter François Portet et/ou Solange Rossato
|