ISCApad Archive » 2024 » ISCApad #313 » Jobs » (2024-06-07) Deux postes d'ingenieur à l'INRIA Nancy, France |
ISCApad #313 |
Saturday, July 06, 2024 by Chris Wellekens |
INRIA Nancy propose deux offres de postes d'ingénieur. Nous vous remercions de les transmettre aux potentielles personnes intéressées. Les candidats sont invités à postuler en ligne dès que possible. Les candidatures seront évaluées au fil de l'eau. Contexte : À travers le projet COLaF (Corpus et Outils pour les Langues de France), Inria a pour objectif de contribuer au développement de corpus et d’outils libres pour le français et les autres langues de France (alsacien, breton, corse, occitan, etc). La promotion et sauvegarde de ces langues dépend de la disponibilité des technologies linguistiques, mais ces langues sont largement ignorées par les industriels. Poste 1 : Ingénieur en Traitement des Langues et Développement de Modèles de reconnaissance de la parole La principale difficulté au développement de technologies linguistiques variées est le manque de données. En particulier, les données audio ont besoin d’une transcription pour la plupart des applications. Mais transcrire manuellement des données audio est coûteux en temps, nécessite la participation d’un.e locuteur.trice de bon niveau, et peut résulter en des données inconsistentes en l’absence d’orthographe standard. Afin d’augmenter la quantité de données audio annotées pour diverses langues de France, et de développer la première brique de chaines de traitement variées pour ces langues, nous souhaitons développer une chaine de traitement pour l’entrainement de systèmes de reconnaissance de la parole (ASR, automatic speech recognition). Pour plus d'information et postuler : https://jobs.inria.fr/public/classic/fr/offres/2024-07719
Poste 2 : Ingénieur en Traitement Linguistique et Développement de Modèles de synthèse de la parole L’un des souhaits exprimés par la communauté est un système de synthèse de la parole (TTS, text to speech) qui permettrait de créer facilement du contenu audio à partir de textes, et donc d’enrichir les média existants dans ces langues. Le système devra être adapté au contexte des langues peu dotées. Il devra être souple afin de s’adapter à des sources de données d’entrainement variant dans leur quantité et qualité. Il s’agit de types d’enregistrements variés : longues interviews, phrases isolées, émissions de TV, etc.
Pour plus d'information et postuler : https://jobs.inria.fr/public/classic/fr/offres/2024-07720 |
Back | Top |