ISCA - International Speech
Communication Association


ISCApad Archive  »  2023  »  ISCApad #299  »  Jobs  »  (20323-02-17) Internship Ingénieur.e de recherche NLP, LUNII, Paris

ISCApad #299

Monday, May 08, 2023 by Chris Wellekens

6-40 (20323-02-17) Internship Ingénieur.e de recherche NLP, LUNII, Paris
  

 

Lunii  : site carrière
TECH · LUNII PARIS · TÉLÉTRAVAIL HYBRIDE

Ingénieur.e de recherche NLP - [Stage - 6 mois]

Lunii, c'est une aventure humaine et entrepreneuriale, lancée en août 2016 * Ma Fabrique à Histoires*, un objet littéraire, technologique et ludique pour les enfants de 3 à 8 ans.

 

Vos missions

Vous rejoindrez le Pôle Tech pour participer à un projet de recherche appliquée autour de la synthèse vocale narrative. La synthèse vocale a connu des avancées spectaculaires grâce à l’utilisation de réseaux de neurones profonds, mais les procédures de préparation et d’étiquetage des données d’apprentissage sont encore très chronophages. Pour répondre à cette problématique, vous contribuerez principalement à l’amélioration d’outils d’analyse et d’étiquetage automatique dans le cadre de la préparation d’un corpus de parole pour un système de synthèse vocale.

Vous aurez pour missions de :

👩‍🎓 Étudier et améliorer les phonétiseurs - aligneurs existants

  • Inventorier, tester, évaluer et comparer les phonétiseurs - aligneurs existants,
  • Constituer un corpus d’apprentissage précis destiné à la phonétisation automatique du texte accompagné de l’audio correspondant,
  • Adapter et entraîner un modèle neuronal pour la phonétisation et l’alignement texte / audio, dans le but d’améliorer l’existant,
  • Évaluer ce modèle et le comparer à l’existant,
  • Publier les résultats dans des articles de conférence.

🙋 Évaluer et comparer les méthodes d’analyse structurelle d’une histoire

  • Inventorier, tester, évaluer et comparer les méthodes et outils de détection des tours de parole à partir du texte,
  • Explorer la détection automatique des personnages et de leurs tours de parole respectifs,
  • Inventorier, tester, évaluer et comparer les méthodes et outils d’analyse structurelle d’une histoire à partir du texte.

💃 Constituer un corpus de parole narrative

  • Utiliser les outils développés pour procéder à la phonétisation, l’alignement texte / audio, et l’étiquetage automatique de livres audio,
  • Vérifier et corriger les erreurs d’alignement et de phonétisation avec les outils de corrections manuelles existants,
  • Évaluer le gain de temps, en termes de corrections manuelles, apporté par le nouveau modèle, comparé à l’existant.

Liste non exhaustive.

Lunii recrute et reconnaît tous les talents : nous sommes profondément attaché·e·s à la mixité et à la diversité, on vous attend !

Profil recherché

  • De fortes connaissances en NLP / Machine Learning / Traitement du signal.
  • D’excellentes capacités de programmation (Python)
  • Un intérêt prononcé pour les sciences de la parole.
  • Une familiarité avec un ou plusieurs frameworks de machine learning (TensorFlow, PyTorch, etc…)
  • Une personne dynamique et force de propositions.
  • De bonnes capacités de communication orale et écrite, en français comme en anglais.

Process de recrutement

Envoyez-nous votre CV, nous prenons ensuite le temps de bien étudier votre candidature et si elle correspond à l’offre, nos échanges (en visio ou présentiel) continuent :

  • D’abord avec Mélissa, notre HR Learning & Development, pour un premier échange,
  • Ensuite avec Mélissa, Samuel, chercheur en synthèse vocal et Ludi, CTO avec un cas pratique à l’honneur

Informations complémentaires

Contrat :
 Stage conventionné de 6 mois
Rémunération : 1000€ brut/mois
Titre de transport : 50% pris en charge par Lunii
Titres restaurant : 8,50€/jour
Télétravail hybride


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA