ISCA Services

ISCA - International Speech
Communication Association

ISCApad Archive » 2023 » ISCApad #306 » Jobs » (2023-06-26) These CIFRE pleinement financée, IMAG et Eloquant, Grenoble, France

ISCApad #306

Saturday, December 09, 2023 by Chris Wellekens

6-12 (2023-06-26) These CIFRE pleinement financée, IMAG et Eloquant, Grenoble, France

Appel pour une thèse CIFRE pleinement financée

Sujet : PRESAC – Prédiction de la Satisfaction Client à partir de données massives d’appels vocaux

Partenaires : Laboratoire d’Informatique de Grenoble, Eloquant

Durée du contrat : CDD de 36 mois

Langue officielle : français

Date de début : septembre 2023

Date limite de candidature : jusqu’à ce que le poste soit pourvu

Salaire : De 2000 € brut / mois en début de thèse, à 2300 € brut / mois en fin de thèse

Avantages : mutuelle, tickets restaurant, participation aux frais de transports en commun, ...

Missions : recherche et développement (enseignement possible mais non obligatoire)

Mots clés : Satisfaction client, données massives d’appels vocaux à distance, grands modèles de langage

Environnement

Grenoble compte parmi les écosystèmes de recherche les plus dynamiques de France. Reconnu pour son excellence scientifique et technologique ainsi que son potentiel d’innovation, le site universitaire grenoblois a obtenu la labellisation « Initiative d’excellence », labellisation réservée à une dizaine de sites universitaires en France [1].

La personne recrutée sera accueillie en alternance (selon les besoins du projet) au sein de l'équipe GETALP [2] du Laboratoire d'Informatique de Grenoble (LIG), et au sein du pôle recherche de l’entreprise Eloquant. L'équipe GETALP est hébergée dans un bâtiment moderne (IMAG), situé sur un campus paysager de 175 hectares qui a été classé huitième plus beau campus d'Europe par le journal Times Higher Education en 2018. L’entreprise Eloquant est également située à proximité immédiate de ce campus.

Contexte industriel

Eloquant [3] est une entreprise d’informatique d’environ 110 personnes, spécialisée dans la relation client depuis 2001. Eloquant est aujourd’hui le seul acteur en France à proposer une solution globale en mode Software as a Service, destinée à faciliter le dialogue et l’écoute de ses clients. Elle vise à fournir à ses clients une fluidification et une accélération de leurs processus, en leur fournissant des informations d’intérêt tout en réduisant la sollicitation des clients finaux par l’envoi d'enquêtes de satisfaction post-appel.

Contexte académique

L’équipe GETALP est une équipe pluridisciplinaire (informatique, langue, phonétique, traduction et traitement de signaux, etc.) dont l’objectif est d’aborder tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l’information multilingue (écrite ou orale). La méthodologie de travail du GETALP s’appuie sur des allers-retours continus entre collectes de données, investigations fondamentales, développement de systèmes opérationnels, applications et évaluations expérimentales. L’équipe est aussi réputée pour avoir contribué au développement des premiers grands modèles de langage pour le français, à l’écrit (HANG et al., 2020), ou à l’oral (EVAIN et al., 2021a,b).

Objectifs de la thèse

Une première étape de cette thèse consiste à réaliser un état de l’art des techniques existantes pour prédire la satisfaction client à partir de conversations téléphoniques. Cette étude sera suivie par un travail d’analyse statistique des données propriétaires d’Eloquant, dans l’objectif de construire un corpus d’apprentissage et d’évaluation de méthodes d’inférence. Une fois le corpus de données constitué, le travail consistera à modéliser la satisfaction client à partir des indices linguistiques et acoustiques présents dans les enregistrements. Les outils d’extraction d’informations langagières reposeront autant sur des approches statistiques (e.g., descripteurs prosodiques et probabilistes appliquées sur des items), que sur des grands modèles de langage, tels que BERT (DEVLIN et al., 2019) pour le texte et Whisper (RADFORD et al., 2022) ou Wav2Vec 2.0 (BAEVSKI et al., 2020) pour la parole, notamment pour la langue française (EVAIN et al., 2021a,b). Nous envisageons également l’ajustement (fine-tuning) de ces modèles sur les données propriétaires pour optimiser les performances. Les descripteurs utilisés seront exploités pour évaluer différentes approches d’inférence de la satisfaction client sur les données préalablement identifiées, avec des approches neuronales telles que des modèles récurrents à base d'attention (BAHDANAU et al., 2015). Une part importante du travail consistera également à évaluer la robustesse du système sur la tâche, notamment sur des instances non étiquetées via une tâche d'évaluation humaine.

Compétences et savoir-faire attendu

Titulaire d’un Diplôme de Master 2 Recherche (ou d’un diplôme équivalent conférant le grade de Master, avec une expérience de recherche) avec des fortes connaissances en Traitement Automatique des Langues (TAL) et en apprentissage profond.

Puisqu’il s’agira d’étudier des phénomènes sociolinguistiques du français, la personne candidatant doit avoir le français comme langue maternelle ou un niveau C2.

Profil recherché

Bonnes connaissances en apprentissage artificiel, notamment apprentissage profond ;
Bonnes connaissances en traitement du signal audio ;
Méthodologies expérimentales pour l’évaluation ;
Bonne connaissance du langage Python ;
Motivation pour le travail en équipe et dans un environnement interdisciplinaire ;
Bonnes capacités de communication ;
Très bonnes capacités rédactionnelles

Instructions pour candidater

Les dossiers de candidature doivent être adressés à l’ensemble des personnes suivantes : Fabien Ringeval (fabien.ringeval@imag.fr), Marco Dinarelli (marco.dinarelli@univ-grenoble-alpes.fr), Ruslan Kalitvianski (ruslan.kalitvianski@eloquant.com), Mathieu Ruhlmann (mathieu.ruhlmann@eloquant.com) ainsi qu’à l’adresse drh@eloquant.com et doivent contenir :
Les relevés de notes détaillés du Master (ou équivalent), 1re et 2nde année ;
Un curriculum vitae à jour ;
Un résumé d’une page sur l'expérience et les intérêts liés au poste ;
Une ou plusieurs lettres de recommandation (non obligatoire)

Bibliographie

BAEVSKI, Alexei, MOHAMED, Abdelrahman, AULI, Michael. Wav2VEc 2.0: A Framework for Self-Supervised Learning of Speech Representations. In Neural Information Processing Systems (NeurIPS), 2020.

BAHDANAU, Dzmitry, CHO, Kyunghyun, BENGIO, Yoshua. Neural Machine Translation by Jointly Learning to Align and Translate. In International Conference on Learning Representation (ICLR), 2015.

DEVLIN, Jacob, CHANG, Ming-Wei, LEE, Kenton, et al. Bert: Pre-training of deep bidirectional transformers for language understanding. Association for Computatinoal Linguistics (ACL), 2019.

EVAIN, Solène, NGUYEN, Ha, LE, Hang, et al. Task Agnostic and Task Specific Self-Supervised Learning from Speech with LeBenchmark. In Proceedings of the 35th Conference on Neural Information Processing Systems (NeurIPS), 2021.

EVAIN, Solène, NGUYEN, Ha, LE, Hang, et al. LeBenchmark: A Reproducible Framework for Assessing Self-Supervised Representation Learning from Speech. In Proceedings of Interspeech, 2021.

HANG, Le, VIAL, Loïc, FREJ, Jibril, et al. FlauBERT: Unsupervised Language Model Pre-training for French. In Language Resources and Evaluation Conference (LREC), 2020.

RADFORD, Alec, KIM, Jong Wook, XU, Tao, et al. Robust Speech Recognition via Large-Scale Weak Supervision. ArXiv preprint abs/2212.04356, 2022

[1] https://www.univ-grenoble-alpes.fr/recherche/

[2] https://lig-getalp.imag.fr/

[3] https://www.eloquant.com/

Back

Top

Organisation	Events	Membership	Help
> Board	> Interspeech	> Join - renew	> Sitemap
> Legal documents	> Workshops	> Membership directory	> Contact
> Logos			> FAQ
			> Privacy policy