ISCA - International Speech
Communication Association


ISCApad Archive  »  2021  »  ISCApad #280  »  Jobs  »  (2021-07-02) PhD position at LIG Grenoble, France

ISCApad #280

Wednesday, October 06, 2021 by Chris Wellekens

6-18 (2021-07-02) PhD position at LIG Grenoble, France
  
Sujet de thèse dans le cadre du projet  ANR Franco-Suisse Propicto (https://propicto.unige.ch),
encadrée par Benjamin Lecouteux, Didier Schwab et Emmanuelle Esperança-Rodier

 

Traduction automatique de la parole vers des pictogrammes.

 

PROPICTO vise à développer un axe de recherche autour de la communication alternative et augmentée en se focalisant sur la transcription automatique de la parole sous forme pictographique. PROPICTO répond à la fois à des besoins forts dans le domaine du handicap et relève de nombreux défis de recherche autour du traitement automatique de la langue naturelle. PROPICTO a la volonté d?être pluridisciplinaire en coopérant avec des linguistes et le milieu du handicap. La finalité du projet est de proposer un système qui est capable de transcrire directement de la parole sous la forme d?une suite de pictogrammes. 

 

Cette thèse sera axée sur la traduction de l?oral vers des ensembles de pictogrammes. 
L?un des verrous scientifique de cette thèse est de chercher à pallier la quantité limitée d?exemples sous forme de pictogrammes et de corpus parole/pictogrammes.
Les approches utilisées s?inspireront dans un premier temps des approches de la traduction de la parole massivement multilingue où d?autres langues peuvent aider à traduire une langue pour laquelle les données sont rares.
Les aspects simplification de la langue seront également abordées dans ce sujet et appuyées par une autre thèse portant sur l?analyse syntaxique de l?oral.
Parallèlement au déroulement de cette thèse, des récoltes de corpus au sein de différentes institutions seront réalisées pour obtenir des paires parole/pictogrammes et répondre aux attentes en situation réelle.
L?évaluation des méthodes sera également une dimension importante de cette thèse et pourra s?inspirer, par exemple, des méthodes d?évaluation de la traduction automatique.

 

Profil recherché:
      - Solide expérience en programmation & machine learning pour le TAL, notamment l?apprentissage profond

 - Master ayant une composante Traitement Automatique des Langues ou linguistique computationnelle

- Bonne connaissance du français

 

 

Détails pratiques:

- Début de la thèse entre septembre et novembre 2021
- Contrat doctoral à temps plein au LIG (équipe Getalp) pour 3 ans (salaire: min 1768?e brut mensuel)

 

Environnement scientifique/ 

 

La thèse sera menée au sein de l'équipe Getalp du laboratoire LIG  (https://lig-getalp.imag.fr/). La personne recrutée sera accueillie au  sein de l?équipe qui offre un cadre de travail stimulant, multinational  et agréable. 

 

Les moyens pour mener à bien le doctorat seront assurés tant en ce qui concerne les missions en France et à l?étranger qu?en ce qui concerne le matériel (ordinateur personnel, accès aux serveurs GPU du LIG, Grille de calcul Jean Zay du CNRS). 

 

 

/Comment postuler ?/ 

 

Les candidats doivent être titulaires d'un Master en informatique ou en traitement automatique du langage naturel (ou être sur le point d'en obtenir un). Ils doivent avoir une bonne connaissance des méthodes d?apprentissage automatique et idéalement une expérience en collecte et gestion de corpus. Ils doivent également avoir une bonne connaissance de la langue française. Une expérience dans le domaine  du traitement automatique de la parole ou de la traduction automatique (neuronaux ou pas ) et/ou une sensibilisation au milieu du handicap serait un plus. 

 

Les candidatures sont attendues jusqu'au 1er juillet 2021. Elles doivent contenir : CV + lettre/message de motivation + notes de master + lettre(s) de recommandations; et être adressées à Benjamin Lecouteux (benjamin.lecouteux@univ-grenoble-alpes.fr), Didier Schwab (Didier.Schwab@univ-grenoble-alpes.fr) et Emmanuelle Esperança-Rodier (Emmanuelle.Esperanca-Rodier@univ-grenoble-alpes.fr). 

 

 

Références : 

 

LeBenchmark: A Reproducible Framework for Assessing Self-Supervised Representation Learning from Speech Solene EvainHa NguyenHang LeMarcely Zanon BoitoSalima MdhaffarSina AlisamirZiyi TongNatalia TomashenkoMarco DinarelliTitouan ParcolletAlexandre AllauzenYannick EsteveBenjamin LecouteuxFrancois PortetSolange RossatoFabien RingevalDidier SchwabLaurent Besacier

Hang Le, Loïc Vial, Jibril Frej, Vincent Segonne, Maximin Coavoux, et al.. FlauBERT: Unsupervised Language Model Pre-training for French. LREC, 2020, Marseille, France. ?hal-02890258?

Hang Le, Juan Pino, Changhan Wang, Jiatao Gu, Didier Schwab, et al.. Dual-decoder Transformer for Joint Automatic Speech Recognition and Multilingual Speech Translation. COLING 2020 (long paper), Dec 2020, Virtual, Spain. ?hal-02991564?

Didier Schwab, Pauline Trial, Céline Vaschalde, Loïc Vial, Benjamin Lecouteux. Apporter des connaissances sémantiques à un jeu de pictogrammes destiné à des personnes en situation de handicap : Un ensemble de liens entre Wordnet et Arasaac, Arasaac-WN. TALN 2019, 2019, Toulouse, France. ?hal-02127258?


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA