ISCApad #289

Sunday, July 10, 2022 by Chris Wellekens

6 Jobs

6-1

(2022-06-15) Ingénieur.e science des données et corpus – Laboratoire d’Informatique de Grenoble, France

Ingénieur.e science des données et corpus – Laboratoire d’Informatique de Grenoble

Analyse, conception, mise en forme et diffusion des corpus vocaux et multimodaux du LIG et du LIDILEM

Poste à pourvoir : ingénieur - CDD

Durée : 1 an (possibilité de prolongation)

Début : à partir du 1er septembre 2022

Date limite de candidature : 30 juin 2022

Lieu : Laboratoire d’informatique de Grenoble – Équipe Getalp

Domaine : Traitement Automatique des Langues et de la Parole
Profil : Master 2 informatique ou doctorat en informatique linguistique

Contexte

Le poste à pouvoir est soutenu par la Chaire Artificial Intelligence & Language de l'Institut MIAI Grenoble Alpes. MIAI est un centre d’excellence en intelligence artificielle qui vise à conduire des recherches au plus haut niveau, à proposer des enseignements attractifs pour les étudiant.e.s et les professionnel.le.s de tous les niveaux, à soutenir l'innovation dans les grandes entreprises, les PMEs et les startups et enfin à informer et interagir avec les citoyen.ne.s sur tous les aspects de l'IA. La personne recrutée sera hébergée au sein de l'équipe GETALP du Laboratoire d'Informatique de Grenoble (LIG), qui offre un cadre dynamique, international et stimulant pour mener des recherches pluridisciplinaires de haut niveau. L'équipe GETALP est hébergée dans un bâtiment moderne (IMAG) situé sur un campus paysager de 175 hectares qui a été classé huitième plus beau campus d'Europe par le magazine Times Higher Education en 2018.

Missions confiées

Organiser des corpus contenant des données multimodales (audio, texte, vidéo).
Traiter et transformer les données en format d’usage pour faciliter les traitements et la reproductibilité.
Développer des scripts pour la transformation, le formatage et le test des données (Python, Bash, Java).
Superviser des campagnes d’annotation de données (Elan, doccano, Brat).
Diffuser ces corpus sur des plateformes ouvertes (ORTOLANG, Zenodo, ELRA) et faciliter leur exploitation.
Participer à la rédaction de documents scientifiques et techniques.
Assister la mise en œuvre et gérer divers pipelines logiciels pour soutenir l'analyse de données et l'exploration de textes.
Aider les autres membres de l'équipe à réaliser des expériences concernant les données.
Documenter le cycle de vie des données et mettre à jour le plan de gestion des données.

Vous travaillerez en étroite collaboration avec des doctorants, des stagiaires et des chercheurs du bassin Grenoblois de l’institut MIAI.

Vous bénéficierez également des compétences et de l'environnement de recherche de 2 unités de recherche : le LIG (https://www.liglab.fr) et le LIDILEM (https://lidilem.univ-grenoble-alpes.fr/).

Compétences

Master en data science, humanités numériques ou sciences sociales computationnelles ;
Maîtrise de l’anglais technique et scientifique ;
Excellent relationnel ;
Savoir travailler en équipe pluridisciplinaire ;
Savoir s’adapter au contexte projet ;
Être autonome dans son organisation personnelle et le reporting ;
Avoir une bonne communication écrite et orale en français ;
Maîtrise de langages de scripts (Python, bash, Perl, PhP) ;
Connaissance des outils d’annotations (Elan, Praat) ;
Expérience en outils de linguistique de corpus, en recherche sur corpus, en analyse quantitative et qualitative des données.
Une expérience en traitement du langage naturel, traitement de la parole ou en linguistique computationnelle sont jugées comme un plus.

Instructions pour postuler

Les candidatures sont attendues jusqu'au 30 juin 2022.

Veuillez envoyer votre CV + une lettre/message de motivation + les notes de vos études antérieures + des références pour une ou plusieurs lettres de recommandation potentielles à :

ISCApad #289

Job description

Requirements

Projet de recherche / Description of the research project

Projet d'enseignement / Description of the teaching project

Conditions de candidature / Application requirements

Contact

Docteur R&D informatique, NLP - F/H (CDD)

Sujet de thèse de doctorat

Titre : Génération automatique de résumés fluides de textes en français par apprentissage profond

Encadrement : Prof. Patrice BELLOT (https://cv.archives-ouvertes.fr/patrice-bellot ; Université d’Aix-Marseille CNRS, LIS), Adrian CHIFU (https://adrianchifu.com ; Université d’Aix-Marseille CNRS, LIS)

Mots clés : résumé automatique, fluidification textuelle, recherche d’information, traitement automatique des langues, apprentissage automatique, réseaux neuronaux

Contexte : Projet collaboratif susceptible d’être soutenu par la DGA entre :

QWAM (https://www.qwamci.com) ;

l’équipe MLIA de l’ISIR (https://www.isir.upmc.fr/equipes/mlia/presentation/)

l’équipe R2I du LIS (https://www.lis-lab.fr/r2i/) : la thèse se déroulera au sein de l’équipe R2I (Recherche d’Information et Interactions) du pôle Sciences des Données du LIS

Description du sujet :

Le contexte du projet

Plan de travail

Profil de candidature :