ISCA - International Speech
Communication Association


ISCApad Archive  »  2013  »  ISCApad #183  »  Jobs  »  (2013-03-15) Offre de post-doc en Traitement Automatique du Langage au LIUM Le Mans France

ISCApad #183

Wednesday, September 11, 2013 by Chris Wellekens

6-5 (2013-03-15) Offre de post-doc en Traitement Automatique du Langage au LIUM Le Mans France
  

Offre de post-doc au LIUM
Traitement Automatique du Langage

Correction de sorties d’OCR, traduction automatique statistique, modélisation du langage.
Offre de postdoc au sein du laboratoire d’Informatique de l’Université du Maine (LIUM)  dans le domaine de la correction orthographique par méthodes de traduction automatique statistique.
Résumé de l’offre –  Thématiques : traitement du langage naturel, application à la correction d’OCR et traduction automatique statistique. –  Lieu : LIUM (Le Mans), équipe LST (http ://www-lium.univ-lemans.fr/). –  Période : disponible dès maintenant pour une durée d’un an renouvelable.
Contexte Ce postdoc s’inscrit dans le projet PACTE ('investissement d’avenir'), porté par l’entreprise Diadeis,  et dont sont également partenaires l’équipe Alpage (INRIA et Paris 7), et les entreprises A2ia et Isako.  PACTE a pour objectif l’amélioration de la qualité orthographique des textes issus de différentes méthodes de capture textuelle.  L’accent est mis sur les sorties d’OCR (reconnaissance optique de caractères) sur des textes imprimés scannés,  mais concerne également des données obtenues par reconnaissance d’écriture manuscrite, par saisie manuelle, et par rédaction directe.  Les techniques qui seront utilisées sont à la fois statistiques et hybrides, faisant usage d’outils et de ressources de linguistique computationnelle.
Objectifs Vérification et correction des sorties d’OCR par des méthodes de modélisation statistique du langage.  Les systèmes OCR utilisés n’exploitent pas ou peu de connaissance sur la langue.  L’objectif est d’exploiter la modélisation de la langue afin combler ce manque.
Utilisation de la traduction automatique statistique pour la correction d’erreurs des sorties d’OCR.  La correction des sorties d’OCR peut être vue comme une tâche de traduction d’un texte erroné vers un texte correct.  Dans le cadre de l’OCR, le paradigme de traduction doit être adapté afin de prendre en compte les spécificités de la tâche.
Le cadre applicatif de ce travail est assez exceptionnel, avec l’exploitation d’une grande quantité de données  issue notamment du Bureau Européen des Brevets (EPO - European Patent Office) et du Journal Officiel de l’Union Européenne.
Profil recherché – Compétences en informatique : environnement Linux, C++, scripting, etc. ; – Connaissances en apprentissage automatique, linguistique computationelle. – Une expérience en traduction automatique statistique est un plus. Le postdoc se déroulera au sein de l’équipe LST du LIUM.  Le LIUM est connu au niveau international pour ses recherches dans le domaine de la traduction automatique statistique,  et possède de nombreuses collaborations avec des universités et entreprises en Europe et aux États-Unis.
Contacts Envoyer une lettre de motivation et un CV montrant vos compétences pour ce poste aux adresses suivantes : Loïc Barrault : loic.barrault@lium.univ-lemans.fr  Holger Schwenk : holger.schwenk@lium.univ-lemans.fr 


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA