| Programme de la journée inaugurale du pré-GDR sur le Traitement Automatique des Langues aura lieu le jeudi 14 mars 2019 à MAISON DES SCIENCES DE L?HOMME PARIS NORD sur le thème ?Apprentissage, modèles linguistiques et cognitifs?
La MSH Paris Nord est accessible directement par la ligne 12 du métro (station Aubervilliers-Front populaire).
Cette journée est soutenue par l'ATALA.
**************************************** *Programme * **************************************** 9H Accueil
9H15 - 10H15 *Session GDR TAL général* 9H15 - 9H40 Intervention de Jamal ATIF - INS2I + échanges 9H40 - 10H15 Présentation du préGDR TAL : sa gouvernance, sa structure et ses actions + échanges - Béatrice Daille (LS2N TALN)
10h15 Pause Café
10h30 à 12H30 **Session GT1 'Apprentissage et modèles pour le TAL*' *
10H30-11H15 Restitution des axes de réflexion :
Modèles computationnels de la langue écrite, de la langue orale et de la langue des signes
Apprentissage et modélisation statistique pour le TAL
Sémantique et compréhension
par Nicholas Asher (IRIT MELODI), Frédéric Béchet (LIS TALEP) et Maxime Amblard (LORIA SEMMAGRAMME)
11H15-12H30 Table ronde prospective des travaux à venir du GT1
Discussions animée par Nicholas Asher (IRIT MELODI) et Frédéric Béchet (LIS TALEP)
Intervenants : Alexandre Allauzen (LIMSI TLP), Jean-Francois Bonastre (LIA), Benoit Crabbé (LLF), Géraldine Damnati (orange labs), Guillaume Gravier (IRISA LinkMedia), Laure Soulier (LIP6 MLIA)
12h30 Buffet (Offert aux participants)
14H-16H *Sessions Exposés invités prospectifs du GT1*
14h00 Jean Luc Schwartz (GIPSA-lab PCMD)- Modélisation cognitive des unités de la parole
On peut jusqu'à un certain point concevoir le langage comme une construction humaine adaptée, en un sens à définir, à nos capacités cognitives. Cette vision ? qui fait débat ? a comme double conséquence de proposer que les formes du langage et les principes de traitement sont eux-mêmes des produits de principes cognitifs plus généraux. C'est l'approche qui est suivie ici, dans le cadre des traitements des unités de bas niveau, « en dessous des mots » ? les syllabes, les consonnes, les voyelles. J'aborderai ces questions dans le cadre computationnel de la robotique bayésienne, développé en collaboration avec mes collègues Pierre Bessière et Julien Diard ; et en lien avec les avancées expérimentales et théoriques que nous avons faites autour de l'hypothèse du « système miroir », ce système neuronal qui, dans le cerveau des primates et des humains, permet de comprendre ce que fait l'autre en le simulant mentalement. Il y aura donc des questions théoriques, des simulations bayésiennes, et des données expérimentales.
15h00 Emmanuel Dupoux (LSCP CoML) - Apprentissage non supervisé de la parole : le bébé et la machine
Les systèmes de traitement automatique de la parole sont construit à partir de milliers d'heures de parole annotées plus des quantités massives de ressources textuelles. Ceci les rends difficile à déployer dans des langues dites 'faiblement dotées' qui ne disposent pas de telles ressources. Or, le bébé humain apprends à parler avant qu'il n'apprenne à lire et écrire. Le but de cette présentation est de passer en revue les principaux algorithmes d'apprentissage machine non supervisé appliqué à la découverte de représentations linguistiques, et qui, à l'instar du nourrisson, se passent totalement d'annotations écrites.
16h00-16H30 Discussion générale avec les participants |