ISCA - International Speech
Communication Association


ISCApad Archive  »  2014  »  ISCApad #190  »  Events  »  Other Events  »  (2014-07-01) Atelier: Réseaux Lexicaux et Traitement des Langues Naturelles (RLTLN), Marseille (F)

ISCApad #190

Thursday, April 10, 2014 by Chris Wellekens

3-3-57 (2014-07-01) Atelier: Réseaux Lexicaux et Traitement des Langues Naturelles (RLTLN), Marseille (F)
  

 


We do accept papers written in English by those who are not fluent in French

Les articles seront rédigés en français pour les francophones,
en anglais pour ceux qui ne maîtrisent pas le français.

---------------------

Réseaux Lexicaux et Traitement des Langues Naturelles
(RLTLN)


Atelier TALN 2014
Faculté Saint Charles (Aix Marseille Université), 1er juillet 2014.
Date limite de soumission
: 21 avril 2014  


Organisateurs :
Michael Zock (LIF, Marseille)
Gemma Bel-Enguix (LIF, Marseille)
Reinhard Rapp (LIF, Marseille et Université de Mainz)

1 PRÉSENTATION DU CHAMP

La façon dont nous regardons les unités lexicales, leur organisation et utilisation a radicalement changée ces dernières décennies. Décrites dans des dictionnaires et considérées comme des annexes de la grammaire dans les années 80, on les considère désormais comme de la matière première en TAL. Si à l’époque on utilisait encore des termes comme 'mots' ou 'dictionnaires', on parle aujourd’hui plutôt de 'ressources lexicales' dont il existe un certain nombre (WordNet, FrameNet, VerbNet, PropBank, ...). Celles-ci ont été standardisées (http://en.wikipedia.org/wiki/UBY-LMF), liées entre elles (http://verbs.colorado.edu/semlink/) ou liées à des encyclopédies comme Wikipédia (http://en.wikipedia.org/wiki/BabelNet). Il y a également des projets comme DBnary (http://kaiko.getalp.org/about-dbnary) qui, partant de Wiktionary, fournit des ressources lexicales dans de nombreuses langues.

Si dans le passé on créait des dictionnaires à la main, on le fait aujourd'hui de manière (semi-) automatique et à l'aide de corpus. Bien entendu, cette évolution ne s'est pas faite du jour au lendemain. Les premières tentatives de création automatique de ressources à partir de dictionnaires imprimés (Ide Véronis, sites.univ-provence.fr/veronis/publis.html) se sont vite heurtées à des problèmes, en raison de la pauvreté de la source : les dictionnaires papier ne contenaient pas les informations nécessaires permettant ensuite un usage par la machine. Or, c’était justement le but recherché. L’accès à de vastes corpus a alors permis de marquer un tournant et de construire des ressources plus riches, plus explicites et mieux structurées. Concernant ce dernier point, WordNet (WN) a joué un rôle capital. Bien qu’il n’a pas eu le succès escompté auprès des psycholinguistes ou auprès des utilisateurs consultant la ressource (pour chercher des mots), WN a eu un succès considérable en TAL. Ceci dit, il a également eu un impact incontestable sur le plan théorique. WN a profondément modifié notre manière de voir la structure des ressources lexicales. Dorénavant, elles ne se résument plus à des simples listes alphabétiques, mais elles sont réprésentées plutôt sous forme des graphes (réseau lexical) dont les noeuds sont des unités lexicales liées par différents types de relations.

Parallèlement à l’évolution des ressources lexicales, on a pu observer une évolution notable concernant les travaux portant sur les graphes. Ces derniers semblent se prêter à merveille à la modélisation de divers domaines (Barrat, 2008, Barabási, 2003), y compris celui de la langue. En effet, il y a eu de nombreux travaux montrant leur pertinence pour capter le sens des mots et celui des phrases (Widdows, 2004; Sowa, 1991) ou pour modéliser divers aspects du 'monde' lexical : structures associatives (http://www.eat.rl.ac.uk, ou http://w3.usf.edu/FreeAssociation/), structure du dictionnaire (Gaume et al. 2008), densité lexicale, distance moyenne entre les mots (Vitevitch, 2008), accessibilité (Ferrer i Cancho Sole, 2001), aspects dynamiques des graphes (Dion, 2012), etc.

Nous constatons donc qu’il y a deux communautés, dont l’une s’intéresse aux données (concrètes commes les unites lexicales), et l’autre plutôt à leur représentation et organisation (graphes, topologie, navigation). C’est pour encourager l’échange d’idées entre ces deux mondes, que nous organisons cet atelier.


2 THEMES

Nous attendons des soumissions portant sur les thèmes évoqués plus haut et en particulier :
  • Origine des données permettant la construction des ressources : corpus (web, blogs, courriels), êtres humains (liste d’associations), etc. ;
  • Méthode de construction de la ressource: automatique, semi-automatique, collaborative (par des jeux, etc.) ;
  • Construction automatique du réseau (repérage et caractérisation des relations sémantiques) ;
  • Structuration des données : alphabétique, thématique, liens sémantiques, liens associatifs ;
  • Propriétés mathématiques des réseaux lexicaux ;
  • Facteurs affectant le poids des noeuds ou des liens : aspects dynamiques des graphes (fréquence, saillance, récence, changement de thème, etc.) ;
  • Caractérisation topologique du graphe lexical : distribution, densité relative, évolution du graphe ;
  • Exploitation ou utilisation de la ressource ou d’une de ses transformations comme la transformation du graphe en arbre pour assister la navigation (accès lexical) ;
  • Accessibilité des mots grâce à des caractéristiques du réseau (phénomène du ‘petit monde’) ;
  • Visualisation et manipulation des graphes (traduction en arbre, clustering, calcul de similarité sémantique) ;
  • Modélisation des variations linguistiques et des changements de la langue (évolution du lexique).

3 CRITÈRES DE SÉLECTION

Les soumissions seront examinées par au moins deux spécialistes du domaine.

Pour les travaux de recherches, seront considérées en particulier :
 
  • l'adéquation aux thèmes de l'atelier,
  • l'importance et l'originalité de la contribution,
  • la correction du contenu scientifique et technique,
  • l'organisation et la clarté de la présentation.

4 MODALITÉS DE SOUMISSION

Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent pas le français. Ils devront suivre le format de TALN 2014 et ne doivent pas dépasser 10 pages (références comprises). Les feuilles de style (LaTeX et Word) sont disponibles sur le site web de la conférence (http://www.taln2014.org/site/soumission/). Les propositions doivent être envoyées sous forme pdf à l’adresse suivante : (https://www.easychair.org/conferences/?conf=RLTLN2014). Les articles retenus donneront lieu à une présentation de 30 mn, discussion comprise.

5 COMITE DE PROGRAMME

  • Bel Enguix, Gemma (LIF, Université Aix-Marseille, France)
  • Bouillon, Pierrette (tim, Faculté de Traduction et d’interprétation de Genève, Suisse)
  • Cristea, Dan (University A.I.Cuza, Iasi, Romania)
  • Ferrer i Cancho, Ramon (larca, université polytechnique de Catalogne, Barcelone, Espagne)
  • Ferret, Olivier (cea list, Gif sur Yvette, France)
  • Francopoulo, Gil (Tagmatica, Paris, France)
  • Gala, Nuria (lif-cnrs, Aix Marseille Université, Marseille, France)
  • Granger, Sylviane (Université Catholique de Louvain, Belgium)
  • Grefenstette, Gregory (Inria, Saclay, France)
  • Lapalme, Guy (rali, Université de Montréal, Canada)
  • Lenci, Alessandro (Université de Pise, Italie)
  • L'Homme, Marie-Claude (Université de Montréal, Canada)
  • Massip i Bonet, Àngels: (Université de Barcelone, département de philologie Catalane, Espagne)
  • Navigli, Roberto (Sapienzia, Université de Rome, Italie)
  • Ploux, Sabine (L2C2, Institut des Sciences Cognitives, Lyon, France)
  • Prévot, Laurent (lpl, Université Aix Marseille, Aix en Provence)
  • Rapp, Reinhard (lif, France) et (université de Mainz, Germany)
  • Rosso, Paolo (nlel, Universitat Politècnica de València, Spain)
  • Schwab, Didier (lif-getalp, Grenoble, France)
  • Sérasset, Gilles (lig, Grenoble, France)
  • Zock, Michael (lif, Marseille, France) et (Université de Tainan, Taiwan)

6 DATES IMPORTANTES

  • Date limite de soumission : 21 avril 2014
  • Notification aux auteurs : 10 mai 2014
  • Soumission de la version définitive : 30 mai 2014
  • Date de l’atelier : 1er juillet 2014

7 CONTACT

- Michael Zock michael.zock [arobas] lif.univ-mrs.fr
- Gemma Bel Enguix gemma.belenguix [arobas] gmail.com
- Reinhard Rapp reinhardrapp [arobas] gmx.de


Web :

http://www.taln2014.org/site/
https://sites.google.com/site/rltlntaln2014/

Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA