ISCA - International Speech
Communication Association


ISCApad Archive  »  2021  »  ISCApad #282  »  Academic and Industry Notes  »  Projet européen ELE (European Language Equality),

ISCApad #282

Thursday, December 09, 2021 by Chris Wellekens

4-2 Projet européen ELE (European Language Equality),
  

Dans le cadre du projet européen ELE (European Language Equality), qui vise à créer une
feuille de route pour atteindre une égalité linguistique numérique totale en Europe d'ici
2030,  une enquête détaillée concernant le support technologique pour plus de 70 langues
européennes est en cours de réalisation.

Notre contribution porte spécifiquement sur la langue française, et les autres langues
d'Europe, officielles ou non, seront traitées par d'autres groupes, avec un recensement
distinct des ressources.

Si vous fournissez des outils, services ou collections de données linguistiques liés à la
langue française, nous vous serions donc extrêmement reconnaissants de consacrer quelques
minutes à nous aider à identifier un maximum de ressources linguistiques pour le
français. Notez qu'un certain nombre d'enquêtes similaires sont actuellement en cours
pour les autres langues européennes.

Pour ce faire, le plus simple sera de nous signaler par retour de courrier les ressources
produites dans vos équipes que vous souhaitez voir figurer dans cet inventaire, en nous
fournissant par exemple un lien vers une page Web documentant la ou les ressources. Merci
de prendre soin de vérifier au préalable que la ressource n'est pas déjà connue
(https://live.european-language-grid.eu/catalogue/#/?language__term=French).

Nous sommes intéressés par toutes les ressources et technologies linguistiques qui
existent actuellement et sont opérationnelles, quelle que soit la politique d'accès,
telles que:
- les corpus : collections de segments de texte ou de documents bruts ou annotés,
monolingues ou bi-/multilingues, mono- ou multimodaux, transcriptions audio, scripts,
enregistrements audio et vidéo, etc. ainsi que les corpus d'apprenants et les corpus de
langue des signes.
- des descriptions linguistiques, comprenant des modèles de langage et des grammaires
computationnelles
- ressources lexicales/conceptuelles, comprenant des lexiques informatiques, des bases de
données terminologiques, des répertoires, des ontologies, des listes de termes, des
thésaurus, etc.
- des outils et services : services offerts via le web, d'autres réseaux ou fonctionnant
dans le cloud, mais aussi outils téléchargeables, code source, etc. Il s'agit notamment
d'outils de base pour le français (analyseurs morphologiques, tagueurs POS, lemmatiseurs,
analyseurs syntaxiques, etc.), d'outils d'aide à la rédaction (par exemple, correcteurs
d'orthographe, de grammaire et de style), d'outils/services pour la
recherche/extraction/fouille d'informations, l'analyse de texte et de parole, la
traduction automatique, la compréhension et la génération de langue naturelle, les
technologies vocales, les systèmes conversationnels, etc.

Notez que dans le cadre de cette collecte, un certain nombre de ressources répertoriées
dans des catalogues publiquement accessibles ont déja été répertoriées et peuvent être
retrouvées dans le catalogue ELG:
https://live.european-language-grid.eu/catalogue/#/?language__term=French

*Il n'est donc pas nécessaire de les documenter à nouveau.*

Vous trouverez de plus amples informations sur le projet à l'adresse suivante :
https://european-language-equality.eu/.

Si vous avez des questions concernant cette enquête, merci de nous contacter directement.

Merci beaucoup

Gilles Adda, Ioana Vasilescu et François Yvon
LISN, CNRS


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA