| Dans le cadre du projet européen ELE (European Language Equality), qui vise à créer une feuille de route pour atteindre une égalité linguistique numérique totale en Europe d'ici 2030, une enquête détaillée concernant le support technologique pour plus de 70 langues européennes est en cours de réalisation.
Notre contribution porte spécifiquement sur la langue française, et les autres langues d'Europe, officielles ou non, seront traitées par d'autres groupes, avec un recensement distinct des ressources.
Si vous fournissez des outils, services ou collections de données linguistiques liés à la langue française, nous vous serions donc extrêmement reconnaissants de consacrer quelques minutes à nous aider à identifier un maximum de ressources linguistiques pour le français. Notez qu'un certain nombre d'enquêtes similaires sont actuellement en cours pour les autres langues européennes.
Pour ce faire, le plus simple sera de nous signaler par retour de courrier les ressources produites dans vos équipes que vous souhaitez voir figurer dans cet inventaire, en nous fournissant par exemple un lien vers une page Web documentant la ou les ressources. Merci de prendre soin de vérifier au préalable que la ressource n'est pas déjà connue (https://live.european-language-grid.eu/catalogue/#/?language__term=French).
Nous sommes intéressés par toutes les ressources et technologies linguistiques qui existent actuellement et sont opérationnelles, quelle que soit la politique d'accès, telles que: - les corpus : collections de segments de texte ou de documents bruts ou annotés, monolingues ou bi-/multilingues, mono- ou multimodaux, transcriptions audio, scripts, enregistrements audio et vidéo, etc. ainsi que les corpus d'apprenants et les corpus de langue des signes. - des descriptions linguistiques, comprenant des modèles de langage et des grammaires computationnelles - ressources lexicales/conceptuelles, comprenant des lexiques informatiques, des bases de données terminologiques, des répertoires, des ontologies, des listes de termes, des thésaurus, etc. - des outils et services : services offerts via le web, d'autres réseaux ou fonctionnant dans le cloud, mais aussi outils téléchargeables, code source, etc. Il s'agit notamment d'outils de base pour le français (analyseurs morphologiques, tagueurs POS, lemmatiseurs, analyseurs syntaxiques, etc.), d'outils d'aide à la rédaction (par exemple, correcteurs d'orthographe, de grammaire et de style), d'outils/services pour la recherche/extraction/fouille d'informations, l'analyse de texte et de parole, la traduction automatique, la compréhension et la génération de langue naturelle, les technologies vocales, les systèmes conversationnels, etc.
Notez que dans le cadre de cette collecte, un certain nombre de ressources répertoriées dans des catalogues publiquement accessibles ont déja été répertoriées et peuvent être retrouvées dans le catalogue ELG: https://live.european-language-grid.eu/catalogue/#/?language__term=French
*Il n'est donc pas nécessaire de les documenter à nouveau.*
Vous trouverez de plus amples informations sur le projet à l'adresse suivante : https://european-language-equality.eu/.
Si vous avez des questions concernant cette enquête, merci de nous contacter directement.
Merci beaucoup
Gilles Adda, Ioana Vasilescu et François Yvon LISN, CNRS |