ISCA Services

ISCA - International Speech
Communication Association

ISCApad Archive » 2018 » ISCApad #240 » Resources » Database » Base de données LIBRE et GRATUITE pour la reconnaissance du locuteur

ISCApad #240

Tuesday, June 12, 2018 by Chris Wellekens

5-2-16 Base de données LIBRE et GRATUITE pour la reconnaissance du locuteur

Je me permet de vous solliciter pour contribuer à la création

d?une base de données LIBRE et GRATUITE

pour la reconnaissance du locuteur.

Plus de détails et la marche à suivre ci-dessous.

Merci beaucoup,

Anthony Larcher

Récemment, un certain nombre de laboratoires spécialisés dans la reconnaissance du locuteur dépendante du texte ont initié le projet RedDots.

Il s?agit d?une initiative volontaire sur financement propre des laboratoires.

Ce projet encourage des discussions sur les thèmes de la reconnaissance du locuteur,

la collection de corpus et les cas d?usage propres à cette technologie à travers un Google Group.

Dans le cadre du projet RedDots, l?Institute for Infocomm Research (Singapour) a développé une application Android

qui permet d?enregistrer des données sur un téléphone portable.

Cette base de données a pour but de pallier certaines lacunes des corpus existants:

- le coût (certaines bases standard sont vendues à plusieurs milliers d?euro)

- la taille limitée (le nombre limité de locuteurs ne permet plus d?évaluer les systèmes de reconnaissance de manière significative)

- la variabilité limitée (les données sont actuellement enregistrées dans plus de 5 pays dans le monde entier)

Afin de distributer une base de données, qui puisse bénéficier librement

à l?ensemble de la communauté de recherche nous vous sollicitons.

Comment faire et en combien de temps?

- inscrivez vous en 2 minutes à l?adresse suivante

- installez l?application Android sur votre téléphone en 2 minutes, saisissez l'ID et mot de passe qui vous seront envoyé par email

- enregistrez une session 3 minutes sur votre téléphone

Tout se fait en moins de 10 minutes?

Une des limitations principale des corpus existant est le nombre limité de sessions

enregistrée par locuteur et le court intervalle de temps au cours duquel ces sessions sont enregistrées.

Afin de combler ce manque nous espérons que chaque participant acceptera d?enregistrer

plusieurs sessions dans les mois à venir.

Idealement, chaque participant enregistrera 3 ou 4 minutes par semaine pendant un an.

Ou vont mes données et pour quoi sont elles utilisées?

Les données sont actuellement envoyées sur un serveur de l?Institute for Infocomm Research

à Singapour. Un institut de recherche public.

En vous enregistrant, vous acceptez que ces données soient utilisées à des fins de recherche

uniquement. ces données seront mise à disposition en ligne gratuitement tout au long du projet.

Merci pour votre contribution, n?hésitez pas à faire circuler cet email.

Plus de détails seront données prochainement dans un article soumis à INTERSPEECH 2015.

Anthony Larcher

Organisation	Events	Membership	Help
> Board	> Interspeech	> Join - renew	> Sitemap
> Legal documents	> Workshops	> Membership directory	> Contact
> Logos			> FAQ
			> Privacy policy