Conférence internationale ContribuLing 2021, les 3 et 4 juin, en ligne

La conférence internationale ContribuLing, coorganisée par l'Inalco, Wikimedia, la BULAC et l'UQAM, vise à réunir des personnes mettant en place des plateformes contributives de ressources (lexiques, corpus, enregistrements, etc.) sur les langues peu dotées.
Visuel ContribuLing 2021

ContribuLing 2021

Conférence du digital collaboratif pour les langues minoritaires

Conférence internationale sur la constitution de ressources linguistiques (ouvertes, audio et écrites) co-organisé par l'Inalco, Wikimedia, la BULAC et l'Université du Québec à Montréal (UQAM).

Langues : français, anglais et espagnol

Jeudi 3 et vendredi 4 juin 2021 - Entièrement en ligne 

 
Informations pratiques

Jeudi 3 juin - 13h00-16h30 (heure UTC + 2)
Vendredi 4 juin - 13h00-18h00

Inscription gratuite mais obligatoire ICI.
 

Programme (Heure UTC + 2)

- Thursday the 3rd of June
  * 13h00 Opening Session
  * 13h30 Lingua Libre (https://lingualibre.org)
  * 14h00 Wikidata Lexemes (779 languages)
  * 15h00 Wikimedia Incubator (ISO 639 languages)
  * 15h30 Kumoontun (Español, Inglés, Ayöök, Maya Popti’, Tének)
  * 16h30 Nierika Red Social (Español / Inglés)
  * 16h30 Idemi Africa (https://idemi.africa / French, Fon, Minan, Yoruba, Pular, Swahili, Lingala)
- Friday the 4th of June
  * 13h00 Endangered languages in the Wiktionnaire (6200, Gaulois, Lorrain)
  * 13h30 Tacawit (Tacawit)
  * 14h00 Occitan (Occitan)
  * 15h00 WikiPron (https://pypi.org/project/wikipron / 215 languages)
  * 15h30 Living dictionaries (https://livingdictionaries.app / 200 living dictionaries)
  * 16h30 Wikisource (72+ languages)
  * 16h30 Multilingual Wikidata properties (Wikidata languages)
  * 18h00 Closing Session


La disponibilité des ressources numériques dans une langue a un impact indéniable sur la qualité des outils de traitement informatique disponibles, autant pour la création et l'acquisition de nouvelles données  (saisie / OCR / reconnaissance de parole) que pour leur traitement (moteurs de recherche, encyclopédies, apprentissage des langues, chatbots, etc).

Face à ce constat, de nombreux projets ont été initiés ces dernières années pour faciliter la contribution et le partage de ressources linguistiques. Il existe ainsi de nombreuses plateformes permettant la collecte directe de données linguistiques, telles que des corpus oraux ou écrits, des dictionnaires et lexiques, des grammaires, etc. Les outils de traitement automatique des langues ayant besoin de données de tout type et non nécessairement spécialisées, tout locuteur est légitime pour contribuer à enrichir les bases de données pour sa langue. Ainsi, actuellement, un des enjeux est de permettre à tou·te·s de contribuer efficacement sur ces plateformes.

L'événement ContribuLing, co-organisé par l'Inalco, Wikimedia, la BULAC et l'UQAM entièrement en ligne (ou si la situation le permet, également en présentiel à Paris et à Montréal), propose aux plateformes d’organiser des conférences sur la création et l’utilisation des outils qu’elles ont mis en place, ainsi que des ateliers à destination des participant·e·s, permettant de former de potentiel·le·s contributeur·rice·s.

Il s'agit en premier lieu de permettre au plus grand nombre de prendre en main ces plateformes pendant ces journées, afin qu'elles·ils puissent par la suite contribuer en ligne. Nous espérons également que cet événement permettra de constituer ou renforcer des communautés d'utilisateur·rice·s autour des outils et des plateformes présentées. Les ateliers n'auront pas vocation à constituer des jeux de données au cours de ces journées, mais d'apporter aux participant·e·s la capacité de le faire par la suite.

ContribuLing 2021 (English)

The availability of digital resources in a given language have an unquestionable impact on the quality of tools of computational processing available, whether it be tools that serve to build or collect data - speech recognition, OCR software, data collection - or tools that are used to process data - search engines, encyclopedias, language learning, chatbots.
That is why numerous projects have been launched over the last few years for the production and sharing of linguistic resources. These projects are mostly geared towards data collection, e.g. speech or text corpora, dictionaries, glossaries or grammars. Since NLP tools require data of all kinds and not only produced by specialists, any speakers is legitimate to contribute to and enrichs the databases of her/his language. Therefore one of the major challenges is to allow everyone easy access to these linguistic resource platforms.

The ContribuLing project a joint contribution of Inalco, Wikimedia, BULAC and UQAM - will take place either fully online or in Paris and Montreal as well depending on the situation. Its aim is to offer members of linguistic resource platforms an opportunity to give out presentations on their tools and workshops on their use that will enable would-be users to contribute.

ContribuLing's main goal is to ensure that the largest possible number of contributors can use the platforms. An additional benefit will be to allow the emergence or the development of user groups who share the same tools or platforms. Emphasis will not be laid on producing data sets but on enabling attendees to do so.

Comité d'organisation/Organising Committee

Adélaide Calais (Adélaïde Calais WMFr) (Wikimédia France)
Claire Camberlein (BULAC)
Johanna Cordova (Inalco / ERTIM)
Hugo Lopez (Yug) (Wikimédia France / Lingua Libre)
Damien Nouvel (Inalco / ERTIM)
Lucas Prégaldiny (WikiLucas00) (Wikimédia France / Lingua Libre)
Jhonnatan Rangel (Inalco / Sedyl)
Fatiha Sadat (UQAM)
Anass Sedrati (Anass Sedrati) (Wikimedia MA)
Emma Vadillo Quesada (Eavq) (Wikimédia France / Lingua Libre)