Appel à contribution : ContribuLing 2021

L'événement ContribuLing, co-organisé par l'Inalco, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin 2021 entièrement en ligne (ou si la situation le permet, également en présentiel à Paris et à Montréal) vise à réunir des personnes mettant en place des plateformes contributives de ressources informatiques (lexiques, corpus, enregistrements, etc.) sur les langues peu dotées. Envoi des propositions jusqu'au 23 avril 2021.
Visuel ContribuLing 2021
Date limite :
Vendredi, 23 avril, 2021
Equipe de recherche :

ContribuLing 2021 (Français)

La disponibilité des ressources numériques dans une langue a un impact indéniable sur la qualité des outils de traitement informatique disponibles, autant pour la création et l'acquisition de nouvelles données  (saisie / OCR / reconnaissance de parole) que pour leur traitement (moteurs de recherche, encyclopédies, apprentissage des langues, chatbots, etc).

Face à ce constat, de nombreux projets ont été initiés ces dernières années pour faciliter la contribution et le partage de ressources linguistiques. Il existe ainsi de nombreuses plateformes permettant la collecte directe de données linguistiques, telles que des corpus oraux ou écrits, des dictionnaires et lexiques, des grammaires, etc. Les outils de traitement automatique des langues ayant besoin de données de tout type et non nécessairement spécialisées, tout locuteur est légitime pour contribuer à enrichir les bases de données pour sa langue. Ainsi, actuellement, un des enjeux est de permettre à tou·te·s de contribuer efficacement sur ces plateformes.

L'événement ContribuLing, co-organisé par l'Inalco, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin 2021 entièrement en ligne (ou si la situation le permet, également en présentiel à Paris et à Montréal), propose aux plateformes d’organiser des conférences sur la création et l’utilisation des outils qu’elles ont mis en place, ainsi que des ateliers à destination des participant·e·s, permettant de former de potentiel·le·s contributeur·rice·s.

Il s'agit en premier lieu de permettre au plus grand nombre de prendre en main ces plateformes pendant ces journées, afin qu'elles·ils puissent par la suite contribuer en ligne. Nous espérons également que cet événement permettra de constituer ou renforcer des communautés d'utilisateur·rice·s autour des outils et des plateformes présentées. Les ateliers n'auront pas vocation à constituer des jeux de données au cours de ces journées, mais d'apporter aux participant·e·s la capacité de le faire par la suite.

Pour proposer une présentation ou un atelier lors de ces journées, nous vous prions de bien vouloir nous envoyer votre proposition (maximum deux pages) avant le 23 avril 2021 à l'adresse contribuling@framalistes.org avec, autant que possible, les informations suivantes :
- noms, prénoms, affiliation des organisateur-rice-s de l'atelier,
- durée envisagée de l'atelier,
- nom de la plateforme contributive,
- langue dans laquelle sera présenté l'atelier,
- langues actuellement prises en charge par la plateforme,
- volume des données déjà présentes sur la plateforme,
- licence de la plateforme (code) et des données linguistiques collectées,
- description sommaire de l'outil (10 lignes),
- modalités d'accès à la plateforme (en ligne, authentification, etc.),
- prérequis de compétences en informatique et/ou en linguistique,
- moyens nécessaires à l'organisation de l'atelier,
- autres informations liées à la bonne organisation de l'atelier.

À partir de ces informations, le comité d'organisation de ContribuLing examinera les propositions d'ateliers et proposera aux ateliers retenus des plages horaires afin d'établir un programme sur les deux journées concernées, l'annonce de l'événement sera alors diffusée plus largement.

ContribuLing 2021 (English)

The availability of digital resources in a given language have an unquestionable impact on the quality of tools of computational processing available, whether it be tools that serve to build or collect data - speech recognition, OCR software, data collection - or tools that are used to process data - search engines, encyclopedias, language learning, chatbots.
That is why numerous projects have been launched over the last few years for the production and sharing of linguistic resources. These projects are mostly geared towards data collection, e.g. speech or text corpora, dictionaries, glossaries or grammars. Since NLP tools require data of all kinds and not only produced by specialists, any speakers is legitimate to contribute to and enrichs the databases of her/his language. Therefore one of the major challenges is to allow everyone easy access to these linguistic resource platforms.

The ContribuLing project a joint contribution of INALCO, Wikimedia, BULAC and UQAM - will take place on June 3rd/4th, 2021, either fully online or in Paris and Montreal as well depending on the situation. Its aim is to offer members of linguistic resource platforms an opportunity to give out presentations on their tools and workshops on their use that will enable would-be users to contribute.

ContribuLing's main goal is to ensure that the largest possible number of contributors can use the platforms. An additional benefit will be to allow the emergence or the development of user groups who share the same tools or platforms. Emphasis will not be laid on producing data sets but on enabling attendees to do so.

To offer some ContribuLing presentation/workshop, please send a draft proposal - 2 pages max. - by April 23rd to contribuling@framalistes.org. Your proposal should provide the following information:
- first name(s), last name(s), credentials of workshop organisers
- time needed for workshop
- platform name
- language in which the workshop will be conducted
- languages currently available on the platform
- amount of data available on the platform
- type of licence (code) of the platform and of the linguistic data collected
- short description of the tool - 10 lines
- mode of access to the platform access - online, login, ...
- linguistic and/or programming prerequisites
- specific needs for the workshop
- any additional information necessary for a seamless workshop

Using the above information, ContribuLing's organising committee will look into the proposals and offer the selected platform managers time slots with a view to setting some tentative schedule. Once the schedule has been agreed on, the ContribuLing project will reach out to would-be participants, and the event will be widely announced.

ContribuLing 2021 (Español)

La disponibilidad de recursos digitales en una lengua tiene un impacto indiscutible sobre la calidad de las herramientas de tratamiento informático para esa lengua, tanto para la creación y adquisición de nuevos datos (entrada de [auto]texto, OCR, reconocimiento de voz) como para su procesamiento (motores de búsqueda, enciclopedias, aprendizaje de lenguas, chatbots, etc).

Ante esta situación, en los últimos años se han iniciado numerosos proyectos para facilitar la contribución y el intercambio de recursos lingüísticos. Varias plataformas ya permiten a los usuarios compartir datos lingüísticos como corpus orales o escritos, diccionarios y léxicos, gramáticas, etc. Las herramientas de procesamiento automático de lenguas necesitan datos de todo tipo, no necesariamente especializados; por consiguiente cada hablante es legítimo para contribuir a enriquecer las bases de datos de su lengua. Por ello, uno de los retos actuales es permitir que todos puedan contribuir eficazmente en estas plataformas.

El evento ContribuLing, coorganizado por el INALCO, Wikimedia, la BULAC y la UQAM tendrá lugar los días 3 y 4 de junio de 2021 en línea (o si la situación lo permite, también en presencial en París y Montreal). Se ofrece a los representantes de plataformas colaborativas la oportunidad de organizar conferencias sobre ésas (utilización, método de trabajo, comunidad, etc), así como proporcionar a los participantes talleres de formación a su utilización colaborativa.

El objetivo principal es que el mayor número posible de personas se familiarice con las herramientas de estas plataformas dentro del marco de este evento, de manera que luego puedan contribuir en línea. También esperamos que este encuentro permita constituir o fortalecer comunidades de usuarios en torno a las herramientas y plataformas presentadas. Es de notar que los talleres no tendrán como objetivo constituir bases de datos durante estos días, sino proporcionar a los participantes la posibilidad de hacerlo posteriormente.

Para proponer una presentación y/o un taller, les invitamos a enviar su propuesta (máximo dos páginas) antes del 23 de abril de 2021 al correo contribuling@framalistes.org con, en la medida de lo posible, las informaciones siguientes:
- nombre, apellido, afiliación de los organizadores del taller,
- duración prevista del taller,
- nombre de la plataforma contribuyente,
- idioma en el que se presentará el taller,
- idiomas actualmente soportados por la plataforma,
- volumen de datos ya presente en la plataforma,
- licencia de la plataforma (código) y de los datos lingüísticos recogidos,
- breve descripción de la herramienta (10 líneas),
- métodos de acceso a la plataforma (en línea, autenticación, etc.),
- si se requieren conocimientos informáticos y/o lingüísticos para el uso de la plataforma,
- recursos necesarios para la organización del taller,
- cualquier otra información necesaria para la buena organización del taller.

A partir de estos datos, el comité organizador de ContribuLing examinará las propuestas de talleres y propondrá franjas horarias para los proyectos seleccionados, con el fin de establecer en conjunto un programa completo. Más adelante, éste se difundirá ampliamente.

Organising Committee

Adélaide Calais (Wikimedia France)
Claire Camberlein (BULAC)
Johanna Cordova  (INALCO ERTIM)
Hugo Lopez (Wikimedia France / LinguaLibre)
Damien Nouvel (INALCO ERTIM)
Thérèse Ottawa  (Wikimedia Canada)
Lucas Prégaldiny (Wikimédia France / Lingua Libre)
Fatiha Sadat (UQAM)
Anass Sedrati  (Wikimedia Maroc)
Emma Vadillo Quesada (Wikimedia France / LinguaLibre)