Projets financés

Le laboratoire LLACAN pilote actuellement 3 contrats ANR, 3 contrats internationaux sur des langues en danger ELDP - SOAS et DOBES, 1 contrat PRASAC (Pôle régional de recherche appliquée au développement des systèmes agricoles d'Afrique centrale). Le LLACAN participe également à 1contrat industriel dans le cadre du pôle de compétitivité Cap Digital.

A) Projets ANR

1. NaijaSynCor – A Corpus-Based Macro-Syntactic Study of Naija (Nigerian Pidgin) (01.02.2017-31.07.2020) :

NaijaSynCor propose une étude exhaustive et approfondie de la structure du naija (Nigerian Pidgin) parlé aujourd'hui au Nigéria. Il a été prouvé par Deuber (2005) que cette langue adoptée par les Nigérians éduqués, s’est développée à Lagos comme une langue autonome, distincte de la variété d’anglais parlée au Nigéria. Ce projet se propose de déterminer par une étude diachronique, diatopique, diaphasique et diastratique si cela est vrai pour le reste du Nigeria où le naija est parlé par plus 75 millions de locuteurs. NaijaSynCor est le résultat de la collaboration entre deux éminents experts nigérians du naija (F. Egbokhare & C. Ofulue) et deux unités de recherche qui ont prouvé leur savoir-faire dans l’annotation de corpus dans de précédents programmes : le LLACAN, dans l’étude de corpus de langues peu décrites ; le MoDyCo, dans l’étude de l’interaction de la prosodie et de la syntaxe en Français, et dans le développement de grands treebanks.
En savoir plus...

2. BULB (BULB - Breaking the Unwritten Language Barrier) (01.03.2015 - 28.02.2018)

In a context where a growing number of languages are in danger of extinction and linguists in dire need for efficient language documentation tools, Breaking the Unwritten Language Barrier (BULB) aims at supporting the documentation of unwritten languages with the help of modern natural language processing technologies, in particular automatic speech recognition (ASR) and machine translation (MT).

This ANR/DFG project relies on a strong German-French cooperation between linguists and computer scientists from ZAS (F. Hamlaoui), the KIT (S. Stücker) and the University of Stuttgart (S. Zerbian) on the German side, as well as the LPP (M. Adda-Decker, A. Rialland), the LLACAN (M. van de Velde, D. Idiatov), the LIMSI (L. Lamel and F. Yvon), the LIG (L. Besacier) and the IMMI-CNRS (G. Adda) on the French side. These researchers and their local teams are bringing together their expertise to address the documentation of three mostly unwritten and generally under-resourced African languages of the Bantu family: Basaa (Cameroon), Myene (Gabon) and Embosi (Republic of Congo).
En savoir plus...

3. CorTypo (03/2013-03/2017)

The aim of the CorTypo project is the elaboration of an innovative system of linguistic annotation of natural language corpora in lesser-described spoken languages, in view of testing linguistic hypotheses on spontaneous discourse data, in a typological perspective.

In order to achieve this goal a number of fundamental theoretical questions need to be resolved with respect to language form and language functions. Crucially, the project addresses the question of what kind of theoretical apparatus is required for the comparison of languages displaying different formal means and different functions.

By implementing theoretical solutions into corpus-design and database-design, the project provides the basis for the empirical testing and falsification of hypotheses, and allows the elaboration of new hypotheses on language structure and cross-linguistic comparison. By proposing solutions to the problem of linguistic interoperability, it paves the way for large-scale typological work based on first-hand natural language data.
En savoir plus...
 

B) Projets ELDP

1. Myènè Documentation

La documentation comparative des parlers myènè est un projet de recherches du LLACAN (UMR 8135 du CNRS) en collaboration avec l’Université Omar Bongo. Il s’agit d’un grand projet de documentation (« major documentation project ») financé par l’ELDP (Endangered Languages Documentation Programme), qui résultera en un ensemble important et diversifié d’enregistrements transcrits de tous les aspects de la communication en les six variantes myènè, à savoir l’adjumba, l’enenga, le galwa, le mpongwe, le nkomi et l’orungu.

2.Documentation du Kakabe

Le kakabé est une langue du groupe mokolé (sous-branche centrale de la branche ouest de la famille mandé) parlée en Guinée sur le plateau du Fouta Djallon. Il est essentiel de produire une description intégrale de la grammaire de cette langue, presque pas décrite et menacée. La description du système grammatical sera accompagnée d’une description du vocabulaire du kakabé.

 

C) Projet PRES SPC

Le projet BantuTyp est un projet de recherche financé par le PRES Sorbonne Paris Cité, qui démarrera fin 2013. Le but principal du projet est la création d’analyses grammaticales englobantes et vérifiables de trois langues bantu du nord-ouest : le myènè (langue gabonaise du groupe B10), une langue du groupe A90 parlée au Cameroun et une langue du groupe A30, parlée soit au Cameroun, soit en Guinée Equatoriale.

 

D) Projet DOBES

Le projet a pour but la documentation linguistique de deux langues de l'Ethiopie en voie de disparition qui sont parlées dans l'île Gidiccho et dans les villages  du lac Abbaya: Bayso (3500 locuteurs) et Haro (500 locuteurs).

 

E) Projet PRASAC

Le projet vise à valoriser dix ans de recherches agronomiques dans la zone de savanes de l’Afrique centrale (Tchad, Cameroun, Centrafrique). Le projet est financé par le Pôle régional de Recherche Appliquée au développement des Systèmes Agricoles d'Afrique Centrale (PRASAC). Il s’agit de rendre accessible au paysan de base la soixantaine de fiches techniques élaborées au cours des dix ans précédents par des chercheurs du Nord (CIRAD notamment) et du Sud. Ces fiches doivent d’abord être reformulées dans un français abordable par des personnes peu scolarisées en français, puis adaptées dans trois grandes langues véhiculaires d’Afrique centrale (fulfulde, ngambay, sango). Les deux premières années du projet sont consacrées à la reformulation en français et à l’adaptation en fulfulde. Parallèlement, un manuel en français sera mis au point qui pourrait servir dans les écoles d’agriculture de la région. Cela exige que des compléments soient apportés par rapport aux fiches déjà existantes.

 

F) Contrats Labex

RT1. Reconstruction, internal classification and grammatical description in the word’s two biggest phylums : Niger-Congo and Austronesian (resp. L. Sagart, I. Bril, V. Vydrin)

Ce projet vise à une meilleure compréhension de l’histoire et de la classification interne des deux plus grands phylums linguistiques du monde, à savoir le Niger-Congo et l’Austronésien.

RT2. The Central Sudanic Languages: genetic unit or affinity group? (resp. P. Boyeldieu)

Le projet vise à répondre à deux questions principales:

1. Les langues soudaniques centrales sont-elles génétiquement apparentées ?

2a. Si oui, les mêmes critères phonologiques, morphologiques et lexicaux sont-ils sollicités parmi les innovations pour permettre de dessiner l’histoire des relations internes de la famille ?

2b. Si non, quels sont les processus historiques qui peuvent expliquer les nombreuses similarités lexicales et morphologiques observées ?

En faisant la lumière sur l’évolution des langues d’Afrique centrale, les réponses à ces questions contribueront à une meilleure compréhension des phénomènes de changement linguistique ainsi qu’à l’histoire mal connue des populations de la région.

 

LC2. Areal phenomena in Northern sub-Saharan Africa (resp. D. Idiatov & M. Van de Velde)

Ce projet a pour objectif un examen critique des hypothèses aréales impliquant des langues du nord de l’Afrique sub-saharienne, telles que la ceinture macro-Soudan de Güdemann (2008) et la ceinture soudanique de Clements et Rialland (2008). Les critères utilisés dans la littérature doivent être affinés et des critères additionnels doivent être identifiés afin d’évaluer la validité de l’hypothèse aréale, et la renforcer si elle est confirmée.

GD1. The Typology and corpus annotation of information structure and grammatical relations (resp. A. Mettouchi, M. Vanhove)

Ce projet rassemble des experts de langues et familles de langues, géographiquement et généalogiquement très diverses (Afroasiatique, Tibéto-Birman, Austro-asiatique, langues améridiennes). Nous étudions des phénomènes liés à la structure de l’information et leurs interactions avec des phénomènes propres aux langues, tels que le marquage optionnel des arguments, l’alignement hiérarchique, en portant une attention particulière aux facteurs aréaux et diachroniques.

 

G) Projet Pôle Compétitivité

La participation du Llacan porte sur la réalisation de programmes d'analyse et d'annotation morpho-grammaticale interactive de l'arabe, sur l'annotation effective - voyellation, lemmatisation, étiquetage grammatical - de corpus arabes (Le monde diplomatique en arabe, les dépêches de l'AFP en arabe), et sur la translittération des noms propres du français à l'arabe, et inversement.