D-Parsas, une infrastructure numérique spécialisée sur les aires culturelles et linguistiques

L'Inalco et l'Université de Paris (UDP) se dotent d'une infrastructure numérique pour les SHS co-financée par l'Idex de UDP et le programme Sésame de la Région Île-de-France. La plateforme D-Parsas est destinée à la valorisation et la patrimonialisation des données multimodales de la recherche sur les aires culturelles et linguistiques produites dans le périmètre de ces deux établissements et leurs partenaires.
Le projet D-parsas fond
Digital Paris Research School of Area Studies - D-PaRSAS est un projet de plateforme technique et éditoriale (2020-2022) porté par l’Inalco et l’Université de Paris. Cette plateforme a vocation à faciliter la production, l’archivage et la valorisation de données multimodales (audiovisuelles, visuelles, sonores, textuelles, 3D, …) qui documentent la recherche, et également les enseignements, sur les aires culturelles et linguistiques.
 
Ce projet participe au champ des humanités numériques et s'inscrit dans la politique favorable à la Science ouverte préconisée par le Plan national de la science ouverte du Ministère de l'enseignement supérieur, de la recherche et de l'innovation (MESRI) et de l'EU's Open Science Policy de la Commission européenne.

Il répond donc aux impératifs de dépôt, structuration et accessiblité des données produites, de leur interopérabilité et leur réutilisation ainsi qu'à la pérennisation et la valorisation du patrimoine scientifique. 

Le projet d-PaRSAS présente un intérêt primordial pour l’Inalco en tant qu’institution souhaitant affirmer sa position centrale dans les recherches sur les aires géographiques, linguistiques et culturelles notamment non-occidentales. 
 

Objectifs du projet D-Parsas


Doter les partenaires du projet d’une infrastructure matérielle et technologique appropriée à la production, à l’archivage et à la valorisation de données multimodales documentant la recherche sur les aires culturelles et linguistiques. L’infrastructure technique d-PaRSAS comprend notamment un studio d’enregistrement, des dispositifs mobiles de captation audiovisuelle et un data center composé de serveurs de stockage, de traitement et de diffusion de données.

Mettre en production une plateforme éditoriale Open Archive in Language and Cultural Area Studies - LaCAS pour la valorisation et la patrimonialisation de la recherche sur les aires culturelles et linguistiques.

L'archive ouverte LaCAS est un prototype de plateforme scientifique et technique qui regroupe des corpus de données multimodales (visuelles, filmiques, sonores, textuelles, 3D, ...) produites par des chercheurs, enseignants-chercheurs, équipes et laboratoires de recherche qui travaillent sur les aires géographiques, linguistiques et culturelles du monde. Elle offre la capacité de modéliser des domaines d'expertises et de valoriser des connaissances. Elle s'articule autour de 5 pôles d'activités : 
  • Acquisition (collecte), sauvegarde, archivage et diffusion de données visuelles, audiovisuelles, sonores et textuelles ;
  • Structuration, description et (re)publication de corpus de données selon une approche méthodologique respectant le cadre du fair data (faciles à trouver ; accessibles ; interopérables ; réutilisables) et à l’aide d’outils open-source ;
  • Utilisation de données dans des contextes d’usage spécifiques : enseignement en présentiel et/ou à distance, formation continue, activités d’expertise scientifique, sensibilisation et médiation interculturelles, projets de science participative ;
  • Recherche et développement : en ingénierie sémantique, terminologique et linguistique de données
  • Communication, formation et valorisation

Réaliser une série de projets pilote en humanités numériques et science ouverte sous forme de sites et portails web permettant d’une part la consultation et l’exploration et d’autre part l’édition des données documentant un domaine de recherche particulier et/ou le périmètre de recherche d’une institution.
  
Un des premiers projets pilotes est le portail Archives Ouvertes de l’Inalco - AOI, en cours de développement. Ce portail est dédié aux données qui documentent la recherche des enseignants-chercheurs et des chercheurs travaillant dans les équipes sous tutelle ou cotutelle de l’Inalco (« écosystème de recherche de l’Inalco »).

Il a pour objectif de permettre un accès centralisé à ces données de diverses natures (publications, « littérature grise » ; événements scientifiques ; corpus de terrain, archives ; cours/séminaires ; projets de recherche, missions scientifiques ; acteurs et thèmes de recherche, …) éparpillées dans toute la médiasphère numérique et « classique » (entrepôts de données (HAL, Nakala, Persée, …), plateformes d’identifiants (IdRef, ORCID, BNF…), catalogues collectifs (Sudoc, Worldcat, Calames, OpenEdition...), sites institutionnels, sites d’équipe, sites et blogs personnels, médias sociaux, brochures d’établissement et d’équipe, rapports HCERES, …).

Il permettra également un accès aux fonds documentaires de la recherche majoritairement déposés sur HAL, MédiHal, Nakala, Cocoon… ; à des collections de recherche ; à une cartographie de la recherche et à une cartographie de l'enseignement (sous forme d'informations structurées) à l’Inalco ; à un vocabulaire « métier », le Lexique langues O' .

Plusieurs autres projets à l'étude viendront enrichir ce volet du projet D-Parsas : « Techniques et savoir-faire en Himalaya (Ifrae) ; Projet ANR Memomines (Inalco (Plidam), Lille 3, Univ. de Valenciennes) ; 3 projets Archives (Cessma, Ifrae, Case) ; Fonds photographique (Ifrae) ; Documentation « Langues à petits effectifs » (Sedyl)

Produire une documentation pédagogique et des ateliers de formation permettant l’appropriation et l’utilisation des services offerts par la plateforme éditoriale LaCAS.


Vers une infrastructure communautaire

D-Parsas envisage de faire évoluer la plateforme LaCAS vers une véritable infrastructure communautaire en établissant des partenariats institutionnels avec des universités et grands établissements, des musées d’arts et de civilisations et d’autres infrastructures nationales telles que l'Institut des Sciences Humaines et sociales INSHS (CNRS), le Centre pour la communication scientifique directe CCSD, la TGIR Huma-Num, GIS aréaux, Réseau national des Maisons des Sciences de l'Homme (RnMSH), Unités Mixtes des Instituts français de l'étranger UMIFRE...   

Mots-clés :