Le projet scientifique de l'ERTIM s’articule autour des thèmes suivants :
– la recherche en sémantique des textes pour les applications multilingues ;
– le développement de méthodologie pour l’ingénierie des textes et des documents numériques multilingues ;
– la production de ressources multilingues (lexicales, terminologiques, textuelles, didactiques).
Les champs disciplinaires dans lesquels l’équipe évolue sont ceux du traitement automatique des langues, des statistiques textuelles, de la terminologie et de l’ingénierie des connaissances, de la didactique, mais aussi de la linguistique générale (lexicologie textuelle, sémantique textuelle, morphologie lexicale).
Axe 1 : Sémantique de corpus et applications (resp. Mathieu Valette)
Cet axe vise à approfondir les propositions théoriques de la sémantique textuelle, en l’appliquant à l’ingénierie multilingue. Il s’agit notamment d’élaborer des méthodologies de traitement de corpus, de modéliser et de participer au développement d'outils de fouille de textes, d’analyse et d’interprétation de textes assistées. Les applications visées sont celles de la recherche d’information, la classification de documents et la fouille de textes.
Axe 2 : Acquisition des connaissances (resp. Frédérique Segond)
Cet axe a pour objet l’élaboration de méthodes et leur mise en œuvre pour l’acquisition et le traitement de corpus multilingues et multi-écritures (méthodes et outils), la reconnaissance et l’extraction d’informations linguistiques (structuration de lexiques et de terminologies/ontologies, etc.).
Axe 3 : Technologies éducatives et apprentissage des langues (resp. François Stuck)
Cet axe vise la conception et le développement finalisé de méthodes et d'outils d’apprentissage des langues fondés sur la création de ressources intégrant des techniques de corpus et de TAL.
Axe transversal : corpus et multilinguisme (resp. Jean-Michel Daube)
Les thèmes abordés sont les enjeux théoriques et pratiques des corpus multilingues (parallèle et comparable), la problématique du multilinguisme dans le traitement automatique du document numérique et la prise en compte technique des spécificités associées (écritures, encodages).