Conférence internationale "Digital armenian"
Conférence internationale "Digital Armenian". Humanités numériques, innovations et nouvelles technologies
Conférence internationale organisée par Les laboratoires SeDyL (Inalco-CNRS-IRD), ERTIM (Inalco), l’association ATALA (Paris), l’association Calfa (Paris) et la Société des Études Arméniennes, avec le soutien du laboratoire d’excellence EFL (Paris).Du jeudi 3 au samedi 5 octobre - 9.00-17.00 - Auditorium de l'Inalco et BULAC
Comité scientifique
Chahan Vidal-Gorène (École Nationale des Chartes, Centre Jean Mabillon)
Anaïd Donabédian (Inalco, SeDyL)
Victoria Khurshudyan (Inalco, SeDyL)
Mathieu Valette (Inalco, Ertim)
Thème 1 : E-corpus, E-dictionnaires, Traitement automatique des Langues #1
Jeudi 3 octobre - 10.00-17.00 - AuditoriumDictionnaires numériques, corpus annotés, banque de textes, les ressources pour l'arménien sont nombreuses et complémentaires. Ce thème envisage de dresser un état de l’art de ces ressources et des innovations qu'elles proposent.
Il peut aussi permettre de mettre en lumière les liens que ces ressources peuvent nouer. Quelles sont leurs spécificités ? Peut-on envisager un portage des fonctionnalités ? Quelles normes d’annotation suivent ces corpus ? Un partage des données peut-il s’envisager et si oui quelle normalisation établir ?
Thème 2 : Bibliothèques numériques
Vendredi 4 octobre - 09.30-10.50 - Auditorium
Dans l’actuelle dynamique internationale pour la numérisation et valorisation des fonds, qui voit notamment se multiplier les initiatives pour l’interopérabilité et l’uniformisation des architectures et des notices, quelles sont les politiques menées pour la préservation, la numérisation et la visualisation des collections en arménien ? Selon quelles normes et pour répondre à quels besoins ? Pour quels publics ? Quels enjeux ? Quelles innovations ?
Thème 3 : Nouvelles Technologies, Traitement automatique des Langues #2
Vendredi 4 octobre - 11.20-17.40 - Auditorium
Le traitement automatique des langues est de plus en plus présent dans nos vies, et en particulier dans le monde de la recherche. À l’ère du Big Data, il devient indispensable de disposer d’outils capables de traiter d’importants volumes de données en peu de temps, et de valoriser le patrimoine numérique en cours de création. Les exemples les plus courants sont les technologies de reconnaissance des caractères (OCR), mais aussi celles de traduction automatique. Les communications portent sur tous les thèmes classiques du TAL, et présentent des applications, à l’arménien, de technologies classiques du TAL (fouille de texte, recherche et extraction d’information, question-réponse, génération et résumé de texte, analyse d’opinions, TAL pour la linguistique de corpus, etc.) ou des innovations spécifiques (synthèse vocale, reconnaissance de caractères, etc.).
Ateliers de présentation et de prise en main des différentes technologies et ressources présentées lors du colloque.
Samedi 5 octobre - 10.00-11.30 - à la BULAC (RDC, salle informatique)
1. Serouj Ourishian : Nayiri & Spellchecker
2. BasZen Kindt : Projet GREGoRI et corpus arméniens
3. Anaïd Donabédian : DicZonnaire thémaZque Parastan
4. Chahan Vidal-Gorène : Technologies de reconnaissance de caractères OCR