D’Autrice à Zlataner : enrichissement linguistique et exploration des sites... (2018)

shared_uid2730
titleD’Autrice à Zlataner : enrichissement linguistique et exploration des sites...
typeJournée
year2018
start_date2018/10/15
stop_date2018/10/15
schedule13h30-19h
activeno
websitehttps://dautrice-a-zlataner.eventbrite.fr
summaryLa Bibliothèque nationale de France (BnF), l'équipe Représentation des connaissances et langage naturel du Laboratoire d'informatique de Paris Nord (LIPN-RCLN UMR7030 CNRS) de l'université Paris 13 et le laboratoire Linguistique, Langues, Parole (LILPA) de l'université de Strasbourg présenteront les principaux résultats du projet Néonaute lors d'une demi-journée d'études. Ce projet, soutenu par la Délégation générale à la langue française et aux langues de France (DGLFLF) dans le cadre de l'appel à projet 2017 « Langues et numérique »,  et coordonné par le LIPN-RCLN, vise à doter les observateurs de la langue française d’un moteur de recherche s'appuyant sur la collection « Actualités » du dépôt légal du web conservée à la BnF depuis 2010. Le projet Néonaute est un projet financé de septembre 2017 à septembre 2018 par la DGLFLF dans le cadre de l'appel à projet 2017 « Langues et Numérique » qui rassemble deux laboratoires de recherche (LIPN-RCLN UMR 7030 CNRS Université Paris 13 SPC ; LILPA EA 1339, Université de Strasbourg) et la Bibliothèque nationale de France (BnF). Coordonné par le LIPN-RCLN, le projet Néonaute vise à doter les observateurs de la langue française d’un moteur de recherche s'appuyant sur la collection « Actualités » du dépôt légal du web conservée à la BnF depuis 2010, comprenant plus de 10 To de données textuelles de la presse en ligne. L'objectif principal est d'enrichir les index disponibles avec les résultats d'une analyse linguistique automatique : analyse morphosyntaxique, détection des entités nommées (noms de personnes, de lieux et d'organisations), analyse thématique. Les différentes informations sont ensuite indexées et peuvent être interrogées. Trois cas d'utilisation sont également prévus, liés à la néologie et à son suivi en corpus. Néonaute se présente sous la forme d’une plateforme dotée de fonctionnalités de recherche avancée (exploitation de métadonnées, analyse linguistique automatique, visualisation interactive des résultats, recherche par liste de mots) avec un prototype disponible en ligne. L'objectif de la demi-journée d'étude est de présenter les résultats principaux de ce projet,  les verrous encore à surmonter et d'envisager une suite à ces travaux.
responsiblesCartier