Le système STRING (Statistical and Rule-based Natural Language Processing System for Portuguese) : présentation et état actuel

old_uid15683
titleLe système STRING (Statistical and Rule-based Natural Language Processing System for Portuguese) : présentation et état actuel
start_date2015/05/27
schedule10h
onlineno
summaryLe système STRING est développé par le L2F/INESC-ID de Lisbonne pour le traitement automatique du portugais. Il s’agit d’un système hybride qui emploie à la fois des techniques statistiques et à base de règles pour traiter des textes, en réalisant toutes les opérations fondamentales du traitement automatique des langues : segmentation du texte et analyse lexicale ; levée d'ambiguïtés morphosyntaxiques, par règles et par apprentissage automatique (modèle de Markov caché) ; analyse syntaxique de surface (chunking) et profonde. Le système lève aussi des ambiguïtés de constructions verbales, résout des anaphores, reconnait des entités nommées, identifie et normalise des expressions temporelles, extrait et linéarise des événements. Le système est enfin à la base des applications du système REAP.PT, destiné à l’apprentissage du portugais langue étrangère.
responsiblesSigogne, Rakho