search

actions - event

state: published
- cancelpublished
- view workflow

Mesure de la quantité d’information syntaxique : une donnée essentielle pour les applications en TALN

old_uid	4443
title	Mesure de la quantité d’information syntaxique : une donnée essentielle pour les applications en TALN
start_date	2008/03/27
schedule	14h30
online	no
location_info	salle des theses
summary	La quantité et la qualité des informations contenues dans un énoncé sont très variables d’une production à une autre. Certains énoncés contiennent un très grand nombre d’informations, ils sont dans une certaine mesure plus denses que d’autres, moins informatifs. Le repérage et la mesure de cette densité s’avère être un outil extrêmement intéressant à plusieurs points de vues. Il peut en effet servir d’heuristique de contrôle dans le processus d’analyse lui-même : les structures les plus denses seront préférées aux autres. Mais il peut également permettre de comparer la forme des énoncés. Une telle comparaison permet par exemple d’indiquer en quoi certains énoncés sont plus faciles à traiter que d’autres ou pourquoi certains sont préférés à d’autres. Du point de vue de la perception enfin, cette mesure permet de rendre compte de l’acceptabilité des énoncés et de la prédire. Nous présenterons dans cet exposé une approche focalisant sur l’information syntaxique en permettant de la quantifier. Elle repose sur une vision particulière de la syntaxe, plus flexible que les approches génératives traditionnelles, en permettant en particulier de décrire tout type d’énoncé, quelle que soit sa forme (y compris des énoncés oraux). Cette approche syntaxique repose sur des contraintes et nous verrons comment le système de contraintes peut être utilisé dans cette perspective de quantification. Nous présenterons un ensemble d’indices utilisés pour un calcul automatique de la densité ainsi que les résultats obtenus sur différents corpus. Une validation psycholinguistique de la prédiction de l’acceptabilité sera enfin décrite.
responsibles	Mothe, Lemarié, Debats

hosted_by

Institut de recherche en informatique de Toulouse - IRIT

speakers

event_of

TAL et recherche d'information : profilage linguistique des requêtes (2007)

Event #157928 - latest update on 2022/05/17, created on 2008/03/05