Mesure de la quantité d’information syntaxique : une donnée essentielle pour les applications en TALN

old_uid4443
titleMesure de la quantité d’information syntaxique : une donnée essentielle pour les applications en TALN
start_date2008/03/27
schedule14h30
onlineno
location_infosalle des theses
summaryLa quantité et la qualité des informations contenues dans un énoncé sont très variables d’une production à une autre. Certains énoncés contiennent un très grand nombre d’informations, ils sont dans une certaine mesure plus denses que d’autres, moins informatifs. Le repérage et la mesure de cette densité s’avère être un outil extrêmement intéressant à plusieurs points de vues. Il peut en effet servir d’heuristique de contrôle dans le processus d’analyse lui-même : les structures les plus denses seront préférées aux autres. Mais il peut également permettre de comparer la forme des énoncés. Une telle comparaison permet par exemple d’indiquer en quoi certains énoncés sont plus faciles à traiter que d’autres ou pourquoi certains sont préférés à d’autres. Du point de vue de la perception enfin, cette mesure permet de rendre compte de l’acceptabilité des énoncés et de la prédire. Nous présenterons dans cet exposé une approche focalisant sur l’information syntaxique en permettant de la quantifier. Elle repose sur une vision particulière de la syntaxe, plus flexible que les approches génératives traditionnelles, en permettant en particulier de décrire tout type d’énoncé, quelle que soit sa forme (y compris des énoncés oraux). Cette approche syntaxique repose sur des contraintes et nous verrons comment le système de contraintes peut être utilisé dans cette perspective de quantification. Nous présenterons un ensemble d’indices utilisés pour un calcul automatique de la densité ainsi que les résultats obtenus sur différents corpus. Une validation psycholinguistique de la prédiction de l’acceptabilité sera enfin décrite.
responsiblesMothe, Lemarié, Debats