|
Mesure de la quantité d’information syntaxique : une donnée
essentielle pour les applications en TALNold_uid | 4443 |
---|
title | Mesure de la quantité d’information syntaxique : une donnée
essentielle pour les applications en TALN |
---|
start_date | 2008/03/27 |
---|
schedule | 14h30 |
---|
online | no |
---|
location_info | salle des theses |
---|
summary | La quantité et la qualité des informations contenues dans un
énoncé sont très variables d’une production à une autre.
Certains énoncés contiennent un très grand nombre
d’informations, ils sont dans une certaine mesure plus
denses que d’autres, moins informatifs.
Le repérage et la mesure de cette densité s’avère être un
outil extrêmement intéressant à plusieurs points de vues. Il
peut en effet servir d’heuristique de contrôle dans le
processus d’analyse lui-même : les structures les plus
denses seront préférées aux autres. Mais il peut également
permettre de comparer la forme des énoncés.
Une telle comparaison permet par exemple d’indiquer en quoi
certains énoncés sont plus faciles à traiter que d’autres ou
pourquoi certains sont préférés à d’autres. Du point de vue
de la perception enfin, cette mesure permet de rendre
compte de l’acceptabilité des énoncés et de la prédire.
Nous présenterons dans cet exposé une approche focalisant
sur l’information syntaxique en permettant de la quantifier.
Elle repose sur une vision particulière de la syntaxe, plus
flexible que les approches génératives traditionnelles, en
permettant en particulier de décrire tout type d’énoncé,
quelle que soit sa forme (y compris des énoncés oraux).
Cette approche syntaxique repose sur des contraintes et nous
verrons comment le système de contraintes peut être utilisé
dans cette perspective de quantification. Nous présenterons
un ensemble d’indices utilisés pour un calcul automatique
de la densité ainsi que les résultats obtenus sur différents
corpus.
Une validation psycholinguistique de la prédiction de
l’acceptabilité sera enfin décrite. |
---|
responsibles | Mothe, Lemarié, Debats |
---|
| |
|