Extraction de cadres de sous-catégorisation verbale à partir du treebank de Paris 7

old_uid2326
titleExtraction de cadres de sous-catégorisation verbale à partir du treebank de Paris 7
start_date2007/03/05
schedule14h30-16h30
onlineno
location_infosalle 131
detailsattention au changement de salle
summaryJe vais présenter une expérience d'extraction automatique de sous-catégorisation de 1362 verbes francais à partir du corpus arboré de Paris7 (10 000 phrases donc ils sont extraits 12 510 occurrences verbales). Je présente une évaluation de l'extraction des cadres basée sur la fonction des arguments, ce qui fournit 39 cadres différents avec une moyenne de 1,75 cadres par lemme. Ensuite, sont présentés les résultats pour une approche mixte (avec fonction et catégorie syntaxique) qui nous fournit dans un premier temps 925 cadres différents, avec une moyenne de 3,44 cadres par lemme. Je vais discuter aussi plusieurs méthodes de factorisation (qui neutralisent par exemple les variantes de réalisation avec le passif ou les pronoms clitiques) afin de réduire le nombre des cadres et le taux d'ambiguité.
responsiblesDanlos