Acquisition automatique d'information sur la valence des verbes à partir de gros corpus

old_uid5045
titleAcquisition automatique d'information sur la valence des verbes à partir de gros corpus
start_date2008/06/09
schedule10h30
onlineno
summaryMême s'il existe des base de données lexicales sous format électronique pour le français (le Lexique-grammaire, Dicovalence, le Lefff, etc.), il existe peu de techniques permettant d'adapter ces lexiques à de nouveaux domaines. Or, on sait que dans les domaines techniques notamment (Droit, médecine, etc.), le comportement langagier peut varier de manière importante et les ressources existantes doivent être adaptées et complétées. On présente ici une approche originale permettant d'inférer des informations de valence à partir de gros corpus, sans lexique ni schéma de valence prédéfini. La difficulté principale vient du fait que l'on est confronté à des formes de surface ambiguës à partir desquelles on souhaite inférer des connaissances non ambiguës. Les expériences que nous présentons sont basées sur un corpus de 10 ans du journal Le Monde, comprenant environ 200 millions de mots. On verra l'apport des informations de nature statistiques dans ce cadre ; on verra aussi comment les expériences effectuées peuvent nous amener à voir de façon différente les notions d'arguments et de modifieurs. Au cours de la discussion, on souhaite échanger sur ces techniques et voir en quoi elles pourraient compléter des travaux de nature différente, en particulier ceux qui visent à élaborer des bases lexicales à la main.
responsiblesTolone