search

actions - event

state: published
- cancelpublished
- view workflow

Acquisition automatique d'information sur la valence des verbes à partir de gros corpus

old_uid	5045
title	Acquisition automatique d'information sur la valence des verbes à partir de gros corpus
start_date	2008/06/09
schedule	10h30
online	no
summary	Même s'il existe des base de données lexicales sous format électronique pour le français (le Lexique-grammaire, Dicovalence, le Lefff, etc.), il existe peu de techniques permettant d'adapter ces lexiques à de nouveaux domaines. Or, on sait que dans les domaines techniques notamment (Droit, médecine, etc.), le comportement langagier peut varier de manière importante et les ressources existantes doivent être adaptées et complétées. On présente ici une approche originale permettant d'inférer des informations de valence à partir de gros corpus, sans lexique ni schéma de valence prédéfini. La difficulté principale vient du fait que l'on est confronté à des formes de surface ambiguës à partir desquelles on souhaite inférer des connaissances non ambiguës. Les expériences que nous présentons sont basées sur un corpus de 10 ans du journal Le Monde, comprenant environ 200 millions de mots. On verra l'apport des informations de nature statistiques dans ce cadre ; on verra aussi comment les expériences effectuées peuvent nous amener à voir de façon différente les notions d'arguments et de modifieurs. Au cours de la discussion, on souhaite échanger sur ces techniques et voir en quoi elles pourraient compléter des travaux de nature différente, en particulier ceux qui visent à élaborer des bases lexicales à la main.
responsibles	Tolone

hosted_by

Cité Descartes

speakers

event_of

Équipe informatique linguistique - IGM (séminaire de l’) (2007)

Event #158529 - latest update on 2022/05/17, created on 2008/05/28