Extraction de règles de grammaire quantitatives à partir de treebanks syntaxiques

titleExtraction de règles de grammaire quantitatives à partir de treebanks syntaxiques
start_date2025/11/07
schedule14h-15h
onlineno
location_infoAuditoires UCLouvain Agora (AGOR 01)
summaryCette présentation a pour objectif de montrer comment extraire des règles grammaticales quantitatives et interprétables à partir de treebanks syntaxiques. Cette démarche s'inscrit dans le cadre des grammaires descriptives, qui exigent des analyses fines pour décrire des phénomènes linguistiques complexes tout en intégrant les propriétés générales des langues étudiées. Pour y parvenir, nous proposons une formalisation de règles grammaticales guidées par les corpus, faciles à généraliser et à mettre en œuvre via des méthodes automatiques facilement interprétables. Les règles ainsi obtenues sont concises, présentent différents niveaux de granularité, permettent une sélection flexible et sont ordonnées par importance. Les résultats sont évalués sur plusieurs langues afin d'examiner sa capacité à répondre aux besoins descriptifs, puis sont comparés à d'autres approches existantes. La méthodologie est ensuite étendue à la description contrastive des langues, ce qui permet de mettre en évidence leurs différences et leurs similitudes. Cette approche permet d'obtenir des profils linguistiques, c'est-à-dire des ensembles de motifs communs et distinctifs qui caractérisent une langue par rapport à une autre. Les expériences portent sur plusieurs langues et genres textuels. Une attention particulière est accordée à la nature des règles extraites et à leur évaluation. L'objectif final est de démontrer la faisabilité de l'extraction d'une grammaire guidée par des corpus afin de décrire des langues, en exploitant la grammaire implicite contenue dans les corpus annot
responsiblesVanzeveren, Gao