Typologie quantitative à partir des treebanks syntaxiques Universal Dependencies

titleTypologie quantitative à partir des treebanks syntaxiques Universal Dependencies
start_date2024/12/09
schedule15h-16h30
onlineno
location_infosalle Ennat Léger
detailsSéminaire DiLiS
summaryAprès avoir présenté l’annotation syntaxique en dépendance, nous montrerons principalement trois études réalisées à partir des treebanks des 160 langues de la base UD, sans oublier d'en pointer les limites (déséquilibre de l’échantillonnage, qualité variable des annotations, nature du schéma d'annotation). Une étude sur l’ordre des mots et les universaux à la Greenberg (Gerdes, Kahane, Chen 2021; Kahane, Peng, Gerdes 2023) Une étude sur la complexité syntaxique en terme de longueur des dépendances et de flux de dépendance (Kahane & Yan 2019) Une étude sur la taille des constituants selon leur position et le principe “short-before-long” (Gerdes & Kahane 2025) Nous terminerons en présentant le projet ANR Autogramm d’induction de descriptions grammaticales à partir de treebanks et ses implications pour la typologie : possibilité d’induire les prédicteurs de l’ordre des mots, possibilité d’induire des grammaires contrastives.
responsiblesCoupé