|
L’intelligence artificielle pour l’analyse syntaxique : évaluation et adaptation de modèles| title | L’intelligence artificielle pour l’analyse syntaxique : évaluation et adaptation de modèles |
|---|
| start_date | 2024/09/26 |
|---|
| schedule | 14h-15h30 |
|---|
| online | no |
|---|
| location_info | salle de documentation |
|---|
| summary | En linguistique, la constitution de corpus annotés de taille moyenne et large, surtout en ce qui concerne les langues peu dotées et les langues en diachronie, représente toujours un défi considérable et souvent chronophage pour les chercheurs. L’avènement des outils d’apprentissage profond et de gros modèles de langues (LLM) a permis d’envisager la possibilité d’annotation de données massives de haute qualité à moindre coût. Notamment en syntaxe, les analyseurs automatiques (parsers) rendent possible une analyse en fonctions syntaxiques de haute qualité et l’adaptation de modèles à la langue, à la période, au genre textuel etc. du corpus traité.
Se basant sur les expériences récentes des projets High-Tech, MICLE et AUTOMATED menés au CRISCO depuis 2021 et sur les résultats d’un stage en M1 au printemps 2024, cette intervention va présenter, en premier lieu, les principes de l’utilisation des outils d’apprentissage profond pour la recherche en linguistique, ainsi que les premiers résultats de l’évaluation des différents parsers et systèmes de parsing menés par les stagiaires en M1. Deuxièmement, nous allons nous attarder sur l’analyse du processus de l’adaptation d’un modèle entraîné sur un corpus de français médiéval constitué de textes littéraires (Profiterole Old-French@2.14 et Profiterole Middle-French@2.14) pour l’annotation d’un texte juridique du 16ème.
Nous allons conclure sur une série de recommandations pour les linguistes et les étudiants qui seraient intéressés par l’intégration du parsing automatique ou d’autres outils d’apprentissage profond dans leur pratique de chercheurs. |
|---|
| responsibles | NC |
|---|
Workflow history| from state (1) | to state | comment | date |
| submitted | published | | 2024/09/30 12:39 UTC |
| |
|