Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues

titleModèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues
start_date2024/07/10
schedule14h
onlineno
location_infoGrand Amphi
summaryDans cet exposé, je partagerai mon expérience concernant trois projets collectifs d’entraînement de modèles de fondation auxquels j’ai participé au cours des cinq dernières années. Deux de ces projets ont fourni des ressources populaires pour le traitement automatique de la langue en français écrit (FlauBERT) et oral (LeBenchmark). Le troisième projet, le plus récent, concerne l’entraînement d’un modèle multilingue pour la parole, mHUBERT-147. Je mettrai en lumière les points communs et les différences entre ces initiatives, en insistant particulièrement sur l’importance du choix, de la préparation des données, ainsi que de l’évaluation des performances.
responsiblesNC