|
Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues| title | Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues |
|---|
| start_date | 2024/07/10 |
|---|
| schedule | 14h |
|---|
| online | no |
|---|
| location_info | Grand Amphi |
|---|
| summary | Dans cet exposé, je partagerai mon expérience concernant trois projets collectifs d’entraînement de modèles de fondation auxquels j’ai participé au cours des cinq dernières années. Deux de ces projets ont fourni des ressources populaires pour le traitement automatique de la langue en français écrit (FlauBERT) et oral (LeBenchmark). Le troisième projet, le plus récent, concerne l’entraînement d’un modèle multilingue pour la parole, mHUBERT-147. Je mettrai en lumière les points communs et les différences entre ces initiatives, en insistant particulièrement sur l’importance du choix, de la préparation des données, ainsi que de l’évaluation des performances. |
|---|
| responsibles | NC |
|---|
Workflow history| from state (1) | to state | comment | date |
| submitted | published | | 2024/06/27 13:58 UTC |
| |
|