Correction de productions écrites des apprenants du français assistée par ordinateur

titleCorrection de productions écrites des apprenants du français assistée par ordinateur
start_date2024/03/15
schedule14h
onlineno
location_infoMDL A118
summaryL'évaluation des connaissances en langue est un enjeu fondamental, avec un large spectre d'implications sociales, en particulier dans le contexte des certifications de langues officielles. Les certificats officiels du niveau de compétence linguistique ont un effet direct sur des processus à fort enjeu telles que la naturalisation, la résidence, l'accès au marché du travail ou l’admission dans une l'université. Récemment, la nécessité d'obtenir des certificats attestant des compétences linguistiques s'est accentuée, créant une pression sur les organisations de certification qui ne sont plus en mesure de former suffisant de nouveaux évaluateurs (en raison de contraintes humaines, financières et temporelles). En réponse à ce besoin, la correction automatisée des textes (CAT) vise à déterminer automatiquement le niveau de compétence des candidats à l'aide de techniques de traitement automatique des langues (TAL). Cependant, les modèles CAT actuels, reposant sur l’apprentissage profond, nécessitent de larges corpus afin d’obtenir de bonnes performances. Malheureusement, il n'existe pas de corpus d’apprenants annotés selon l’échelle du CECR suffisamment large pour le français, ce qui rend la situation de la CAT en français loin d'être encourageante. Dans ce contexte, nous avons étudié, en collaboration avec France Éducation International, la faisabilité d'un système de CAT pour des productions écrites d’apprenants en français. Notre présentation sera organisée selon trois parties. Tout d'abord, nous exposerons l'état de l'art, les corpus existants et leurs caractéristiques, ainsi qu'une synthèse des techniques de CAT. Ensuite, nous présenterons le corpus TFCLE-8, qui contient plus de 6 000 productions écrites en français évaluées dans le contexte de l’examen de langue test de connaissance du français (TCF). Enfin, nous décrirons des expériences de CAT pour le français et nous discuterons les facteurs qui ont un impact sur la performance des modèles de CAT.
responsiblesRolin