Approches automatiques pour l'évaluation de la difficulté du langage

old_uid15001
titleApproches automatiques pour l'évaluation de la difficulté du langage
start_date2017/12/15
schedule11h
onlineno
summaryDepuis presque un siècle, les recherches en lisibilité ont visé à proposer des modèles mathématiques capables de prédire automatiquement le niveau de difficulté de textes à la lecture. Parmi les plus connus de ces modèles, aussi appelés formules de lisibilité, citons ceux de Flesch (1948), Dale et Chall (1948), Gunning (1952), etc. À l'aube du 21e siècle, ce domaine a connu un renouveau sous l'impulsion des recherches en traitement automatique du langage, lesquelles ont permis de mettre au point des formules de lisibilités prenant davantage de dimensions textuelles en compte et reposant sur des algorithmes statistiques plus performants. Les sciences cognitives informent également la lisibilité sur les facteurs qui rendent un texte difficile pour un lecteur donné. Enfin, dans la lignée de la lisibilité, des méthodes ont également été développées dans le but de simplifier automatiquement les textes détectés comme trop complexes. Dans cette communication, nous présentons un panorama de nos travaux sur les méthodes automatiques d'évaluation de la complexité langagière. Nous montrerons comment nous sommes passés d'une vision classique de la lisibilité dont le but est d'associer un niveau de difficulté à l'ensemble du texte, à une approche qui cherche à identifier plus précisément les phénomènes linguistiques rendant problématique la lecture d'un texte (ex. termes rares ou spécialisés, structures syntaxiques complexes, etc.). Nous présenterons plusieurs recherches réalisées au Cental qui s'intègrent dans ces approches : (1) AMesure, un logiciel pour l'aide à la rédaction claire des textes administratifs (François et al., 2014) ; (2) le projet CEFRLex (François et al., 2014 ; 2016 ; Tack et al., 2017), un ensemble de lexiques gradués pour l'apprentissage des langues étrangères ; (3) le projet DMesure, une plateforme web offrant un diagnostic précis sur la difficulté des textes pour des lecteurs du français langue étrangère.
responsiblesContact