Mettre en évidence le temps lexical dans un corpus de grandes dimensions : l’exemple des débats du Parlement européen

old_uid12919
titleMettre en évidence le temps lexical dans un corpus de grandes dimensions : l’exemple des débats du Parlement européen
start_date2017/01/30
schedule14h-16h
onlineno
summaryL'Ecole française d'analyse du discours a appliqué au traitement des corpus textuels deux principales méthodes empruntées à l'analyse de données multivariée : l'analyse des spécificités lexicales et l'analyse factorielle des correspondances (AFC). Ces méthodes sont également utiles pour l'étude de corpus ordonnés suivant une variable chronologique, quand l'objectif est de faire ressortir l'évolution d'un "temps lexical”, mais avec la prise en compte de certaines contraintes. Dans une perspective complémentaire, nous présentons un procédé de classification spécifiquement adapté à ce type de corpus : la classification ascendante hiérarchique par contiguïtés (CAHC), introduite par Gries & Hilpert (variablility-based neighbour clustering, 2008 ; 2012) comme outil de périodisation dans le domaine de la linguistique de corpus diachronique. Cette méthode de classification est appliquée au traitement d'un corpus volumineux, celui des interventions en séance plénière au Parlement européen entre 1996 et 2011. A titre d'exemple, nous étudions la variation chronologique concernant l'usage du mot civilisation, tel qu'il se manifeste à travers ses inventaires collocationnels partitionnés par année. Nous observons que la méthode permet de mettre en évidence un point de basculement principal correspondant à l'année 2001. Il coïncide avec l'émergence d'un champ lexical cooccurrentiel indiquant une référence dialogique à la formule “choc des civilisations“. De façon symétrique, la collocation “civilisation européenne“, présente avant 2001, suit une évolution opposée. Enfin, nous envisageons comment intégrer une deuxième variable : l'orientation politique des orateurs compris dans le corpus.
responsiblesDétrie, Pélissier