Apprentissage de représentations de documents liés

old_uid17780
titleApprentissage de représentations de documents liés
start_date2019/09/12
schedule10h
onlineno
summaryL'apprentissage de représentations de documents liés consiste à plonger un corpus structuré dans un espace vectoriel de faible dimension, en prenant en compte à la fois l'information textuelle et l'information structurelle. Au cours de cet exposé, je présenterai des travaux récents à ce sujet, menés au sein de l'équipe DMD du laboratoire ERIC. Premièrement, je présenterai une méthode pour apprendre conjointement des représentations orientées texte, et des représentations orientées structure (Brochier, Guille & Velcin, WWW 2019). J'illustrerai l'intérêt de telles représentations d'un point de vue qualitatif, à travers une tâche de suggestion de mots-clés. Deuxièmement, je présenterai une nouvelle méthode, sans hyperparamètre et basée sur un algorithme d'estimation efficace, qui rend son utilisation particulièrement pratique (Guille & Gourru, soumis). Je démontrerai empiriquement, d'un point de vue quantitatif, la pertinence de cette méthode, tant en classification de documents qu'en prédiction de liens.
responsiblesPiwowarski