Forêts aléatoires: importance et sélection de variables

old_uid16873
titleForêts aléatoires: importance et sélection de variables
start_date2018/12/13
schedule14h-17h
onlineno
detailsPour des raisons d’organisation, l’inscription (en ligne) est obligatoire. http://www.math.sciences.univ-nantes.fr/SemDataSciences/inscription-au-seminaire-du-13-decembre
summarySéminaire nantais en Science des données. La méthode des forêts aléatoires, introduite par Leo Breiman en 2001, est désormais largement utilisée tant en classification qu’en régression avec un succès spectaculaire. Après avoir rappelé la source et les principes des méthodes d’arbres, on présente les forêts aléatoires, l’erreur Out-of-Bag et le score d’importance des variables par permutation. On esquisse ensuite une stratégie de sélection de variables en deux étapes : le classement des variables basé sur les scores d’importance suivie d’une procédure d’introduction ascendante séquentielle des variables.
responsiblesBrière