|
Forêts aléatoires: importance et sélection de variablesold_uid | 16873 |
---|
title | Forêts aléatoires: importance et sélection de variables |
---|
start_date | 2018/12/13 |
---|
schedule | 14h-17h |
---|
online | no |
---|
details | Pour des raisons d’organisation, l’inscription (en ligne) est obligatoire. http://www.math.sciences.univ-nantes.fr/SemDataSciences/inscription-au-seminaire-du-13-decembre |
---|
summary | Séminaire nantais en Science des données.
La méthode des forêts aléatoires, introduite par Leo Breiman en 2001, est désormais largement utilisée tant en classification qu’en régression avec un succès spectaculaire. Après avoir rappelé la source et les principes des méthodes d’arbres, on présente les forêts aléatoires, l’erreur Out-of-Bag et le score d’importance des variables par permutation. On esquisse ensuite une stratégie de sélection de variables en deux étapes : le classement des variables basé sur les scores d’importance suivie d’une procédure d’introduction ascendante séquentielle des variables. |
---|
responsibles | Brière |
---|
| |
|