Modèles de mélange gaussien pour la classification des données de grande dimension

old_uid3263
titleModèles de mélange gaussien pour la classification des données de grande dimension
start_date2007/10/12
schedule11h
onlineno
summaryPartant du postulat que les données de grande dimension vivent dans des sous-espaces de dimensions intrinsèques inférieures à la dimension del'espace original et que les données de classes différentesvivent dans des sous-espaces différents dont les dimensions intrinsèques peuvent être aussi différentes, nous proposons une re-paramétrisation du modèle de mélange gaussien. En forçant certains paramètres à être communs dans une même classe ou entre les classes, nous exhibons une famille de 28 modèles gaussiens adaptés aux données de grande dimension, allant du modèle le plus général au modèle le plus parcimonieux. Ces modèles gaussiens sont ensuite utilisés pour la discrimination et la classification automatique de données de grande dimension. Les classifieurs associés à ces modèles sont baptisés respectivement High Dimensional Discriminant Analysis (HDDA) et High Dimensional Data Clustering (HDDC) et leur construction se base sur l'estimation par la méthode du maximum de vraisemblance des paramètres du modèle. La nature de notre re-paramétrisation permet aux méthodes HDDA et HDDC de ne pas être perturbées par le mauvais conditionnement ou la singularité des matrices de covariance empiriques des classes et d'être efficaces en terme de temps de calcul.
responsiblesCarlo, Bardet, Cottrell