Apprentissage supervisé pour le diagnostic du paludisme à haut-débit : réconcilier des experts en conflit

old_uid7652
titleApprentissage supervisé pour le diagnostic du paludisme à haut-débit : réconcilier des experts en conflit
start_date2009/11/20
schedule11h
onlineno
summaryPlasmodium est l'agent responsable du paludisme. Quatre types d'espèces infectieuses du parasite ont été recensées chez l'Homme, qui peut être infecté par une, deux, trois ou quatre d'entre elles: Plasmodium falciparum, P. vivax, P. malariae et P. ovale. Un besoin grandissant de méthodes de diagnostic à haut débit se fait ressentir, principalement dû au fait que les quatre espèces se comportent différemment en termes de gravité du pronostic. Il s'agit par conséquent de dresser une carte épidémiologique de l'infection à Plasmodium. Des méthodes de diagnostic - ou experts - existent. Cependant, les médecins ne disposent pas d'un "Gold Standard" et il est courant d'observer des discordances dans les réponses des experts pour un individu donné. FlexiChip est une puce de génotypage dont on peut extraire des données de SNP (mutation d'un nucléotide). Nous utilisons cette puce, adaptée à l'identification, sur un gène de Plasmodium, de SNPs discriminants pour chacune des infections. Notre objectif est de développer un modèle d'apprentissage supervisé, prenant en entrée les données FlexiChip, afin d'identifier les infections simples et multiples. Cependant, l'absence de méthode de référence contraint l'apprentissage, qui doit prendre en compte des exemples ayant des labels discordants. Les résultats sont les suivants: Nous proposons une méthode simple d'apprentissage supervisé, basée sur des SVM (Support Vector Machines), ainsi qu'une fonction de score calculant un indice de confiance avec lequel attribuer un unique label aux exemples pour lesquels les experts sont en conflit. Nous proposons également une évaluation indicative de la sensibilité et de la spécificité de quatre méthodes actuellement utilisées pour le diagnostic. Travail joint avec Pierre Latouche (CNRS/INRA/Université d'Evry) et Marie-Agnès Dillies (Institut Pasteur)
responsiblesBardet, Cottrell