Qu'est ce qui caractérise un locuteur aux yeux d’un système automatique ?

old_uid1922
titleQu'est ce qui caractérise un locuteur aux yeux d’un système automatique ?
start_date2006/12/11
schedule14h-16h
onlineno
summaryLa reconnaissance Automatique du Locuteur est un domaine en plein développement, notamment au vu du fort intérêt que suscitent de tels systèmes pour des applications de défense nationale. Pour évaluer la  qualité des systèmes automatiques, différentes campagnes d’évaluation internationales sont organisées chaque année. Les plus connues de ces  campagnes sont organisées par le NIST/USA. Ces campagnes, NISt-SRE, sont  basées sur l’emploi de bases de données de grande taille (près d’un  millier de locuteurs et près de 50000 tests), de protocoles expérimentaux strictement définis et d’un mode de fonctionnement « en  aveugle », dans lequel les différents participants réalisent des tests sans connaître a priori la vérité terrain. Les performances enregistrées durant ces tests ont largement progressé durant ces dernières années, pour atteindre un niveau proche de  l’excellence. Au vu du danger d’une évaluation optimiste de la qualité des systèmes, il est important de dépasser le strict critère de performance et de tenter de comprendre quelle information utilisent ces systèmes. Ce séminaire présentera brièvement le contexte expérimental de NIST-SRE ainsi que la structure d’un système de référence UBM-GMM utilisé par la majorité des participants. Nous tenterons ensuite de faire le point sur les informations spécifiques du locuteur, proposées par les experts, avant de montrer quelles catégories d’informations peuvent être prises en compte par de tels systèmes. Enfin, pour mettre en lumière les dangers sous-jacents à une analyse restrictive des performances, nous présenterons un dispositif de transformation de la voix, apte à tromper les meilleurs systèmes actuels.
responsiblesDétrie