Reconnaissance automatique de la parole pour les langues peu dotées

old_uid4210
titleReconnaissance automatique de la parole pour les langues peu dotées
start_date2008/03/04
schedule09h30-11h30
onlineno
summaryPour beaucoup de langues, les services liés au traitement de l’oral (ou technologies vocales) sont inexistants (synthèse vocale et reconnaissance de la parole). C’est aussi le cas pour une majorité de langues dans le monde, dont certaines sont parlées par plusieurs dizaines de millions de locuteurs (par exemple Bengali : 189 millions, Tamoul : 63 millions ), y compris au sein de l’Europe des 25 (lituanien, letton, polonais, …)! Mes travaux concernent le développement d’une méthodologie générique permettant de déployer rapidement des technologies vocales pour des langues peu dotées. En reconnaissance automatique de parole, il subsiste un certain nombre de verrous concernant la généricité des systèmes et leur portabilité vers de nouvelles langues. L’originalité de l'approche vient de la volonté d’aborder des langues peu ou mal dotées, pour lesquelles peu ou pas de ressources (corpus) sont disponibles, ce qui nécessite des méthodologies innovantes qui vont bien au-delà du simple réapprentissage ou de l’adaptation de modèles. Je décrirai notamment dans cet exposé la notion de modélisation acoustique translingue, introduite dans [Le & Besacier, 2006] permettant la réutilisation de modèles phonétiques pour l'amorçage de la construction de reconnaisseurs de parole. En ce qui concerne la modélisation du langage, l'évolution vers le multi-niveau, avec l'utilisation de nouvelles unités participant à plusieurs niveaux de description (graphèmes, syllabes, mots.) semble fructueuse au plan pratique, et prometteuse au niveau de la modélisation théorique. En effet, dans la littérature, le mot est depuis longtemps l'unité de traitement de base la plus utilisée pour la modélisation statistique du langage. Cependant, des travaux récents montrent que le caractère et le morphème pourraient être de bon candidats à utiliser comme unité de base (ou en complément du mot) dans la modélisation statistique du langage. Ce type d’unité sous-lexicale présente d’une part un intérêt évident pour les langues sans séparateurs comme le khmer, et d’autre part un intérêt également quand à la réduction de la complexité des modèles (réduction du vocabulaire par exemple). La présentation sera illustrée par des resultats expérimentaux obtenus par différents systèmes de reconnaissance automatique de la parole pour les langues vietnamienne, khmère et un dialecte de l'arabe.
responsiblesKern