Machines d’Eilenberg, bibliothèque Zen, et applications au traitement informatique du sanskrit

old_uid5578
titleMachines d’Eilenberg, bibliothèque Zen, et applications au traitement informatique du sanskrit
start_date2008/11/13
schedule14h-15h30
onlineno
summaryL'exposé introduit la notion de machine d'Eilenberg, un cadre relationnel pour le calcul. Une machine d'Eilenberg consiste en un contrôle fini et un modèle de calcul relationnel. Le contrôle est spécifié par un automate fini non déterministe, typiquement présenté par une expression rationnelle. La partie données est définie par une relation calculable sur un domaine de calcul, présentée récursivement comme un générateur de streams. Un processus (reactive engine) fournit un simulateur complet, sous des hypothèses idoines. Les machines d'Eilenberg finies, dégagées des travaux de thèse de Benoît Razet, en sont une instance importante, elles généralisent de manière homogène les automates et les transducteurs d'état fini, mais aussi d'autres systèmes de transition. Les machines d'Eilenberg se composent de manière modulaire. On peut axiomatiser leur formalisation dans l'assistant de preuves Coq, prouver leur cohérence, et extraire mécaniquement de la preuve une implémentation efficace en Ocaml. La bibliothèque Zen propose un cadre d'implémentation de telles machines, approprié au traitement des couches superficielles (lexique, phonologie, morphologie, segmentation) des langues naturelles. Une famille de machines réactives, opérant sur des arbres lexicaux décorés appelés aums, implémentent différents transducteurs, est utilisable pour la recherche en lexique, les calculs morpho-phonémiques, la segmentation, et l'analyse superficielle.. On présentera son application pour le traitement du sanskrit.
responsiblesDaille