|
Travaux en cours sur la traduction neuronale| title | Travaux en cours sur la traduction neuronale |
|---|
| start_date | 2022/12/08 |
|---|
| schedule | 13h |
|---|
| online | no |
|---|
| location_info | salle 306 & visio |
|---|
| summary | Dans un premier temps, je présenterai quelques résultats du projet Neuroviz sur l’analyse des flux d’informations et ses effets pour les biais de genre dans la traduction français/anglais, en particulier liés à la phase de sous-tokenisation.
Puis, je présenterai les premiers résultats de travaux en cours sur la traduction en anglais des dislocations du français. Je montrerai que les systèmes continuent à dupliquer les sujets dans les traductions en anglais dès que l’on s’écarte de la forme canonique de la dislocation à gauche très présente dans les corpus (type “X, c’est …”), en particulier dans le cas des dislocations multiples. J’analyserai des traductions d’exemples authentiques tirés du Corpus de Français Parlé Parisien (CFPP) et montrerai les limites des systèmes testés (Deepl, Google translate, MBART-50). Je détaillerai une analyse en cours qui vise à l’opérationnalisation de la distance à l’élément disloqué. Si la variable à prédire est le succès de la traduction (au moins en termes d’adéquation syntaxique, grammaticalité des traductions produites), je questionnerai les variables susceptibles d’en rendre compte, qu’il s’agisse de variables qualitatives plus classiques en linguistique de corpus ou du paramètre de la distance entre l’élément disloqué et le prédicat de la principale. Je questionnerai la représentation de la distance en structure de surface pour le linguiste (nombre de tokens, nombre de caractères) mais également dans l’input réel de la machine (nombre de sous-tokens après le prétraitement en byte pair encoding).
Enfin, j’exposerai les idées sous-jacentes au projet MAKE-NMTViz en explicitant les attentes d’une telle démarche : visualiser pour comprendre. Je présenterai des systèmes de visualisation existants ou ayant existé et esquisserai les souhaits de visualisation pour les différentes étapes de la traduction neuronale.
Travaux en collaboration avec Behnoosh Namdarzareh, Guillaume Wisniewski, Jean-Baptiste Yunès, François Yvon, Maria Zimina-Poirot et Lichao Zhu. |
|---|
| responsibles | Portet |
|---|
Workflow history| from state (1) | to state | comment | date |
| submitted | published | | 2022/12/02 13:38 UTC |
| |
|