|
Réseaux Lexicaux et grapholinguistiques à différents niveaux de l'arbre des langues sinitiques| title | Réseaux Lexicaux et grapholinguistiques à différents niveaux de l'arbre des langues sinitiques |
|---|
| start_date | 2024/12/13 |
|---|
| schedule | 10h-12h |
|---|
| online | no |
|---|
| location_info | salle Paul Imbs |
|---|
| summary | Les langues sinitiques forment une famille de langues qui partagent de nombreux traits phonologiques, lexicaux, syntaxiques, ainsi que l’écriture chinoise.
Les particularités de cette dernière, notamment sa stabilité graphique dans le temps et son niveau de transcription syllabique/morphologique facilitent certaines mises en relation et le tissage de réseaux lexicaux multilingues originaux, tout en posant des problèmes spécifiques.
Ces dernières années, nous avons travaillé à la construction et à l’exploitation de ces réseaux (Magistry et al, 2015), tout d’abord en cherchant à englober différentes langues sinitiques et sinoxéniques (langues non sinitiques ayant utilisé l’écriture chinoise et emprunté de nombreux léxèmes aux langues sinitiques, à différents moments de leur histoire). Les principales exploitations ont été une étude des indices phonologiques (Magistry et al 2017) et sémantiques (Magistry et Goudin, 2022) portés par les composants des sinogrammes (caractères chinois). Ces travaux avaient notamment une forte motivation issue de la didactique de l’intercompréhension (Goudin, 2017)
Nos travaux actuels dans le cadre de l’ANR DiLSi-HN se focalisent sur la branche bân-lâm (Min du Sud) des langues sinitiques et s’intéressent à la variation dialectale en taigi de Taïwan et en teochew, notamment au sein de la diaspora en France.
L’objectif étant à la fois de prendre à contre-pied notre propre approche a priori très englobante qui mettait l’accent sur ce qui est partagé par ces langues, pour cette fois insister sur la variation. Nous nous plaçons maintenant dans le contexte appliqué du traitement automatique de ces langues qui sont peu ou pas standardisées, langues minorées ou d’héritage. Ces situations sociolinguistiques appellent une attention particulière pour le développement de technologies du langage dédiées, au travers de corpus (Magistry et al, 2024b), claviers virtuels (liens pour le TC?, Magistry 2016 pour le taigi), synthèse (Magistry et al, 2024a) et reconnaissance vocale.
Dans cette présentation, je reviendrai tout d’abord sur les travaux et résultats antérieurs. Puis je présenterai les travaux actuels, les ressources disponibles et les questions encore ouvertes. Mon propos se concentrera sur les réseaux lexicaux, leur construction et leurs applications. |
|---|
| responsibles | Gobert |
|---|
Workflow history| from state (1) | to state | comment | date |
| submitted | published | | 2024/12/05 10:16 UTC |
| |
|