Créoles de Base Portugaise en Afrique - Une approche en TAL pour la mesure de distance entre les langues

titleCréoles de Base Portugaise en Afrique - Une approche en TAL pour la mesure de distance entre les langues
start_date2024/01/22
schedule14h-17h
onlineno
location_infoSalle 124 & Zoom
summaryL'un des aspects théoriques les plus cruciaux et débattus dans la recherche sur les langues créoles concerne la similarité entre ces langues et leur langue lexificatrice, ainsi qu'avec d'autres langues créoles en général. Actuellement, de nouvelles approches intégrant des techniques de traitement du langage naturel, notamment le traitement et la reconnaissance de la parole, ont donné lieu à l'émergence de méthodologies novatrices. L'utilisation de Wav2Vec et de modèles linguistiques multilingues comme XLSR (Conneau et al. 2020), par exemple, offre une nouvelle perspective pour explorer et établir la similitude entre des paires de langues créoles. Ce travail est une tentative préliminaire d’utiliser un modèle de langage multilingue afin de vectoriser, à travers Wav2Vec1 (Baevski et al. 2020), des extraits d’audio (à partir de corpus existants) afin de comparer différentes langues - dans ce cas particulier, le portugais européen (PE) et le Kriol. Afin de tester l’algorithme, développé par Séverine Guillaume (LACITO)2 et Guillaume Wisniewski (LLF)3, nous avons pris 2 approches. Dans un premier temps, nous l’avons testé avec le portugais et le kriol, en comparant les paires de langues suivantes : portugais vs portugais, kriol vs kriol puis portugais vs kriol. Plus tard, afin de tester la robustesse de l’algorithme et des résultats, nous avons testé différents paramètres tels que l’âge et le genre dans le corpus ESLO (ESLO 1 et 2). Cette étude présentera les résultats préliminaires obtenus pour les deux approches testées et discutera des étapes suivantes dans ce type d’approche computationnelle mesurant la similarité entre langues.
responsiblesCabredo Hofherr