|
Contributions du traitement automatique de la parole à l’analyse phonétique des voyelles| old_uid | 5718 |
|---|
| title | Contributions du traitement automatique de la parole à l’analyse phonétique des voyelles |
|---|
| start_date | 2008/11/28 |
|---|
| schedule | 10h30 |
|---|
| online | no |
|---|
| location_info | Amphi 9 |
|---|
| summary | Dans cette présentation, les résultats de publications effectuées en collaboration avec Martine Adda-Decker, Audrey Bürki et Cécile Fougeron seront développés. Les données de plusieurs dizaines d'heures de parole journalistique du français et de 7 autres langues (allemand, anglais américain, arabe, espagnol, italien, mandarin, portugais européen) ont été analysées automatiquement. Ces données sont principalement issues du système de transcription automatique du LIMSI. Les méthodes d’investigation sont ici fondamentalement inversées en comparaison des études réalisées sur des corpus linguistiques construits ad-hoc, puis segmentés et analysés manuellement. Trois questions méthodologiques se posent en premier lieu :
1- Les frontières des différents phonèmes ainsi segmentés automatiquement sont-elles fiables par rapport à une segmentation humaine ? Une segmentation humaine est-elle naturellement irréprochable ?
2- Les mesures acoustiques automatiques (f0, formants, amplitude) effectuées sont-elles fiables pour des analyses phonétiques ? Les mesures erronées ne fournissent-elles pas des indications utiles ?
3- Les différentes sources de variation dans un corpus de parole continue doivent être prises en compte dans les analyses (par exemple la quantité très importante de mots outils qui diffèrent des mots lexicaux, la réalisation des /y/ est influencée par la forte présence de "tu" dans certains corpus d’interaction, le /œ/ est fréquemment suivi d'un /r/ en français ce qui modifie sa réalisation, etc.). Ces sources de variations sont également riches en informations puisqu'elles font partie des caractéristiques de la langue.
Après ces précautions méthodologiques, différentes études phonétiques réalisées sur ces données conséquentes ont permis de revisiter et de re-préciser des théories sur la réalisation des voyelles en français et différentes langues, habituellement réalisées sur une petite quantité de données et de locuteurs.
4- Comment prédire la réalisation spectrale des voyelles en fonction de leur durée et de l’influence du contexte consonantique ? Les analyses précédemment effectuées dans la littérature se contentent généralement d’étudier des contextes consonantiques symétriques, dont certains sont très peu fréquents en parole.
5- Des interactions importantes entre segmental et suprasegmental sont mises en évidence pour tous les phonèmes : réalisation du phonème en fonction de sa position au sein de la syllabe, du mot, du groupe intonatif...
6- Certains phonèmes sont considérés comme plus résistants à la coarticulation et donc moins variables acoustiquement (/i/ et /y/ par opposition à /a/ par exemple). Nous montrons que certaines mesures souvent négligées mettent en évidence des variations importantes pour ces phonèmes (mouvements du troisième formant de /i/ et /y/ pour l’exemple précédent).
7- Les théories phonologiques prédisent une réalisation acoustique similaire entre schwa et /œ/ en français. Nos études ont pu mettre en valeur des réalisations spectrales distinctes et différentes stratégies pour les locuteurs analysés.
8- Comparaisons inter-langues : confrontation à nos données de théories sur la prédiction des systèmes vocaliques (la théorie quantique, la théorie de la dispersion adaptative et la théorie de la focalisation-dispersion).
9- Discussion sur l'utilité de ces résultats en Reconnaissance Automatique de la Parole et en synthèse de la parole, et sur les limites du traitement automatique pour l’analyse phonétique. |
|---|
| oncancel | Changement de lieu et d’horaire |
|---|
| responsibles | Loevenbruck, Welby |
|---|
| |
|