|
Corpus du projet "Modéliser le changement : les voies du français" avec Supplément de Penn : un corpus annoté en constituants| old_uid | 14936 |
|---|
| title | Corpus du projet "Modéliser le changement : les voies du français" avec Supplément de Penn : un corpus annoté en constituants |
|---|
| start_date | 2015/01/16 |
|---|
| schedule | 14h |
|---|
| online | no |
|---|
| details | Thème de la séance : Linguistique de corpus et annotation syntaxique |
|---|
| summary | Le corpus MCVF du français médiéval a été crée au sein du projet "Modéliser le changement : voies du français" à l'Université d'Ottawa avec une participation active d'une équipe de l'Université de Pennsylvanie. MCVF comporte des textes annotés morphologiquement et syntaxiquement selon les standards de Penn Treebank (http://www.cis.upenn.edu/~treebank/), issus du cadre génératif et utilisés pour un nombre de corpus modernes et historiques (http://www.ling.upenn.edu/hist-corpora/other-corpora.html). Je présenterai les principes d'étiquetage et de parsing, ainsi que de l'utilisation du logiciel CorpusSearch (http://corpussearch.sourceforge.net/) pour créer des requêtes simples, qui permettent de trouver des patrons ('patterns'), et des requêtes plus complexes, qui permettent de coder les textes selon certains paramètres, d'extraire des données sous forme d'un tableau et, finalement, d'ajouter des informations dans les textes. |
|---|
| responsibles | Carlier |
|---|
| |
|