PersPred : une base de données pour les prédicats complexes du persan

old_uid13715
titlePersPred : une base de données pour les prédicats complexes du persan
start_date2014/03/28
schedule10h-12h
onlineno
summaryCet exposé sera consacré à la présentation des propriétés linguistiques des prédicats complexes du persan et de la première base de données syntaxique et sémantique encodant environ 700 de ces combinaisons, PersPred 1. Le persan ne dispose que d’environ 250 verbes simples. La conversion des noms et des adjectifs en verbes, bien que disponible, a cessé d’être productive. L’essentiel du lexique verbal est par conséquent formé de séquences syntaxiques, composées d’un verbe et d’un élément préverbal (nom, adjectif, préposition ou une combinaison de ces derniers) et qualifiées de « verbes composés » (compound verbs), « constructions à verbe support » ou « prédicats complexes ». Les propriétés morphologiques, syntaxiques et sémantiques de ces constructions ont fait l’objet de nombreuses recherches théoriques depuis une vingtaine d’années. Toutefois, aucune ressource lexicale à grande échelle n’était disponible et les généralisations formulées dans divers travaux s’appuyaient sur un ensemble de données extrêmement réduit. Il est à noter que ces combinaisons ne sont pas répertoriées de façon systématique dans les dictionnaires. PersPred est la première tentative pour combler cette lacune. Basée sur l’étude théorique et descriptive de Samvelian (2012) et de Samvelian & Faghiri (à paraître), PersPred propose une classification syntaxique et sémantique des prédicats complexes du persan. La méthodologie adoptée s’inspire à la fois des tables du lexique-grammaire (M. Gross 1975) et de la classification des verbes d’anglais élaborée par Levin (1993). Le résultat est représenté sous forme d’un tableau dont chaque ligne correspond à une combinaison prédicative d’un verbe et d’un élément non verbal et dont les colonnes présentent divers types d’information. L’originalité de PersPred réside dans les regroupements sémantiques des prédicats permettant notamment de rendre compte de la productivité de ces combinaisons, malgré leurs propriétés idiomatiques, et de faciliter ainsi l’intégration de nouvelles combinaisons (Samvelian & Faghiri, 2013). La 2ème version du PersPred contient environ 1200 entrées et été obtenue en combinant l’annotation automatique et la validation manuelle.
responsiblesKnittel, Servas