Représentations sémantiques multilingues (séminaire du groupe de travail-, Labex DigiCosme, Université Paris-Saclay) (2018)

shared_uid2030
titleReprésentations sémantiques multilingues (séminaire du groupe de travail-, Labex DigiCosme, Université Paris-Saclay)
typeSéminaire
year2018
start_date2018/09/13
stop_date2019/03/19
schedule11h-12h30
activeno
websitehttp://labex-digicosme.fr/GT+Representations+Semantiques+Multilingues
summaryLa représentation de connaissances sur les mots ou expressions d’un texte est un point clé pour de nombreuses tâches de traitement automatique des langues. C’est le cas par exemple pour extraire des informations à partir de textes libres. Les méthodes actuellement employées en extraction d’information reposent généralement sur un apprentissage supervisé qui exploite les représentations dont on dispose a priori sur chaque mot d’un texte pour mieux détecter les entités mentionnées dans un texte (par exemple les personnes, lieux, organisations, ou encore les maladies, examens, traitements), leurs relations (qui travaille où, quel examen diagnostique quelle maladie), etc. Disposer de représentations sémantiques est particulièrement important pour la qualité des résultats obtenus. Les travaux récents explorent deux aspects de ces représentations, qui seront développés dans ce groupe de travail : Des représentations sémantiques peuvent être apprises de façon non supervisée à partir de grands corpus non annotés (Brown et al., 1992 ; Clark, 2003 ; Ferret, 2013). Leur usage dans des systèmes d’apprentissage supervisé est un thème qui s’est développé au cours de ces dernières années (Turian et al., 2009, 2010 ; Sun et al., 2011 ; Akbik et al., 2013 ; Chatzimina et al., 2014). Ces représentations sont habituellement apprises pour une langue donnée, celle du corpus d’apprentissage. L’apprentissage de représentations communes à plusieurs langues commence à voir le jour dans les travaux les plus récents (Täckström et al., 2012 ; Täckström 2012). L’utilisation exclusive d’attributs interlingues permet d’envisager la mise au point plus rapide ou avec une meilleure qualité de systèmes qui fonctionnent sur plusieurs langues : soit par entraînement sur une langue et application directe sur une autre, soit par entraînement conjoint sur plusieurs langues. L’exploration de cette problématique prometteuse est l’objectif principal de ce groupe de travail. De plus, des représentations sémantiques interlingues sont susceptibles de se rapprocher des concepts employés dans les représentations de type ontologique, qui cherchent à s’abstraire d’une langue particulière pour représenter les connaissances d’un domaine. Cela crée des liens à explorer avec le domaine de la représentation des connaissances.
responsiblesZweigenbaum