recherche d’information, résumé par extraction

old_uid7615
titlerecherche d’information, résumé par extraction
start_date2009/11/16
schedule10h30
onlineno
summaryLes applications de TAL qui visent à accéder au contenu sémantique de documents (recherche d’information, résumé par extraction, etc.) traitent généralement l’information au niveau local. Or, isoler un segment textuel de sa structure globale rompt la continuité référentielle et peut engendrer de nombreux problèmes pour la compréhension des informations ainsi identifiées. Nous proposons donc un cadre méthodologique pour repérer et représenter la dynamique textuelle liée sous forme d’arbre discursif où le texte est alors représenté comme un ensemble de segments en relation d'inclusion ou de succession. Cette approche permet de visualiser le cheminement qui s'opère entre des référentiels distincts au fur et à mesure de la lecture syntagmatique, en insistant sur les opérations de rupture repérées par des indices linguistiques. La profondeur de l’arbre associé à un texte témoigne de la complexité des différents référentiels en jeu et il est alors possible de situer tout segment textuel dans une organisation globale qui détermine fortement son acceptation sémantique. L'un des objectifs de cette approche que nous illustrerons en détail dans cette présentation est de faire émerger automatiquement d'un corpus les textes sujets à controverses.
responsiblesTolone