Outils de traitement des comptes-rendus cliniques dans les entrepôts de données de santé

titleOutils de traitement des comptes-rendus cliniques dans les entrepôts de données de santé
start_date2023/02/17
schedule11h
onlineno
visiohttps://docs.google.com/document/d/1bnuIxo9F2WLPsdI9VIn233fMVwybFSUequrUh4vlYkk/edit?usp=sharing
location_infoBig Blue Button
summaryLes comptes-rendus médicaux textuels constituent une source d'information riche, mais peuvent être difficiles à exploiter en raison de la variété des besoins d'extraction et de la grande quantité de données présentes dans les entrepôts de santé (EDS). De plus, les algorithmes mis en place pour traiter ces données peuvent générer des résultats différents en fonction de leur implémentation, or le besoin de reproductibilité est critique dans le monde de la recherche et de la médecine. Nous présentons notre travail sur EDS-NLP, une librairie open-source pour le traitement automatique du langage (TAL) clinique français. Son objectif est de proposer un cadre simple pour traiter de grandes quantités de données textuelles, offrir des algorithmes performants et testés, et simplifier le partage des algorithmes de TAL via GitHub. Cette librairie offre plusieurs fonctionnalités personnalisables telles que le nettoyage de texte, l'extraction de diverses variables, dates et synonymes de terminologies et la détection d'attributs (négation, parenté, hypothèse, etc.). Nous présentons également notre projet de pseudonymisation des textes cliniques en démonstration de ce travail. Enfin, l'obtention de textes de qualité étant une étape critique pour l'exploitation des comptes-rendus des EDS, nous présentons notre travail de modélisation pour l'extraction de corps de texte et la librairie EDS-PDF, qui vise à faciliter l'extraction de textes à partir de documents cliniques PDF.
responsiblesBawden