|
Résumé :
Cette thèse contribue à l'étude de la mémoire humaine à travers une analyse du statut de l'information qui est mise en mémoire. Après avoir passé en revue le statut de l'information en mémoire humaine, en récapitulant les types d'information classiquement reconnus en psychologie cognitive et le statut de l'information supposé dans les modèles les plus influents de mémoire humaine, nous nous sommes centré sur une autre approche de la mémoire, a priori plus prometteuse, issue des recherches en réseaux de neurones artificiels. L'utilisation paradigmatique de l'approche connexionniste faisant appel à des réseaux à couches cachées apprenant par correction d'erreur a donné lieu à des comportements de mémoire très semblables à ceux du système cognitif humain. Dans ces systèmes connexionnistes la mémoire trouve son origine dans le traitement de l'information et se trouve instanciée par l'ensemble des poids de connexion entre les unités du réseau. De ce fait, ces réseaux connexionnistes souffrent d'oubli catastrophique dans les tâches d'apprentissage séquentiel : l'apprentissage de nouvelles informations, modifiant à son tour les poids de connexion du réseau, entraîne l'oubli des événement précédemment maîtrisés. Récemment des solutions basées sur un mécanisme d'auto-rafraîchissement de la mémoire à base d'information distribuée ont été apportées à l'oubli catastrophique. Elles ont non seulement permis de résoudre ce problème, mais ont également conduit à l'hypothèse que l'information distribuée a une nature particulière.
Dans la partie expérimentale de cette thèse nous avons montré, à l'aide de deux simulations connexionnistes, et de deux expériences comportementales que l'information distribuée ne se réduit pas aux types d'information généralement reconnus en psychologie cognitive, et que l'humain y est sensible. Le raisonnement général a été de mettre en évidence un transport de mémoire par l'information distribuée dans une situation mettant en opposition, d'une part l'information distribuée, et d'autre part d'autres types d'information classiquement reconnus en psychologie cognitive (notamment information sur les exemplaires et information sous forme de prototypes).
Un étude supplémentaire a permis d'illustrer l'idée qu'un seul et même réseau connexionniste à correction d'erreur permet, tout naturellement, de par son mode de fonctionnement, de retrouver à la fois de l'information spécifique, et de l'information générale commune aux exemplaires appris. Dans une expérience comportementale nous avons testé et confirmé cette prédiction : en raison du fait qu'elles contiennent à la fois de l'information spécifique et de l'information générale, des associations impliquant des régularités résistent mieux à l'interférence rétroactive que des associations arbitraires, dépourvues de régularités (donc d'information générale). Ce pattern de résultats comportementaux peut être simulé avec un réseau hétéro-associateur des plus simples ; de plus, une architecture connexionniste à auto-rafraîchissement de la mémoire, en permettant de réduire la quantité d'interférence globale, permet d'obtenir des résultats qualitativement identiques à ceux trouvés chez l'humain.
Nous avons approfondi l'investigation de l'information distribuée comme vecteur d'information dans les architectures connexionnistes fonctionnant sur base d'un auto-rafraîchissement de la mémoire, en contribuant à la validation d'une architecture permettant l'apprentissage séquentiel sans oubli catastrophique d'ensembles temporellement ordonnés. En explorant ses bases de fonctionnement, nous avons mis l'accent sur le fait que l'information utilisée pour éviter l'oubli catastrophique de séquences se résume à des entités statiques, participant chacune à la mémoire de toute la séquence. De ce fait, elles peuvent être intercalées à n'importe quel moment pendant l'apprentissage d'une nouvelle séquence, et peuvent même se substituer (de manière probabiliste) à des parties de celle-ci. Cette souplesse du mécanisme de pseudo-rafraîchissement laisse penser que l'architecture peut être utilisée pour modéliser des comportements humains très différents, en fonction des contraintes provenant du domaine, de la situation et de la tâche expérimentale. Une expérience comportementale examinant l'interférence rétroactive dans une situation d'apprentissage séquentiel d'ensembles temporellement ordonnés a servi de base de comparaison pour une simulation. L'architecture a pu simuler le pattern de résultats comportementaux (i.e. pas d'oubli catastrophique), et a de plus fait preuve d'un profil dynamique d'interférence rétroactive qualitativement identique à celui observé chez l'humain, à savoir une chute-précoce-et-amélioration-ultérieure-spontanée dans la performance de rappel de l'ancienne information lors de l'apprentissage d'informations nouvelles.
|