|
Raisonnement, mémorisation et généralisation dans les LLM| title | Raisonnement, mémorisation et généralisation dans les LLM |
|---|
| start_date | 2026/05/06 |
|---|
| schedule | 9h-17h |
|---|
| online | no |
|---|
| location_info | salle A033 |
|---|
| summary | Les LLM ne raisonnent pas comme les humains. Le terme "raisonnement", tel que couramment appliqué aux LLM, recouvre différentes notions: on peut distinguer les Chain of Thoughts (CoT) issues du pretraining, les CoT apprises de manières supervisées, les CoT apprises par renforcement, mais aussi la décomposition d'une tâche complexe en séquence de tâches plus simples, le raisonnement spatial, temporel, compositionnel, etc. Je présenterai plus particulièrement des travaux de l'état de l'art concernant la non-interprétabilité de la CoT, son rôle en tant qu'artefact technique pour augmenter les resources de calcul disponibles au LLM pour construire sa réponse, la source possible dans le corpus d'apprentissage de ces capacités de raisonnement, et les méthodes pour obtenir de meilleures CoT. |
|---|
| responsibles | Rebuschi, d’Aquin, Langlois |
|---|
Workflow history| from state (1) | to state | comment | date |
| submitted | published | | 2026/04/30 07:08 UTC |
| |
|