|
Recherche d’images par combinaison d’information textuelle et visuelle| old_uid | 3218 |
|---|
| title | Recherche d’images par combinaison d’information textuelle et visuelle |
|---|
| start_date | 2007/10/04 |
|---|
| schedule | 10h |
|---|
| online | no |
|---|
| summary | Les Systèmes de Recherche d’Images (SRIm) pour le web utilisent le texte de la page web assurant ainsi le passage à l’échelle (échelonnabilité). D’autres SRIm basés uniquement sur le contenu visuel ne permettent pas de réduire le fossé sémantique. Pour améliorer ces systèmes, une stratégie consisterait à combiner les informations textuelles et visuelles des images généralement mal étiquetées et mal segmentées. Dans cette optique, nous proposons deux méthodes échelonnables que nous testons sur COREL (images 10K, 150 mots).
Premièrement, nous montrons qu’un système bayésien léger et rapide utilisant un index visuel de type Vector Approximation-Files permet une amélioration de l’annotation automatique d’images à partir du contenu visuel de +29% sur le score a priori.
Puis, nous proposons pour ces images mal étiquetées une méthode de réduction adaptative du nombre de dimensions visuelles en fonction du concept. Cette méthode est fondée sur l’hypothèse que les concepts sont présentés avec des contextes visuels suffisamment variables. Nous prouvons théoriquement et expérimentalement que l’approximation de l’analyse linéaire discriminante (ALDA) reste dans ces conditions efficace et qu’elle améliore les classifications hiérarchiques ascendantes de 59% en ne sélectionnant que 10% des dimensions visuelles.
Enfin, nous présentons quelques résultats obtenus lors de la campagne d’évaluation ImagEVAL. |
|---|
| responsibles | Bouchon-Meunier, Diaz, Gallinari |
|---|
| |
|