|
Aufgrund der rasanten Entwicklung in den Digitalisierungstechniken in den letzten Jahren nimmt die Menge an verfügbaren Bildern täglich zu. Weil die manuelle Beschriftung
und das Indexieren von Bildern zum einem subjektiv und zum anderen sehr zeitaufwendig ist, wurde in den letzten Jahren viel Aufwand in die Entwicklung von automatischen Systemen
gesteckt, die Benutzern bei der Suche von Bildern in großen Bilddatenbeständen unterstützen sollen. Diese Systeme werden als "Content-Based Image Retrieval
(CBIR)" Systeme bezeichnet. Die Anwendungsgebiete für derartige Systeme sind sehr vielschichtig: Sie reichen von medizinischen Bilddatenbanken über
Nachrichtenarchiven von Fernsehsendern und digitalisierten Dokumenten in Museen bis hin zu Systemen für Erziehungszwecke.
Während die ersten Systeme ausschließlich Farb-, Textur- und Gestaltmerkmale für die Bildersuche verwendeten, wird heute zunehmend der Benutzer
über das sogenannte "relevance feedback" aktiv (z.B. durch Bewertung der durch das CBIR System gelieferten
Bilder) in den Suchprozess integriert, um so die Performance der Systeme zu verbessern.
Das "relevance feedback" dient auch dazu, Probleme mit dem sogenannten "semantic gap" und der Subjektivität der menschlichen Beschreibung, die bei der Bildsuche zu
beachten sind, zu lösen. Das erste beschreibt die Schwierigkeit für die Zuordnung von semantischen Beschreibungen, die Menschen beim Interpretieren von Bildinhalten
benutzen, zu den entsprechenden "low level" Merkmalen (wie Farbe oder Form), die von CBIR Systemen für die Bildsuche verwendet werden. Dieses ist für die meisten
Benutzer im Allgemeinen sehr schwierig, oder, im Fall von komplexen Bildern, gar unmöglich. Subjektivität der menschlichen Wahrnehmung bedeutet, das sich die
Interpretation des Bildinhaltes bei einem Bild für verschiedene Personen (oder die gleiche Person unter anderen Umständen) unterscheiden kann.
Als eine interessante Quelle für "relevance feedback" kann ein sogenannter Eye Tracker verwendet werden. Dabei handelt es sich um ein Gerät, das die Fixationen
und Sakkaden von Versuchspersonen misst, wenn diese Stimuli (z.B. Bilder) am Computerbildschirm betrachten.
Damit ist es möglich herauszufinden, in welche Bildbereiche der Benutzer verstärkt schaut, wenn er nach ähnlichen Bildern sucht. Diese Informationen können
benutzt werden, um CBIR Systeme anzuweisen, mehr Bedeutung auf die Merkmale dieser ausgewählten Bildbereiche zu legen. Ein erster Schritt in diese neue Forschungsrichtung
besteht darin herausfinden, ob die Aufnahme von Augenbewegungen tatsächlich zu einer Verbesserung bei der Bildsuche führt. Dieses kann mit Hilfe eines
Experimentszenarios erfolgen, bei dem ein Suchbild und sechs (zufällig ausgewählte) Bilder gezeigt werden. Die Aufgabe des Benutzers besteht nun darin, auf eines aus
den sechs Bildern zu klicken, das dem Suchbild seiner oder ihrer Meinung nach am ähnlichsten ist. In einem nächsten Schritt werden dann vom CBIR System die sechs
Bilder berechnet und angezeigt, die dem angeklickten Bild am ähnlichsten sind. Dieser Vorgang wird so lange wiederholt, bis das Suchbild gefunden ist. Dieses Experiment wird
in zwei Ausführungen durchgeführt: Einmal als Java Web-Interface, bei dem nur aufgezeichnet wird, auf welches der sechs Auswahlbilder der Benutzer klickt und zum
anderen als EyeTracking Experiment, bei dem zusätzlich noch die Fixationen aufgenommen werden. Führt das Eye-Tracking Experiment zum schnelleren Wiederfinden
des Suchbildes, haben wir die Nützlichkeit der Einbindung visueller Aufmerksamkeit für die Bildsuche bestätigt.
In Folgeexperimenten kann dann untersucht werden, ob bestimmte Farb-, Form- oder Texturmerkmale für spezielle Suchstrategien bedeutsam sind oder ob diese Merkmale
besondere visuelle Aufmerksamkeit erfordern. Weiterhin erlaubt die Aufnahme von Augenbewegungen Einsichten in visuelle Vergleichsprozesse ("eyes are a window to the brain")
und die Daten aus den Eye-Tracking Experimenten können für die Entwicklung (neuraler) Modelle verwendet werden, die das menschliche visuelle Suchverhalten simulieren.
|