"Hybride Wissensrepräsentation"
Teilprojekt A1 im SFB 360

Projektleiter:
Dr. Helge Ritter
Technische Fakultät
(0521) 106-60 62
helge@TechFak.Uni-Bielefeld.DE

Prof. Dr. Gerhard Sagerer
Technische Fakultät
(0521) 106-29 35
sagerer@TechFak.Uni-Bielefeld.DE

Mitarbeiter im Teilprojekt A1:
Dipl.-Phys. Elke Braun
Raum M5-121, Tel. 29 38
ebraun@TechFak.Uni-Bielefeld.DE

Dr. Gunther Heidemann
Raum M7-118, Tel. 60 56
gheidema@TechFak.Uni-Bielefeld.DE

Zusammenfassung
Im zurückliegenden Förderzeitraum konnte die Tragfähigkeit des hybriden Ansatzes, eine schnelle, holistische Instantiierung von Objekthypothesen in den sehr repräsentationsmächtigen Formalismus semantischer Netze einzubetten, durch Entwicklung eines leistungsfähigen Hybriderkenners unter Beweis gestellt werden. Die dabei gewonnenen Erfahrungen öffnen nunmehr den Blick auf mehrere neue Fragestellungen, die im Zentrum der neuen Projektphase stehen sollen.

Ein zentrales Problem der Klassifikation und Analyse komplexer Objekte ist die Zerlegung in semantische Bestandteile und/oder visuell relevante einfachere Komponenten. Derartige Dekompositionen können die Komplexität des Erkennungsprozesses reduzieren, erfordern aber auch entsprechende Modelle, welche die Beziehungen zwischen den einzelnen Teilen für eine sinnvolle Anordnung für das Ganze charakterisieren. Die bisherigen Arbeiten offenbarten ein teilweise kontraintuitives Lösungsmodell. Der Übergang zu komplexeren Objekten erfordert für eine erfolgreiche Szenenanalyse zunehmend kleinere visuelle Einheiten, die jedoch nicht unmittelbar mit semantisch motivierten Bestandteilen korrespondieren. Die relationalen Beziehungen sowohl zwischen Bestandteilen als modellorientierte Deskriptoren als auch zwischen visuell dominanten Komponenten als holistische Erkennungselemente spielen aber im Analyseprozeß eine entscheidende Rolle. Die beidseitige Herangehensweise, d.h. die Verwendung daten- und modellgesteuerter Deskriptoren in Verbindung mit ihren einen Objekttyp etablierenden Beziehungen, läßt einen entscheidenden Fortschritt für die Bildanalyse erwarten.

Der erste Bereich von Fragen wird durch die Erfahrungen beim Training der holistischen Erkennerkomponente motiviert und betrifft die von holistischen Erkennern zu hypothetisierenden Deskriptoren. Die bisher eingesetzten, überwachten Lernverfahren erfordern beim Übergang zu größeren Objektmengen einen sehr großen Labelling-Aufwand. Dieser Umstand ist ein Problem aller den Autoren bekannten, überwacht ablaufender visueller Lernverfahren und begrenzt deren Einsatz auf relativ enge Anwendungsausschnitte. Ein wichtiges Ziel im neuen Förderzeitraum soll daher die Entwicklung effizienterer Lernverfahren bilden, die zum Training nur noch eine vergleichsweise kleine Anzahl von handgelabelten Trainingsbeispielen erfordern. Dazu sollen überwachte und unüberwachte Methoden verbunden und auf den Einsatzkontext einer (teilweise aktiven) Wissensakquisition in einem hybriden ComputervisionSystem spezialisiert werden. Es wird dabei nicht angestrebt, einen einzigen Satz von Deskriptoren oder Merkmalen zu ermitteln. Die äußerst positiven eigenen und in der Literatur berichteten Erfahrungen mit Merkmals- und Klassenkombinationen sollen hier weiter verfolgt werden. Es wird angestrebt, auch Lernverfahren für multiple Repräsentation zu realisieren. Sie können von dem postulierten Ansatz zur hybriden Verarbeitung entlang verschiedener Merkmalsströme und Klassensysteme profitieren. Dieses "Objekte aus X" genannte Verfahren wird so erweitert, daß auch partielle Modelle zur Analyse genutzt und so aus den Resultaten neue Modelle erschlossen werden.

Der zweite Bereich von Fragen widmet sich den relationalen Beziehungen zwischen holistischen Erkennungseinheiten untereinander und ihrer Abbildung auf Konzepte und Relationen des semantischen Netzes. Mit diesem verfeinerten Übergang von der jetzigen, holistischen Erkennungsebene zu der Ebene des semantischen Netzes werden bessere Möglichkeiten eröffnet, die subsymbolische und die symbolische Repräsentationsebene zu verknüpfen. Dazu soll eine neue Zwischenebene auf der Grundlage datengetrieben konstruierter Graphen eingerichtet werden, auf der bereits eine teilweise Integration der von der holistischen Erkennungsebene gewonnenen Ergebnisse erfolgen kann. Die Graphknoten werden dabei von der holistischen Erkennungsebene gewonnene, lokale oder semi-lokale Merkmale repräsentieren, während die Kanten Geometrie- oder auch abstraktere Relationen zwischen den Knotenmerkmalen darstellen. Auch auf dieser Ebene werden Lernverfahren, diesmal ausgerichtet auf eine Gewinnung prototypischer Graphstrukturen, entwickelt. Diese können auf neuere Verfahren zur Berechnung von Mean- und Mediangraphen zurückgreifen. Insgesamt erwarten wir, daß die gewonnenen Graphrepräsentationen zumindest teilweise strukturelle Gemeinsamkeiten mit den auf der oberen Ebene verwendeten semantischen Netzrepräsentationen aufweisen, deren Ausnutzung dann eine noch engere Kopplung zwischen semantischer und subsymbolischer Ebene ermöglichen sollte. So können die im semantischen Netzwerk realisierten Inferenzmechanismen auch modellgetriebene Vorhersagen für die graphbasierte Zwischenstufe liefern.

Die Erforschung der dargestellten Fragestellungen legt für den bisherigen Erkenner den Übergang zu einer dreistufigen Hybridarchitektur nahe, deren technische Grundlagen in der Anfangsphase des Vorhabens gelegt werden sollen. Alle weiteren Ergebnisse sollen darin als kontinuierliche Weiterentwicklungen einfließen und im Rahmen des SFB-Demonstrators an einer ständigen gründlichen Evaluierung teilnehmen. Zusätzlich wird die Leistungsfähigkeit der Lern-, Erkennungs- und Analysealgorithmen an mindestens einer weiteren Klasse von Objekten überprüft. Dazu bieten sich z.B. existierende öffentlich verfügbare Stichproben an, von denen die meisten bisher nur für die Evaluation "appearance"-basierter Wiedererkennungsverfahren genutzt wurden.


sfb-logo Zur Startseite Erstellt von: Anke Weinberger (1994-03-03).
Wartung durch: Anke Weinberger (2001-11-14).