"Dynamische Perzeption"
Teilprojekt A2 im SFB 360

Projektleiter:
Dr. Stefan Posch
Technische Fakultät
(0521) 106-29 33
posch@TechFak.Uni-Bielefeld.DE

Dr. Helge Ritter
Technische Fakultät
(0521) 106-60 62
helge@TechFak.Uni-Bielefeld.DE

Mitarbeiter im Teilprojekt A2:
Dipl.-Inform. Birgit Möller
Raum M6-119, Tel. 2937
bimoelle@TechFak.Uni-Bielefeld.DE

N.N.

Zusammenfassung
Die zurückliegenden Arbeiten zur perzeptiven Gruppierung waren primär auf statische Bildszenen ausgerichtet. Im neuen Förderzeitraum sollen nunmehr stärker Aspekte dynamischen Sehens untersucht werden. Die bisher entwickelten Verfahren perzeptiver Gruppierung werden dazu in Hinblick auf eine Verarbeitung bewegter Szenen erweitert. Gleichzeitig wird der Schwerpunkt der geplanten Arbeiten auf eine Entwicklung und Erforschung wichtiger Elemente dynamisch explorierenden Sehens verlagert. Als forschungsleitendes Anwendungsfeld dient die Situation interaktiver Mensch-Maschine Kommunikation, wie sie im SFB Instruktor-Szenario exemplarisch gegeben ist.

Als ein erster Schritt werden die bisherigen Ansätze zur Verknüpfung von Kontur- und Regioneninformation in das MRF-Modell integriert und um Verfahren erweitert, gewonnene Gruppierungen innerhalb von Bildfolgen einander zuzuordnen. Die so gewonnene Fähigkeit zur Verfolgung von markanten Objektkonturen soll einer Erweiterung der in B1 entwickelten 3D Objektrekonstruktion auf bewegte Objekte zugute kommen.

Neben Objektbewegung bilden Eigenbewegungen aktiv steuerbarer Kameras eine zweite wichtige Quelle von Bewegungen. Als grundlegendes Verfahren zur Gewinnung einer kohärenten Szenenrepräsentation aus Bildsequenzen aktiv gesteuerter Kameras soll der Ansatz der Mosaikbilder untersucht und in Hinblick auf effizient handhabbare Datenstrukturen und eine Detektion von Objektbewegung ausgebaut werden. Damit soll die Funktion eines "visuellen Kurzzeitgedächtnisses" nachgebildet und Teilprojekt D3 zur Verfügung gestellt werden. Als weiterer Arbeitspunkt ist eine Verbesserung bisheriger Kamerakalibrierungsverfahren vorgesehen.

Zur Steuerung der Kameras wollen wir eine im abgelaufenen Förderzeitraum entwickelte Architektur kompetitiver Merkmalskarten in Verbindung mit schnellen, disparitätsbasierten Trackingverfahren einsetzen. Dabei soll eine Erweiterung um neue Merkmalskarten zur Einkopplung von Information übergeordneter Module erfolgen. Im Vordergrund stehen dabei eine Kopplung mit dem skizzierten visuellen Kurzzeitgedächtnis, mit Ausgaben sprachverarbeitender Module ("Priming" visueller Merkmale durch sprachliche Anweisungen) und mit "motorischen Karten" zur visuellen Fokussierung auf Aktivitäten des Roboters.

Das Zusammenspiel der damit realisierten Grundfähigkeiten dynamischen Sehens soll die Basis bilden, um einfache, von einem Menschen ausgeführte Handlungsabläufe visuell zu erkennen und auf diese zu reagieren. Bereits geleistete Vorarbeiten zur Verfolgung von Handbewegungen und Auswertung von Zeigegesten und Handposturen sollen dahingehend erweitert werden, daß eine (Griff-)Lageerkennung eines in einer Hand gehaltenen Objekts möglich wird. Dabei soll aus dem Bild hinreichend detaillierte Information über Objektgriffpunkte und Lageänderungen des manipulierten Objekts gewonnen werden, um den Roboter eine qualitative Nachahmung der beobachteten Grifffolge zu ermöglichen (die Generierung dazu geeigneter Fingerbewegungen unter Nutzung der in A2 gewonnenen Bildinformation wird den Gegenstand eines in D4 beantragten Projektteils bilden). Die zuvor entwickelte Explorationsfähigkeit und das visuelle Kurzzeitgedächtnis haben dabei die Aufgabe, in der Szene nach Anzeichen für den Beginn einer Instruktion zu suchen, auf relevante Bildausschnitte zu fokussieren, eine globale Repräsentation der Szene aufrecht zu erhalten und damit auf mögliche Fokuswechsel, etwa durch Eintreffen sprachlicher Anweisungen, jederzeit vorbereitet zu sein.


sfb-logo Zur Startseite Erstellt von: Anke Weinberger (1994-03-03).
Wartung durch: Anke Weinberger (2002-10-10).