"Sprachperzeption agierender Systeme"
Teilprojekt A4 im SFB 360
Projektleiter:
Dr.
Gernot A. Fink
Technische Fakultät
(0521) 106-29 31
gernot@TechFak.Uni-Bielefeld.DE
PD Dr.
Franz Kummert
Technische Fakultät
(0521) 106-29 29
franz@TechFak.Uni-Bielefeld.DE
Dr. Jianwei
Zhang
Technische Fakultät
(0521) 106-29 51
zhang@TechFak.Uni-Bielefeld.DE
Mitarbeiter im Teilprojekt A4:
Dipl.-Inform.
Sascha Wendt
Raum M5-119, Tel. 2937
swendt@TechFak.Uni-Bielefeld.DE
Zusammenfassung
Ziel des neu beantragten Teilprojekts A4 ist es, eine Sprachperzeptionskomponente für
Systeme zu entwickeln, die in ihrer Umwelt aufgrund sprachlicher Anweisungen agieren.
Die Form dieser Anweisungen sollte soweit wie möglich keinen systembedingten Restriktionen
unterliegen, sondern eine möglichst natürliche Bedienbarkeit unterstützen. Dies schließt
insbesonders extrem spontane und stark emotionale Äußerungen mit ein, mit denen vor allem in
kritischen Situationen, in denen das System kurz vor einem folgenschweren Fehler steht, zu
rechnen ist. Zudem müssen solche fehlervermeidenden Interventionen in Echtzeit äußerst sicher
erkannt und reflexartig ohne Interpretation anderer Module direkt an die Systemsteuerung
weitergeleitet werden. Das Ziel der sicheren und robusten Erkennung wird zum einen angestrebt,
indem große Variabilitäten in der Sprechgeschwindigkeit explizit modelliert und in den
Erkennungsprozeß integriert werden. Zum zweiten sollen Merkmale untersucht werden, die
sich am extrem robusten auditiven System des Menschen orientieren, da anzunehmen ist, daß
die dort berechneten Merkmale eine optimale Repräsentation des Sprachsignals für die weitere
Verarbeitung darstellen. Und zum dritten sollen beim Spracherkennungsprozeß externe Wissensquellen
wie der aktuelle Systemzustand, Fehlermeldungen des Systems oder die Gestik und Mimik des
Instrukteurs berücksichtigt werden.