Universität Bielefeld - Technische Fakultät
Workshop 14 (Montag)
Modularisierung von Wortschätzen in der Spracherkennung
Organisation:
Thomas Wetter (IBM, Wissenschaftliches Zentrum Heidelberg), Martin
Schröder (pc-plus COMPUTING GmbH, München), Gunter Gebhardi
(Humboldt-Universität zu Berlin)
Workshopbeschreibung:
Von einem Spracherkennungssystem erwartet man die sichere Erkennung des gesamten der
jeweiligen Aufgabe angepaßten Wortschatzes. Der Stand der Technik erlaubt jedoch
nur die mehr oder minder sichere Erkennung eines eingeschränkten Wortschatzes.
Dies führt oft zu einer aus Benutzersicht unbefriedigenden Funktion, da
Wörter außerhalb des Wortschatzes wie Fehlerkennungen wirken.
Um dem entgegenzuwirken, können die Wortschätze entsprechend der Aufgabe
angepaßt und gegebenenfalls während der Erkennung weiter spezialisiert
werden. Diese Vorgehensweise wird als "Modularisierung des Wortschatzes" bezeichnet.
Die Aspekte der Modularisierung sind vielseitig:
- Informationsquellen für eine Modularisierung: Als Quellen für eine Modularisierung können linguistische Informationen (Syntax, Semantik, Text- oder Dialogstruktur, Pragmatik), Informationen aus der Systemumgebung (Domäne wie z.B. Radiologie oder Orthopädie, Szenario, sozialer Rahmen) oder auch erkennernahe Information (z.B. Sprechereigenschaften) dienen. Wie sind die Erfahrungen mit derartigen Anwendungskriterien?
- Art der Modularisierung: statisch versus dynamisch. Ein spezifischer Wortschatz kann vor dem Systemstart statisch definiert oder zur Systemlaufzeit dynamisch verändert werden. Unter welchen Bedingungen läßt sich statische oder dynamische Modularisierung nutzen?
- Modularisierung und Suchraumeinschränkung: Wie können Modularisierungen eines Wortschatzes realisiert werden? Durch reale Moduln? Durch gewichtete Attribute beim Zugriff auf e_i_n Modul? Wie sonst?
- Modularchitektur:
Empfehlen sich wenige große oder viele kleine spezielle Moduln? Läßt sich ein anwendungsunabhängiger Basiswortschatz identifizieren, ergänzt durch eine Reihe von Spezialmoduln? Wie groß soll er sein und nach welchen Methoden kann er erstellt werden? Was sind Kriterien für den "Grenzverlauf" zwischen Moduln? Ist es Semantik, Pragmatik, Statistik? Sind die entstehenden Spezialmodule disjunkt oder überlappend?
Kontaktadresse:
Gunter Gebhardi
Humboldt-Universität zu Berlin
Philosophische Fakultät II
Computerlinguistik
Unter den Linden 6
D - 10 099 Berlin
Tel:(+049)-(030)20192-553, Fax: ...-560
E-mail: gebhardi@compling.hu-berlin.de
Ipke Wachsmuth, 1995-01-31
Anke Bodzin, 1995-07-13