Universität Bielefeld - Sonderforschungsbereich 360
Datei: INFO.DOC
Datum: 25.05.97
Autor: Michaela Johanntokrax
Tech. Fakultät (Angewandte Informatik)
Universität Bielefeld
Postfach 100131
33501 Bielefeld
Tel.: 0521 106 5329
Fax: 0521 106 2992
Email: michaela@techfak.uni-bielefeld.de
© COPYRIGHT SFB 360 "Situierte Künstliche Kommunikatoren"
an der Universität Bielefeld
Diese CD-ROM beinhaltet die Dialoge 26 bis 50 (Sprachsignale und orthographische
Transkriptionen) von 50 Dialogen, die im Teilprojekt A3 des SFB 360 an der
Universität Bielefeld in einem Wizard-of-Oz-Szenario erstellt wurden.
Weiterhin sind Informationen zum Aufbau des Wizard-of-Oz-Szenarios, zur
Sprechercharakteristik, zur Transkriptionskonvention und die Daten der
Beurteilung des Szenarios durch die Versuchspersonen aufgeführt.
Die Sprachsignale haben folgendes Format: kein Header, 16000 Hz Abtastrate,
16 Bit Intel-Format, Mono.
Die Texte sind in zwei Formaten gespeichert, zum einen als Word6.0-Version (*.doc),
zum anderen entweder als Postskriptdatei (*.ps) oder als txt-Version; die
Umlaute in den txt-Dateien werden in TeX-Notation wiedergegeben.
Die Dialoge 01 - 25 befinden sich auf einer zweiten CD-ROM.
Die CD-ROM hat folgende Struktur:
INFO \ INFO.DOC
\ INFO.TXT
26-50 \ TEXT \ 26RZ.DOC
26RZ.TXT
...
50TP.DOC
50TP.TXT
\ TURN \ 26RZ \ *.SIG (Signaldatei)
\ *.TXT (Textdatei)
...
\ 50TP \ *.SIG
\ *.TXT
DOKS \ FR_BOGEN \ FB_MUSTER.DOC
FB_MUSTER.TXT
FR_BOGEN.DOC
FR_BOGEN.TXT
INFO.DOC
INFO.TXT
\ SPRECHER \ SPRECHER.DOC
SPRECHER.TXT
\ ORTH_TRA \ *.DOC
\ *.PS
\ WOZ_SYS \ *.DOC
\ *.PS
Das Verzeichnis 26-50
Unter TEXT sind die orthographischen Transkriptionen der Dialoge 26 - 50
(*.DOC, *.TXT) aufgeführt. Die Dateinamen setzen sich aus der Dialognummer
und dem jeweiligen Sprecherkürzel (z.B. 26RZ) zusammen.
Das Verzeichnis TURN hat pro CD-ROM 25 Unterverzeichnisse, deren Namen
Dialognummer und Sprecherkürzel (z.B. 26RZ) wiedergeben. Unter den
Unterverzeichnissen befinden sich die einzelnen Turns eines Dialogs.
In den Dateinamen sind zusätzlich die jeweiligen Turnnummern aufgeführt
(z.B. 26RZ001.*).
Die Text-Dateien (*.TXT) beinhalten die orthographischen Transkriptionen
der Turns, dazu kommen die korrespondierenden Signaldateien (*.SIG).
Es ist zu beachten, da"s nicht alle Sprecherbeiträge, die in den
Transkriptionen unter 26-50\TEXT aufgeführt sind, auch in 26-50\TURN
vorkommen; einige Sprecherbeiträge waren derart leise gesprochen, da"s
die betreffenden Sprachsignale nicht auf die CD-ROM aufgenommen wurden.
Das Verzeichnis DOKS
In dem Unterverzeichnis FR_BOGEN sind die Beurteilungen des
Wizard-of-Oz-Szenarios durch die Versuchspersonen aufgeführt.
Eine genaue Beschreibung dieser Daten findet sich in der Datei
INFO.TXT unter diesem Verzeichnis.
Unter ORTH_TRA wird die verwendete Konvention zur orthographischen
Transkription (ORTH_TRA.DOC, ORTH_TRA.PS) beschrieben.
Das Unterverzeichnis SPRECHER beinhaltet eine Datei (SPRECHER.TXT), in der
relevante Informationen über die Sprecher aufgeführt sind, so z.B. Alter,
Geschlecht, Dialekt, usw.
In WOZ_SYS findet sich eine detaillierte Beschreibung
(WOZ_SYS.DOC, WOZ_SYS.PS) des Wizard-of-Oz-Szenarios und der Aufnahmebedingungen.
Anke Weinberger, 1997-10-27