WebMAUS Basic: Automatisches phonetisches Labelling und Segmentieren einer einzelnen deutschen Aufnahme mit Text

Interviews und Gespräche werden häufig aufgenommen und anschließend verschriftlicht, also transkribiert. Bei längeren Aufnahmen ist es im nachhinein nicht leicht, die Stelle in der Aufnahme zu finden, an der ein bestimmtes Wort oder ein bestimmter Satz gesagt wurde, etwa um zu hören, mit welcher Betonung etwas gesagt wurde, ob jemand gezögert hat, im Hintergrund etwas laut war, etc. Der Webdienst WebMAUS Basic, der in der CLARIN-Infrastruktur zur Verfügung steht, erlaubt es, die Audioaufnahmen und Transkriptionen miteinander so zu verknüpfen, dass man die Zeit eines Phonemes, einer Silbe, eines Wortes oder Satzes bestimmen und mit gängiger Software wie praat direkt zu der entsprechenden Stelle springen kann.

Besonders interessant für

Alle diejenigen, die sich mit Sprachaufnahmen und Transkriptionen beschäftigen, darunter Forschende aus:

Linguistik
Phonetik
Sprachtechnologie
Antropologie
Ethnologie
Medien-Informatik
Konversationsanalyse
Psychologie
Sprachpathologie
Bildungsforschung
Politikwissenschaften

Ausgangslage:

Eine Aufnahme eines deutschen Satzes (*.wav) und ein orthografisches Transkript (*.txt)

Ziel:

Eine hierarchische Segmentierung in Worte, Silben und Phone in praat-kompatiblem Format (*.TextGrid); phonetische Segmente sollten in SAM-PA kodiert sein.

Lösung:

Web Interface BAS WebMAUS Basic.

Eine kurze Anleitung zu WebMAUS Basic

Vorbereitung:

Laden Sie das ZIP-Paket https://clarin.phonetik.uni-muenchen.de/BASWebServices/examples/examples-WebMAUS.zip herunter und dekomprimieren Sie es auf Ihrem lokalen Desktop; Sie sollten jetzt ein Verzeichnis 'examples-WebMAUS' auf dem Desktop haben.

Web Interface:

Gehen Sie zur Seite http://clarin.phonetik.uni-muenchen.de/BASWebServices
Wählen Sie den Service 'WebMAUS Basic'
Öffnen Sie in einem Datei-Manager das Verzeichnis 'examples-WebMAUS', markieren Sie die Dateien 'example2.wav' und 'example2.txt' und ziehen Sie diese mit der Maus auf den grau umrandeten Upload-Bereich auf der Service-Seite (drag&drop).
Klicken Sie auf den Button 'Upload' rechts neben dem Upload-Bereich. Sie können den Text nun sehen und das Sprachsignal anhören
Wählen Sie folgende Option:
- Language = German (DE)
Stimmen Sie den "terms-of-usage" zu and klicken Sie auf 'Run Web Service'
Nach der Fertigstellung wird die resultierende TextGrid Datei unten als Link angezeigt; klicken Sie auf den Link und es öffnet sich ein Popup-Fenster; klicken Sie auf das Symbol 'Segmentation Preview'; es öffnet sich ein um ein neues Fenster in Ihrem Browser und Sie können die Segmentierung unter Nutzung des EmuLabeller direkt betrachten. Vorschlag: Markieren Sie ein Segment mit der Maus und drücken Sie 'c' auf der Tastatur, um den Sound abzuspielen.