WebMAUS Basic: Automatische phonetische Kennzeichnung & Segmentierung mehrfacher Aufnahmen des Ungarischen

Interviews und Gespräche werden häufig aufgenommen und anschließend verschriftlicht, also transkribiert. Der Webdienst WebMAUS Basic, der in der CLARIN-Infrastruktur zur Verfügung steht, erlaubt es, Audioaufnahmen und Transkriptionen miteinander so zu verknüpfen, dass man die Zeit eines Phonems, Wortes oder Satzes bestimmen kann und mit gängiger Software wie praat direkt zu der entsprechenden Stelle springen kann. Dieser Service erlaubt es, ganze Korpora im Stapelverfahren zu bearbeiten.

Besonders interessant für

  • Linguisten
  • Phonetiker
  • Sprachtechnologie-Entwickler
  • Anthropologen
  • Ethnologen
  • Medien-Informatiker

Ausgangslage:

50 Aufnahmen des Ungarischen (*.wav) und 50 orthographische Transkripte (*.txt)

Ziel:

50 hierarchische Segmentierungen (Wörter, Phonologie, Phoneme) in praat kompatiblem Format (*.TextGrid)

Lösung:

Web-Schnittstelle BAS WebMAUS Basic

Verwandte CLARIN-D Angebote

Eine kurze Anleitung zur Nutzung von BAS WebMAUS Basic

Vorbereitung:

  1. Herunterladen des ZIP Pakets ftp://ftp.phonetik.uni-muenchen.de/pub/BAS/CLARIN/USE_CASES/multipleFileSegmentation.zip 
  2. Entpacken Sie es auf Ihrem lokalen Desktop Ordner; es müsste ein Ordner mit dem Namen 'multipleFileSegmentation' auf Ihrem Desktop erscheinen.

Web Interface:

  1. Gehen Sie auf http://clarin.phonetik.uni-muenchen.de/BASWebServices
  2. Wählen Sie den Service 'WebMAUS Basic' aus
  3. Öffnen Sie den Ordner 'multipleFileSegmentation/Corpus' auf Ihrem Desktop; Wählen Sie die Dateien 50 *.wav und 50 *.txt; (drag&drop) Ziehen Sie die Dateien auf den gekennzeichneten Bereich. Das Transportieren der Dateien kann einige Sekunden dauern, bitte haben Sie etwas Geduld. Alle 100 Dateien sollten nach Abschluss des Uploads in dem gekennzeichneten Bereich sichtbar sein
  4. Drücken Sie die Taste 'Upload', um die hochgeladenen Textdateien zu untersuchen oder die hochgeladenen Sprachsignale anzuhören, indem Sie auf den Link im gekennzeichneten Bereich klicken
  5. Führen Sie WebMAUS mit den folgenden Optionen aus:
    • Language = Hungarian
  6. Bestätigen Sie die Nutzungsbedingungen und drücken Sie die Taste 'Run Web Service'
  7. Nach Abschluss werden die 50 Ergebnisse als *.TextGrid Dateien unten angezeigt; Klicken Sie auf "Download as ZIP-File", um alle Dateien auf Ihr lokales System herunterzuladen
  8. Klicken Sie auf eine der Ergebnis-Dateien und es öffnet sich ein Popup-Fenster; klicken Sie auf das Symbol 'Segmentation Preview'; es öffnet sich ein neues Fenster in Ihrem Browser und Sie können die Segmentierung mit Hilfe des EmuLabeller direkt betrachten. Vorschlag: Markieren Sie ein Segment mit der Maus und drücken Sie 'c' auf der Tastatur, um den Sound abzuspielen.