WebMAUS-Pipeline: Chunk-Vorbereitung langer Video-Inverviews mit Gesprächspartner, Geräuschen, stillen Intervallen etc.

Interviews und Gespräche werden häufig transkribiert, um den Inhalt analysieren und durchsuchen zu können, z.B. nach Lauten, Wörtern, Phrasen, o.ä. Der Webdienst WebMAUS erstellt eine zeitliche Alinierung des Inhalts, und zwar auf mehreren Annotationsebenen und für mehrere Sprachen, so dass jedes Wort und jedes Phonem der Äußerung im Signal lokalisierbar ist.

Sehr lange Sprachaufnahmen (typisch in Interviews: mehrere Stunden) sind aus verschiedenen Gründen problematisch für die automatische Segmentierung. Daher bietet das BAS einen Webdienst an, der solche langen Aufnahmen automatisch aufsplittet, segmentiert und die Ergebnisse anschließend wieder zusammenführt, wie in diesem Use-Case demonstriert wird.

Besonders interessant für

alle, die mit langen Interviews arbeiten, z.B.:

  • Linguisten
  • Phonetiker
  • Historiker (Zeitzeugen)
  • Antropologen
  • Ethnologen
  • Psychologen

Ausgangslage:

Sehr langer Soundtrack (*.wav) und orthografisches Transkript als Textdatei (*.txt) mit Chunk Segmentation (*.TextGrid) an wichtigen Stellen. Die richtigen Zielsprecher müssen orthographisch transkribiert werden. 

Ziel:

Komplette Segmentierung in Worte, Silben und Phone

Lösung:

Web Interface "WebMAUS Pipeline"

Related CLARIN-D tools and services

  • WebMAUS-Basic: Automatische Phonetische Kennzeichnung und Segmentierung einzelner Deutscher Aufnahmen mit Text
  • WebMAUS-Multiple:

Kurzanleitung zur Nutzung des Web Interface zur Segmentierung sehr langer Sprachaufnahmen:

Vorbereitung:

  1. Gehen Sie zu http://clarin.phonetik.uni-muenchen.de/BASWebServices
  2. Klicken Sie auf "General Help + FAQs"
  3. Gehen Sie in den Abschnitt "Use Cases/Tutorials" und laden dort die ZIP-Datei "Chunker: recording that is to long to run ..." herunter. Entpacken Sie das ZIP z.B. auf Ihrem Desktop; es sollte ein Verzeichnis "audiobook" entstehen.

Web Interface "WebMAUS Pipeline":

  1. Klicken Sie auf 'BASWebServices' im Kopfzeilen-Menu und anschließend auf den Service "Pipeline"
  2. Öffnen Sie das Verzeichnis "audiobook" auf Ihrem Desktop, markieren Sie die Dateien "fraubovary.txt" und "fraubovary.wav" und ziehen Sie diese in den dafür vorgesehenen grau umrandeten Upload-Bereich des Services.
  3. Klicken Sie auf den Button "Upload'" rechts neben dem Upload-Bereich; nachdem das Hochladen abgeschlossen ist, können Sie die hochgeladene *.txt Datei inspizieren, indem Sie auf den Datei-Link klicken; sie enthält über 3400 Wörter.
  4. Wählen Sie folgende Optionen:
    • Pipeline name = G2P_CHUNKER_MAUS_PHO2SYL
    • Language = German (DE)
  5. Bestätigen Sie die Nutzungsbedingungen (terms-of-usage) und klicken Sie auf den Button 'Run Web Service'
  6. Die Bearbeitung dauert länger (einige Minuten), da es sich um eine sehr lange Audiobook Datei handelt. Nach der Fertigstellung erscheint unten ein Link auf die erstellte TextGrid Datei. Klicken Sie auf diesen Link; es öffnet sich ein Popup-Fenster; klicken Sie in diesem auf das Symbol "Segmentation Preview".

Es öffnet sich ein neues Fenster in Ihrem Browser, welches das Segmentations-Ergebnis mithilfe des emu-webapp Labellers anzeigt. Vorschlag: Klicken Sie so oft auf dem Button 'in' links unten, bis sie einzelne Wörter ausmachen können. Markieren Sie dann ein Segment (ein Wort oder einen Laut) durch Klicken mit Ihrer Maus (färbt sich gelb) und drücken Sie 'c' auf Ihrer Tastatur um das Segment abzuspielen.