Webdienste und -interfaces für die Sprachwissenschaften
Thomas Kisler, Christoph Draxler
Das Bayerische Archiv für Sprachsignale (BAS) stellt in seinem CLARIN-D Repository aktuell 39 Korpora gesprochener Sprache zur Verfügung. Diese Korpora sind technisch validiert, orthographisch transkribiert und zum großen Teil auch phonemisch segmentiert, und können sowohl für Forschungszwecke als auch für die Entwicklung von sprachverarbeitender Technologie genutzt werden.
Das BAS bietet auch eine Reihe von Webdiensten für die Sprachwissenschaften an: G2P für die Graphem-Phonem-Konvertierung, Chunk Preparation zur automatischen Segmentierung von Fragmenten in Audiodateien, und vor allem die WebMAUS-Dienste für die automatische Segmentierung. G2P und WebMAUS verarbeiten Signaldaten und Transkriptionen in über 18 Sprachen und bieten eine Vielzahl an Ausgabeoptionen und -formaten. Zu allen Webdiensten gibt es umfangreiche online Dokumentation.