Buchveröffentlichung des Deutschen Textarchivs
2019, zum Jubiläum, seines 250. Geburtstages, ist im Suhrkamp/Insel Verlag eine Nachschrift der ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. Mit diesem Manuskript der Henriette Kohlrausch, deren bislang unbekannte Verfasserschaft in diesem Band belegt und erstmals einer breiten Öffentlichkeit bekannt gemacht wurde, liegt somit die einzige bekannte Nachschrift der populären Vorträge in der Berliner Sing-Akademie in einer zuverlässigen, anhand der Handschrift geprüften Textfassung vor. Diese basiert auf der gemäß TEI-XML im DTA-Basisformat für Manuskripte (DTABf-M) annotierten Textgrundlage, die 2014/15 im »Hidden Kosmos«-Projekt erstellt und im Deutschen Textarchiv publiziert wurde.
Neue Ressourcen
Das Saarbrücker Kochbuch-Corpus (SaCoCo) kann jetzt unter einer freien Lizenz heruntergeladen werden.
Neue Services
Die BAS WebServices veröffentlichen eine erste Alpha-Version des neuen Services 'Speaker Diarization'. Speaker Diarization, d.h. die Klassifikation und Segmentierung von Sprachaufnahmen nach Sprecher-Identitäten, ist nach wie vor eines der schwierigsten Probleme der KI. Mit dem neuen Services des BAS können Anwender z.B. ihre Interview-Video-Aufzeichnungen automatisch in Interviewer und Interviewee trennen.
Im Transkriptionseditor Octra sind nun Spracherkennung und Segmentation direkt verfügbar. Sie öffnen eine .wav-Audiodatei in Octra, drücken die Taste M, warten ein wenig und dann erscheint eine Wortsegmentation des Wortlauts – korrigieren Sie diese manuell und exportieren Sie sie in eine Vielzahl von Formaten. Einfach magisch!
Neue Werkzeuge für das Deutsche Textarchiv über CLARINs Language Resource Switchboard (LRS) zugänglich. Im Rahmen des für 25 Monate angelegten Verbundprojekts CLARIAH-DE mit dem vornehmlichen Ziel, die beiden mit Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) aufgebauten geisteswissenschaftlichen Forschungsinfrastrukturen CLARIN-D und DARIAH-DE zu einer gemeinsamen digitalen Forschungsinfrastruktur zusammenzuführen, wurden an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) neue