CLARIN-D Blog

CLARIN-D Newsflash Juli 2020

CLARIN-D Newsflash Juli 2020

Tour de CLARIN: CLARIN-D im Porträt von April-Mai 2020

Von April bis Mai 2020 war das deutsche CLARIN Konsortium Gastgeber der Tour de CLARIN. Die Tour de CLARIN ist ein etabliertes CLARIN Format, das die europäischen CLARIN Konsortien in den Blick nimmt und deren Schwerpunkte und Ergebnisse vorstellt. Die CLARIN Länder werden in Blogposts und nach den Themenblöcken „Introduction“ (Überblick), „Tool“, „Resource“, „Event“ und „Interview“ einheitlich porträtiert.

CLARIN-D wurde in den folgenden fünf englischsprachigen Blogposts präsentiert:

Wir bedanken uns ganz herzlich bei allen Beitragenden und Interviewten!

Neue Ressourcen

Das CLARIN-Zentrum an der Universität des Saarlandes hat eine neue Version des Royal Society Corpus veröffentlicht. Die neue Version enhält zusätzlich Texte aus 50 weiteren Jahren.

Das CLARIN-Zentrum an der Universität Tübingen hat GermaNet 15.0 veröffentlicht.

Seit diesem Sommer ist eine neue Version des Index Thomisticus Treebank (ITTB) in Tündra und über das Tübinger Archive of Language Resources verfügbar.

Das Deutsche Textarchiv (DTA) hat die Nutzungsbedingungen für DTA-Korpora gelockert, für wesentliche Teile des DTA entfällt jetzt die "Non-Commercial"-Einschränkung.

Neue Lexika und Wörterbücher in DTA und DTAQ: Im Rahmen der Kuration historischer Wörterbücher und Lexika zur Integration in die CLARIN-D-Infrastruktur wurden an der BBAW drei neue Lexika

Weiterlesen

CLARIN-D Newsflash April 2020

CLARIN-D Newsflash April 2020

Konferenzen

Bei der DHd 2020 in Paderborn gab es einen Informationsstand von CLARIAH-DE, bei dem das Projekt vorgestellt und präsentiert wurde.

Als eine der letzten größeren wissenschaftlichen Tagungen vor der Corona-Krise fand die Jahrestagung des IDS vom 10. bis 12. März in Mannheim statt.

Weiterlesen

CLARIN-D Newsflash Januar 2020

Buchveröffentlichung des Deutschen Textarchivs

2019, zum Jubiläum, seines 250. Geburtstages, ist im Suhrkamp/Insel Verlag eine Nachschrift der ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. Mit diesem Manuskript der Henriette Kohlrausch, deren bislang unbekannte Verfasserschaft in diesem Band belegt und erstmals einer breiten Öffentlichkeit bekannt gemacht wurde, liegt somit die einzige bekannte Nachschrift der populären Vorträge in der Berliner Sing-Akademie in einer zuverlässigen, anhand der Handschrift geprüften Textfassung vor. Diese basiert auf der gemäß TEI-XML im DTA-Basisformat für Manuskripte (DTABf-M) annotierten Textgrundlage, die 2014/15 im »Hidden Kosmos«-Projekt erstellt und im Deutschen Textarchiv publiziert wurde.

Neue Ressourcen

Das Saarbrücker Kochbuch-Corpus (SaCoCo) kann jetzt unter einer freien Lizenz heruntergeladen werden.

Neue Services

Weiterlesen

CLARIN-D Newsflash Oktober 2019

Neue Ressourcen

Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im DTA/CLARIN-D-Repositorium (BBAW, Berlin). Im Rahmen eines zweijährigen, von der DFG geförderten Kooperationsprojekts der Staats- und Universitätsbibliothek (SuUB) Bremen, der Universitätsbibliothek Johann Christian Senckenberg in Frankfurt/Main und der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) wurde eine umfassende digitale Sammlung zum Deutschen Kolonialismus erarbeitet. Das mehr als 1000 Titel mit ca. 240000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) besteht aus Publikationen, die in der Zeit des deutschen Kaiserreichs und von den genannten Bibliotheken unter dem Aspekt Kolonialismus gesammelt wurden.

Mit der Veröffentlichung des Korpus werden nun der Kolonialismusforschung, der Koloniallinguistik sowie weiteren historisch-textbasiert arbeitenden Disziplinen – und nicht zuletzt auch der breiteren Öffentlichkeit – eine in dieser Form einzigartige Sammlung an Publikationen in Bild und Text digital zur Verfügung gestellt. Die digitale Erfassung erfolgte automatisch mit Methoden der Optical Character Recognition (OCR). Die Texte wurden zunächst innerhalb der Qualitätssicherungsumgebung des Deutschen Textarchivs, DTAQ, publiziert, wo die Bände nach freier Anmeldung zugänglich und bereits vollumfänglich nutzbar sind (URL: http://www.deutschestextarchiv.de/dtaq/book?q=dsdk)

Neue Services

Das Bayerische Archiv für Sprachsignale hat eine neue Version seines Webservices API freigeben (2.31).

Weiterlesen

CLARIN-D Newsflash Juli 2019

Neue Ressourcen

GermaNet Logo

GermaNet Version 14.0 ist nun veröffentlicht. Neu bei dieser Version sind

  • Neue Synsets und ca. 10 000 neue lexikalische Einheiten für alle Wortklassen
  • Neue Relationen zwischen Synsets

Seit November 2017 wird der Briefwechsel Daniel Sanders' im Deutschen Textarchiv veröffentlicht. Derzeit stehen 182 Briefe im Volltext bereit. Insgesamt konnten 432 Briefe aus 41 Archiven nachgewiesen und verzeichnet werden. Mehr dazu im Blogpost zum Briefwechsel Daniel Sanders'.

Die Digitalisierung des zweiten Teils des Mannheimer Korpus Historischer Zeitungen und Zeitschriften (MKHZ2) wurde abgeschlossen. Dieses Digitalisierungsprojekt wurde in Kooperation der CLARIN-Zentren in Mannheim und Berlin durchgeführt. Die Ressourcen sind nun im Deutschen Textarchiv verfügbar. Weitere Informationen im Blogpost "Presseschau um die Jahrhundertwende".

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet (WebServices 2.30): 'AnnotConv' ist ein Service, welcher Annotationsdateien mit alignierter Zeitinformation in andere Formate konvertiert. Der zweite Service 'AudioEnhance' erlaubt die Anwendung von verschiedenen Signalverarbeitungen auf Sprachsignale des Benutzer, z.B. Filterung, Kanalselektierung und -zusammenfassung, Rauschreduktion, Tonhöhen- und Längenmanipulation. URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

Weiterlesen

CLARIN-D Newsflash Mai 2019

Mehr Informationen zu den Visualisierungen befinden sich hier: https://dhd2019.org/erkl%C3%A4rung-visualisierung/

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet: 'Subtitle' ist ein frei verfügbarer Service, welcher automatisch Untertitel-Tracks für Videos erzeugt - in einer Pipeline zusammen mit automatischer Spracherkennung sogar ohne Transkript. 'Anonymizer' ist ein Service welcher Sprachsignale und zugehörige Annotationen anhand einer Lis te von Stichwörtern automatisch anonymisiert, d.h. alle Vorkommnisse eines Stichworts werden im Signal durch ein Rauschen maskiert und in allen Annotationen gelöscht bzw. durch ein definiertes Tag ersetzt . URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

CLARIN-D und DARIAH-DE bei DHd 2019 in Mainz und Frankfurt

Auf der DHd gab es einen gemeinsamen Infostand von CLARIN-D und DARIAH-DE.

CLARIN-D hat zusammen mit dem DHd Verband und DARIAH insgesamt neun Stipendien für NachwuchswissenschaftlerInnen vergeben. Die Erfahrungsberichte wurden im CLARIN-D Blog veröffentlicht.

DHd-Workshop zu "Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten", organisiert von Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner am 25./26.03.2019 in Mainz mit dem Vortrag "Vergleich der Transkription mit und ohne Spracherkennung."

Workshops und Schulungen

Vorstellung von CLARIN-D Werkzeugen und Services und Beratung für Projekte/Antragstellungen in Gießen (Zentrum für Medien und Interaktivität (ZMI)), Berlin (ZfL Berlin: Leibniz-Zentrum für Literatur- und Kulturforschung Berlin) und Braunschweig (Georg-Eckert-Institut – Leibniz-Institut für internationale Schulbuchforschung) (FAG 8: Geschichtswissenschaften)

"BAS Tutorial Tools and Services" auf der Jahrestagung der Italienischen Gesellschaft der Stimmwissenschaften (AISV) am 14.02.2019 in Arezzo

CLARIN-D Newsflash Oktober 2018

Linguistic Annotation in XML (DTABf)
Linguistic Annotation in XML (DTABf)

 

 

Neue Standards

Doktorandentage

Workshops und Panels

Weiterlesen

CLARIN-D Newsflash Juli 2018

 

Titelseite der ersten Ausgabe der Philosophical Transactions
Titelseite der ersten Ausgabe der Philosophical Transactions

Neue Ressourcen in CLARIN-D

Neue Medien

Sommerschulen und Workshops

Veröffentlichungen

  • Im Sammelband "Computational Social Science—Die Analyse von Big Data" (herausgegeben von Prof. Dr. Andreas Blätte, Prof. Dr. Joachim Behnke, Prof. Dr. Kai-Uwe Schnapp, Prof. Dr. Claudius Wagemann) ist ein Methodenartikel erschienen, in dem die Analyse komplexer sozialwissenschaftlicher Konzepte mit korpusanalytischen Methoden reflektiert wird.
Weiterlesen