CLARIN-D für Forschende in der germanistischen Philologie

 

Was bietet CLARIN-D für GermanistInnen?

CLARIN-D unterstützt die germanistische Forschung durch die Bereitstellung von

  • digitalen Sprachdaten (gegenwartssprachlich und historisch);
  • Analysewerkzeugen für die wissenschaftliche Arbeit mit digitalen Sprachdaten;
  • Services zum Auffinden von deutschen Sprachdaten und Werkzeugen;
  • Dokumentationen von Nutzungsszenarien, mit denen gezeigt wird, wie digitale Daten und Werkzeuge für wissenschaftliche Fragestellungen kombiniert genutzt werden können;
  • und durch die Möglichkeit eigene Daten und Werkzeuge für die Forschungsgemeinschaft in einem CLARIN-D Zentrum nachhaltig bereitzustellen.

Zur Unterstützung der Germanistik durch die digitale Forschungsinfrastruktur vernetzen sich Forschende in der F1 „Deutsche Philologie“ des CLARIN-D Projekts.

Sprachdaten

Die CLARIN-D-Zentren bieten eine Vielfalt von aktuellen und historischen, mündlichen und schriftlichen Sprachdaten für die Forschung an. Wichtige Korpora sind z.B.:

IDS-Textkorpora

Das Institut für Deutsche Sprache (IDS) in Mannheim bietet ein Referenzkorpus aus Zeitungs-, Sach-, Fach- und literarischen Texten aus Deutschland, Österreich und der Schweiz von 1772 bis heute an. Es ist über COSMAS II kostenlos nutzbar.

DWDS-Korpus

Das Digitale Wörterbuch der Deutschen Sprache (DWDS) ist ein Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart, das neben Wörterbuchkomponenten auch Referenz- und Spezialkorpora sowie Werkzeuge zu deren Recherchen umfasst.

Deutsches Textarchiv (DTA)

Das Deutsche Textarchiv (DTA) stellt die Grundlage für ein Referenzkorpus zur Entwicklung der neuhochdeutschen Sprache bereit. Es umfasst eine disziplinen- und gattungsübergreifende Auswahl von mehr als 3000 Texten aus dem Zeitraum von ca. 1600 bis 1900.

Korpora zur gesprochenen Sprache des Bayerischen Archivs für Sprachsignale (BAS)

Das Bayerische Archiv für Sprachsignale (BAS) macht digitale Sprachressourcen des Deutschen sowie Werkzeuge zur Bearbeitung von digitalen Sprachsignalen in strukturierter Form verfügbar.

FOLK/DGD (gesprochene Sprache)

Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) beinhaltet Gesprächsdaten aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum. Es wird über die Datenbank für Gesprochenes Deutsch (DGD) zur Verfügung gestellt.

das Dortmunder-Chat-Korpus

Das Korpus dokumentiert anhand einer Sammlung von Logfiles die Sprachverwendung in unterschiedlichen Typen von Chat-Anwendungen. Es ist als Grundlage und Hilfsmittel für sprachwissenschaftliche Untersuchungen zur Computer Mediated Communication (CMC) konzipiert.

ein Blog-Korpus

Das Blog-Korpus ist Teils des DWDS-Angebots an der BBAW in Berlin. Es macht Blog-Postings und die darauf bezogenen Kommentare für die Forschung verfügbar und analysierbar.

Integration von Sprachdaten

Im Bereich der Germanistik wurden in drei Kurationsprojekten drei Typen von Daten in CLARIN-D-Zentren nachhaltig integriert.

  • eine große Zahl von historischen Texten;
  • ein Korpus gesprochener Wissenschaftssprache;
  • das Dortmunder Chat-Korpus als Muster für computervermittelte Kommunikation.

Im blauen Kasten finden Sie weitere Informationen zu diesen Kurationsprojekten.

Wir laden Sie ein…

Wenn Sie in Projekten oder Untersuchungen Texte oder andere Sprachdaten erfasst haben und sie für weitere Forschung zur Verfügung stellen wollen: Sprechen Sie uns gerne an! [Kontakt]

Nutzungsszenarien

Die Facharbeitsgruppe „Deutsche Philologie“ hat begonnen, verschiedene wissenschaftliche Nutzungsszenarien in unterschiedlichen Darstellungsformaten (Screencast, Anleitungstext, Video-Experteninterview) zu dokumentieren.

Beispiel 1

Einsatz von COSMAS II für Fragen und Analysen zum Wortgebrauch in Flüchtlingsdiskursen (Screencast)

Beispiel 2

Einsatz von WebLicht für Forschungsfragen zu syntaktischen Strukturen (Video-Experteninterview)

Abb:
	Video-Experteninterview: Syntaxforschung mit WebLicht.

Sie finden diese und andere Use-Cases auf unserem YouTube-Kanal oder unter Beispielanwendungen.

Digitale Werkzeuge und Webservices

Die CLARIN-D-Zentren bieten ein breites Angebot von digitalen Werkzeugen und Webservices, die auch für germanistische Fragestellungen genutzt werden können, z.B.:

COSMAS II

Das Corpus Search, Management und Analysis System (COSMAS II) ist die Analyseumgebung des IDS-Textkorpus. Es erlaubt z.B. lemmatisierte Wortsuchen, syntaktische Abfragen und komplexe Kookkurrenzanalysen.

DTA/DWDS-Korpora

Die DTA- und DWDS-Korpora sind mit leistungsstarken Korpusanalyse-Werkzeugen kombiniert, mit denen sich u.a. wortbasierte, syntaktische und kollokationsorientierte Forschungen unterstützen lassen.

DTA-Anfrage kombiniert mit GermaNet: Farbbezeichnungen in Techniktexten des 19. Jh.

EXMARaLDA

EXMARaLDA ist ein Transkriptions- und Annotationswerkzeug für gesprochene Sprache und Metadaten. EXMARaLDA ist XML-basiert und macht interoperable und nachhaltige Datennutzung möglich.

WebMAUS

WebMAUS ein webbasiertes Transkriptionswerkzeug für gesprochene Sprache. Es ermöglicht u.a. auch automatisches phonetisches Labelling und Segmentieren für Tonaufnahmen.

WebLicht

WebLicht ist eine webbasierte Umgebung, in der sich unterschiedliche computerlinguistische Werkzeuge zu sog. Prozessketten kombinieren lassen. Diese ermöglichen z.B. Lemmatisierung und automatische syntaktische Annotation von eigenen Texten.

Federated Content Search (FCS)

Über die Federated Content Search (FCS) kann man Ressourcen, die an unterschiedlichen Clarin-D-Zentren vorgehalten werden, über eine einheitliche Analyse-Oberfläche nutzen.

WebAnno

WebAnno ist ein flexibles webbasiertes Annotationswerkzeug für unterschiedliche linguistische Analysezwecke. Es erlaubt sowohl den Annotationsverlauf zu überwachen als auch die Daten in unterschiedlichen Formaten zu importieren und zu exportieren.

Die Facharbeitsgruppe „Deutsche Philologie“

Innerhalb von CLARIN-D sind die Arbeitsgebiete in Facharbeitsgruppen (F) organisiert. Forschende der germanistischen Philologie werden vor allem von der F1 „Deutsche Philologie“ vertreten.

Ziele und Aufgaben

Die Facharbeitsgruppe „Deutsche Philologie“ verfolgt folgende Ziele und Aufgaben:

  • Aufbau einer Wissensbasis zu bereits verfügbaren digitalen Ressourcen, Werkzeugen, Diensten und Nutzungsszenarien für die verschiedenen Teildisziplinen der Germanistik;
  • Ermittlung und Formulierung von fachspezifischen Anforderungen und Bedürfnissen an die CLARIN-Zentren aus der Perspektive der Germanistik und ihrer Teildisziplinen;
  • Planung und Durchführung von Kurations- und Integrationsprojekte, mit denen fachlich zentrale Ressourcen in die CLARIN-D-Infrastruktur eingebunden werden sollen.
  • Erstellung von Dokumentationen zur Anwendung von digitalen Daten und Werkzeugen für Forschungsfragen (Screencasts, digitale Experten-Interviews, Anleitungstexte).

Derzeit sind 26 renommierte und fachlich breit ausgewiesene Forschende aus dem Bereich der germanistischen Sprach-, Literatur- und Medienwissenschaften in der Facharbeitsgruppe „Deutsche Philologie“ organisiert. Ihre persönlichen Profile und Forschungsschwerpunkte sollen gewährleisten, dass unterschiedlichen Bedürfnissen in den germanistischen Teildisziplinen und den vielfältigen Erscheinungsformen der deutschen Sprache Rechnung getragen wird.

CLARIN-D Zentren

Die Facharbeitsgruppe „Deutsche Philologie“ wird betreut vom CLARIN-D-Zentrum Institut für Deutsche Sprache (IDS) in Mannheim . Im Hinblick auf sprachhistorisch-diachrone Ressourcen kooperiert die Facharbeitsgruppe auch eng mit dem Deutschen Textarchiv der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW).

Auch die anderen CLARIN-D-Zentren (Hamburg, Leipzig, München, Nijmgen, Saarbrücken, Stuttgart, Tübingen) stellen Daten und Werkzeuge für die germanistische Forschung bereit.

Diese Angebote sind über die folgenden Seiten erschlossen:

Mitglieder der Facharbeitsgruppe „Deutsche Philologie“

  • Dr. Norman Ächtler, Universität Gießen
  • Prof. Dr. Michael Beißwenger, Universität Duisburg-Essen
  • Prof. Dr. Noah Bubenhofer, ZHAW Winterthur
  • Prof. Dr. Angelika Braun, Universität Trier
  • Prof. Dr. Hans-Jürgen Bucher, Universität Trier
  • Prof. Dr. Arnulf Deppermann, IDS Mannheim/Universität Mannheim
  • Prof. em. Dr. Gerd Fritz, Justus-Liebig-Universität Gießen
  • Dr. Alexander Geyken, Berlin-Brandenburgische Akademie der Wissenschaften
  • Prof. Dr. Elvira Glaser, Universität Zürich
  • Dr. Eva Gredel, Universität Mannheim
  • Prof. Dr. Mechthild Habermann, Friedrich-Alexander-Universität Erlangen-Nürnberg
  • Prof. Dr. Martin Huber, Universität Bayreuth
  • Eva-Maria Jakobs, RWTH Aachen, bis 2017
  • Prof. Dr. Fotis Jannidis, Universität Würzburg, auch als DARIAH-DE-Vertreter
  • Prof. Dr. Jörg Kilian, Universität Kiel (beratend)
  • Prof. Dr. Alfred Lameli, Universität Freiburg
  • Prof. Dr. Alexander Lasch, TU Dresden
  • Prof. Dr. Henning Lobin, Direktor des IDS Mannheim und Universität Mannheim
  • Prof. Dr. Konstanze Marx, IDS Mannheim und Universität Mannheim
  • Dr. Simon Meier-Vieracker, Technische Universität Berlin
  • Dr. Klaus Nippert, Karlsruher Institut für Technologie
  • Prof. Dr. Dietmar Rösler, Justus-Liebig-Universität Gießen
  • Prof. Dr. Paul Rössler, Universität Regensburg
  • Prof. Dr. Ingrid Schröder, Universität Hamburg
  • Dr. Thomas Stäcker, Herzog August Bibliothek (Wolfenbüttel)
  • Prof. Dr. Angelika Storrer, Universität Mannheim
  • Prof. Dr. Uwe Wirth, Justus-Liebig-Universität Gießen
  • Prof. Dr. Andreas Witt, Universität zu Köln und Universität Mannheim

Koordination und Kontakt

Die Facharbeitsgruppe „Deutsche Philologie“ wird koordiniert an der Justus-Liebig-Universität Gießen (Prof. Dr. Thomas Gloning und Melanie Grumt Suárez).

Mitarbeiterinnen bis 2016

  • Jurgita Baranauskaite
  • Stefanie Seim