CLARIN-D für gesprochene Sprache und andere Modalitäten

CLARIN-D unterstützt die sprachwissenschaftliche Forschung durch die Bereitstellung von Services zum Auffinden von Sprachdaten, zur Analyse von geschriebenem und gesprochenem Text und zur langfristigen Verfügbarmachung und Bereitstellung von Korpora und Forschungsergebnissen. Zur Unterstützung der Forschung an gesprochener Sprache und anderen Modalitäten durch die digitale Forschungsinfrastruktur vernetzen sich Forschende in der F5 »Gesprochene Sprache und andere Modalitäten« des CLARIN-D Projekts. 

Daten für die Forschung

Über das Virtual Language Observatory (VLO) haben Sprachwissenschaftler_innen Zugriff auf eine Vielzahl von Ressourcen für ihre Forschung, zum Beispiel gesprochener Sprache in Deutsch.

Über eine spezielle Volltextsuche, die Federated Content Search (FCS) von CLARIN-D, sind viele in der CLARIN-Gemeinschaft verfügbaren Ressourcen im Volltext durchsuchbar, etwa um Beispiele für die Verwendung bestimmter Begriffe zu finden. Gefundene Belegstellen und die zugehörigen Dokumente können für weitere Analysen als Textkorpus heruntergeladen werden.

→ Mehr zum Thema "Auffinden" 

Softwarewerkzeuge für Forschungsprojekte

CLARIN-D stellt viele Programme und Webservices zur Analyse und Aufbereitung von Sprachdaten bereit. Darunter beispielsweise WebAnno zur manuellen und halb-automatischen Annotation von Texten oder WebLicht zur automatischen Annotation von Texten mit unterschiedlichen Werkzeugen, die ganz nach Bedarf und Vorliebe miteinander kombiniert werden können.

Werkzeuge zur Arbeit mit gesprochener Sprache:

→ Mehr zum Thema "Auswerten"

 

Eigene Forschungsdaten bereitstellen

Neben Tools zur Analyse von Sprachdaten erlaubt das CLARIN-Netzwerk, eigene Daten nachhaltig zu archivieren und der Fachgemeinschaft zur Weiternutzung verfügbar zu machen. In Kooperation mit einem CLARIN-Zentrum kann man seine Daten so aufbereiten, dass sie gut beschrieben sind. Ein Werkzeug zur Beschreibung von Daten ist etwa der CMDI-Maker zur einfachen Erzeugung von Beschreibungen, durch die Ihre eigenen Daten und Forschungsergebnisse der Fachcommunity leicht zugänglich machen können.

Haben Sie Interesse Ihre Daten in der CLARIN-D Infrastruktur unterzubringen? Setzen Sie sich mit dem zuständigen Zentrum in Verbindung oder wenden Sie sich an den CLARIN-D Helpdesk.

→ Mehr zum Thema "Aufbereiten und Aufbewahren"

AnsprechpartnerInnen aus der Fachgemeinschaft

Innerhalb von CLARIN-D sind die Arbeitsgebiete in Facharbeitsgruppen (F) organisiert. Forschende, die mit gesprochener Sprache und anderen Modalitäten arbeiten, vernetzen sich in der F5. Die Facharbeitsgruppe befasst sich mit den besonderen Herausforderungen der Erstellung von Korpora, die neben Sprache auch andere Modalitäten erfassen. Dies betrifft paraverbale und nonverbale Informationen wie z.B. Intonation, Lautstärke, Sprechtempo, Gestik, Gesichtsmimik oder Körperhaltung, wie sie in natürlicher Kommunikation gemeinsam mit Sprache auftreten. Multimodale Korpora müssen daher nicht nur einzelne Modalitäten mit ganz spezifischen Merkmalen erfassen, sondern auch intermodale Strukturen abbilden.

In dieser Arbeitsgruppe wirken WissenschaftlerInnen aus unterschiedlichen Fachrichtungen (Psychologie, Linguistik, Neurologie, Philologie etc.) zusammen, die sich schwerpunktmäßig mit multimodalen Sprachdaten beschäftigen. Ergänzt wird dieser Expertenkreis durch WissenschaftlerInnen aus der Informatik, die multimodale Benutzerschnittstellen entwickeln sowie an Annotationswerkzeugen und dem Datenmanagement für multimodale Daten arbeiten. Das Ziel ist die Identifikation fachübergreifender Anforderungen, die Entwicklung überführbarer und evaluierbarer Datenformate, die Stärkung der Bereitschaft zum aktiven Austausch von Daten und Tools sowie die Etablierung eines nachhaltigen Dialogs zwischen WissenschaftlerInnen der verschiedener Disziplinen.

Zugeordnetes CLARIN-D Zentrum

  • PD Dr. Florian Schiel (Bayrisches Archiv für Sprachsignale, Ludwig-Maximilians-­Universität München)
  • PD Dr. Christoph Draxler (Bayrisches Archiv für Sprachsignale, Ludwig-Maximilians-­Universität München)

Mitglieder

  • Uni Bielefeld: Katharina Rohlfing, David Schlangen, Stefan Kopp, Angelika Hoenemann, Andreas Windmann, Angela Grimminger, Stavros Skopeteas
  • Uni Erlangen: Elmar Noeth
  • Uni Frankfurt: Jost Gippert, Henning Reetz
  • Uni Hamburg: Daniel Jettka
  • Uni Kiel: Oliver Niebuhr
  • Uni Münster: Ulrike Gut, Robert Fuchs
  • Uni Paderborn: Peter Menke
  • Uni Saarbrücken: Jürgen Trouvain, Bernd Möbius, Zofia Malisz
  • Uni Stuttgart: Antje Schweitzer, Katrin Schweitzer (vertreten durch Kerstin Eckart)
  • Telekom Berlin: Felix Burkhardt
  • TU Berlin: Benjamin Weiss
  • ZAS Berlin: Susanne Fuchs
  • Uni Zürich: Volker Dellwo

Leitung und Kontakt

  • PD Dr. Christoph Draxler (Bayrisches Archiv für Sprachsignale, Ludwig-Maximilians-­Universität München)

Ressourcen von der Fachgemeinschaft für die Fachgemeinschaft

Im Rahmen der Implementierungsphase von CLARIN-D wurden von den Facharbeitsgruppen wichtige Ressourcen und Werkzeuge identifiziert, weiterentwickelt und für die Fachgemeinschaft verfügbar gemacht. Diese kleinen Projekte werden in CLARIN-D als Kurationsprojekte bezeichnet.

Kurationsprojekte