Kurationsprojekt zur Vorbereitung einer Toolchain für multimodale Daten in CLARIN-D (F-AG 6)

Projektinhalt

Die F-AG 6 “Sprache und andere Modalitäten” verfolgt das Ziel, den Aspekt der Multimodalität in CLARIN-D zu stärken und zu etablieren. Anschließend an das erste Kurationsprojekt der F-AG 6, in dem die Aufbereitung und Integration multimodaler Daten forciert wurde, soll im zweiten Schritt eine Toolchain für multimodale Daten vorbereitet werden, d.h. eine Verkettung von verschiedenen Werkzeugen um die zum Aufbau multimodaler Korpora nötigen Arbeitsschritte durchführen zu können.

Das Verfahren der verketteten Arbeitsschritte ist für linguistische Daten bereits etabliert und entsprechende Service-Architekturen wie WebLicht werden von den jeweiligen Fachcommunities genutzt und angenommen. Multimodale Daten unterscheiden sich jedoch in verschiedenen Aspekten stark von linguistischen und textuellen Daten (z.B. in Datenvolumen, Daten- und Repräsentationsformaten und Nutzungsbeschränkungen durch Persönlichkeitsrechte der Teilnehmer). Um den Aufbau multimodaler Korpora zu erleichtern, werden in diesem Kurationsprojekt die Konzepte einer Toolchain für multimodale Daten erarbeitet und exploriert. Dabei muss geklärt werden, inwieweit Konzepte bestehender Service-Architekturen auch für multimodale Daten übertragbar sind. Weitere Schritte sind die Katalogisierung bestehender Werkzeuge und Datenformate für multimodale Daten, sowie die Spezifikation und die Realisierung eines geeigneten Datenformats für Schnittstellen. Um eine möglichst große Abdeckung der in der Fachcommunity verwendeten Tools zu erreichen, wird eine enge Zusammenarbeit der verschiedenen Mitglieder und Zentren der F-AG angestrebt und auch die Erfahrung mit den drei Korpora und den damit verwendeten Tools aus dem ersten Kurationsprojekt fließen in die Entwicklung ein.

Inhaltlich verantwortlich ist die F-AG 6 „Sprache und andere Modalitäten“ und die Realisierung wird von wissenschaftlichen MitarbeiterInnen der Universität Bielefeld geleistet. Technische Beratung und Unterstützung erhält das Projekt vom CLARIND-Zentrum, dem Bayerischen Archiv für Sprachsignale (BAS), sowie durch zwei weitere CLARIN-D-Zentren, der Universität Tübingen und dem Max-Planck Institut für Psycholinguistik (MPI).

Laufzeit

  • 01.11.2013 - 30.04.2014

Antragsteller

  • F-AG 6 „Sprache und andere Modalitäten“ vertreten durch apl. Prof. Dr.-Ing. Stefan Kopp, Arbeitsgruppe „Sociable Agents“, CITEC, Technische Fakultät, Universität Bielefeld


Verantwortliche Institution

  • Arbeitsgruppe „Sociable Agents“, CITEC, Technische Fakultät, Universität Bielefeld

Ausführende Mitarbeiter

  • Farina Freigang (Universität Bielefeld)
  • Thomas Kronenberg (Universität Bielefeld)
  • Sören Klett (Universität Bielefeld)