Kurationsprojekt zur Linguistische Annotation von Nichtstandardvarietäten — Guidelines und „Best Practices" (F-AG 7)
Projektinhalt
Das Kurationsprojekt zur Evaluation von Annotationsschemata für Nichtstandardvarietäten wurde im Juni 2012 genehmigt.
Aktuelle Schemata und Guidelines für linguistische Annotationen sind vorwiegend für die Beschreibung von Zeitungssprache entwickelt worden, und automatische Annotationstools werden nach wie vor weitgehend auf Zeitungssprache evaluiert. Im Kurationsprojekt geht es um die Erstellung annotierter Daten aus neuen Domänen, sogenannter "Nichtstandardvarietäten". Solche Daten enthalten eine Reihe sprachlicher Strukturen und Phänomene, die von gängigen Guidelines nicht abgedeckt werden.
Das genehmigte Kurationsprojekt wird in einer Pilotstudie gängige Annotationsschemata für drei Annotationsebenen (Dependenzanalyse, Named Entity Recognition, Koreferenz) evaluieren und gegebenenfalls erweitern. Dazu wird ein Testkorpus nichtstandardsprachlicher Varietäten erstellt und annotiert. Ziel sind Guidelines und „Best practices" für die Annotation solcher Varietäten.
Laufzeit
- 01.09.2012 – 30.09.2013
Antragsteller
- Prof. Dr. Anke Lüdeling, Institut für deutsche Sprache und Linguistik, Humboldt-Universität zu Berlin
- JunProf. Dr. Stefanie Dipper, Sprachwissenschaftliches Institut, Ruhr-Universität Bochum
Verantwortliche Institution
- Institut für deutsche Sprache und Linguistik, Humboldt-Universität zu Berlin
- Sprachwissenschaftliches Institut, Ruhr-Universität Bochum