Erschließung digitaler Textarchive über Metadaten und Lemmata (F-AG 2)
Projektinhalt
Das Kurationsprojekt wurde im Dezember 2013 bewilligt. Es wird von Prof. Dr. Roland Meyer von der Humboldt-Universität zu Berlin koordiniert.
Ziel des Projekts ist die Entwicklung eines Werkzeugs, das eine bessere Erschließung ausgewählter historischer Archive ermöglichen und den Weg zur Erschließung weiterer Archive ebenen soll. Das Suchwerkzeug soll eine Abfrage nach Lemmata ermöglichen und auf der Grundlage von Metadaten ein geeignetes Korpus zusammenstellen. Die dazu benötigten Sekundärdaten und Werkzeuge (Datenbanken, Lexika, morphologische Analysierer) sollen über Webservices bereitgestellt werden.
Das Projekt wird am Beispiel des Polnischen ausgeführt, ein mit seinen zahlreichen Flexionen und der starken orthographischen Variation eher schwieriges Fallbeispiel. Dadurch sollte allerdings auch die Übertragbarkeit des Werkzeugs auf andere Sprachen gut möglich sein.
Die Zusammenarbeit mit den CLARIN-D Zentren in Saarbrücken, Tübingen, Nijmegen und Leipzig ist von elementarer Bedeutung für die Realisierung des Kurationsprojekts.
Laufzeit
-
01.03.2013 – 31.03.2014
Antragsteller
-
Prof. Dr. Roland Meyer, Institut für Slawistik, Humboldt-Universität zu Berlin
roland.meyer@hu-berlin.de
Verantwortliche Institution
-
Institut für Slawistik, Humboldt-Universität zu Berlin