Das CLARIN-Zentrum an der Berlin-Brandenburgische Akademie der Wissenschaften ist bereits seit einigen Jahren ein aktiver Teil der Community rund um die European Summer University in Digital Humanities „Culture and Technology“ (ESU) in Leipzig. Auch in diesem Jahr waren wir mit einem Kurs zur Digitalisierung und Annotation historischer Drucke und Manuskripte wieder vor Ort und haben am regen interdisziplinären Wissensaustausch zwischen allen Beteiligten teilgenommen.
Unser Kurs fand in der ersten Woche der ESU 2017 statt. Er wurde von sechs Teilnehmerinnen und Teilnehmern verschiedener wissenschaftlicher Disziplinen (Literaturwissenschaften, Anglistik, Romanistik, Mediävistik, Geografie, Wissenschaftsgeschichte) besucht, die den Kurs durch ihre unterschiedlichen fachlichen Hintergründe und ihre Einbettung in verschiedene internationale Fach-Communities (Italien, Polen, USA, Deutschland) bereicherten.
Der erste Tag des Workshops diente der kurzen Einführung in die Linguistik, speziell der Grundlagen der linguistischen Arbeit mit Korpora, um eine gemeinsame Basis für die Arbeit mit historischen Texten und den möglichen Ebenen der Annotation zu legen. Anschließend erarbeiteten wir gemeinsam wichtige Grundlagen der Texttranskription, die dann bei der Digitalisierung eines historischen Textes gleich praktisch umgesetzt werden konnten.
Am nächsten Tag wurden viele Themen anhand der ersten Transkriptionen vertiefend behandelt, beispielsweise das Inter-Annotator-Agreement, die Korpuserstellung, der Umgang mit Metadaten oder die orthographische Normalisierung von Texten (mit dem Best-Practice-Beispiel des DTA-Basisformats). Danach präsentierten wir einen kurzen Überblick über aktuelle Techniken der automatischen Texterkennung. Im Anschluss an diese umfangreiche Sitzung konnten konnten wir gemeinsam mit den Studierenden bei den öffentlichen Projektpräsentationen interessante Forschungsprojekte innerhalb der Digital Humanities kennenlernen.
Der dritte Tag startete mit der traditionellen Teaser Session, einer kurzen Einführung in unseren Kurs für Studierende anderer Workshops, die zeitgleich von allen Workshops angeboten wird. Anschließend hatten unsere Studierenden die Gelegenheit, ihre eigenen Projekte und Qualifikationsarbeiten vorzustellen, um dann in einer Diskussionsrunde Probleme und Fragen – natürlich vor allem in Bezug auf die Digitalisierung der verwendeten Texte – in der Runde zu besprechen. Auch beim gemeinsamen communal dinner am Abend wurde noch lange eifrig weiterdiskutiert.
Der vorletzte Tag stand ganz im Zeichen der Annotation. Zum einen wurden anhand von WebLicht die Möglichkeiten der automatischen linguistischen Annotation in einer Hands-on-Session demonstriert und geübt, zum anderen wurden mithilfe von WebAnno manuelle Anotationsverfahren erarbeitet und angewendet. Am Nachmittag fand anschließend die zweite Staffel öffentlicher Projektpräsentationen der ersten ESU-Woche statt.
Der letzte Tag unseres Workshops war dem umfangreichen Thema Korpusanalyse gewidmet: Wir stellten verschiedene Abfragesprachen vor und erarbeiteten mit den Studierenden den Weg von der allgemein formulierten Forschungsfrage hin zu spezifischen und detaillierten Korpusabfragen. Den Abschluss des Workshops bildeten verschiedene Darstellungsmöglichkeiten für Analyse-Ergebnisse wie Tag Clouds und Wortverlaufskurven oder DiaCollo, einem Programm zur Darstellung der diachronen Entwicklung von Kollokationen über Jahrhunderte hinweg.
Die informations- und erlebnisreiche Woche endete für uns mit dem spannenden und sehr unterhaltsamen Workshop Results Slam, bei dem sich unsere Studierenden mit einer avantgardistischen Performance unter dem Titel „The Dada in Data“ souverän im Mittelfeld der Gesamtwertung platzieren konnten.
Anmerkung
Dieser Artikel erschien zuvor bereits im Blog Im Zentrum Sprache - Untersuchungen zur deutschen Sprache in Geschichte und Gegenwart , einem Blog des Zentrums Sprache der BBAW. Verwendet mit freundlicher Genehmigung.
Report absenden
My comments