Über das Sichtbarmachen des Suchens und die Faszination des Findens:
Ein Rückblick auf die DHd2020 anhand ausgewählter Konferenz-Momente
-- Ein Blogpost von Nina C. Rastinger (ÖAW) --
Fünf volle Tage DHd2020
Montag, 02.03.2020, 14 Uhr:
Die DHd-Jahrestagung startet mit einer Reihe an Workshops und für mich mit einer praktischen Einführung in das Annotations-, Analyse- und Visualisierungs-Tool CATMA 6, die von Mareike Schumacher und Jan Horstmann gegeben wird. Als Use-Case dienen Fälle von transponierter, erzählter und zitierter Rede in Kafkas Erzählung Erstes Leid – und diese zeigen, dass das Erstellen von Annotationstaxonomien und Setzen von Annotationen mit CATMA 6 zwar nun technisch einfach, ontologisch aber immer noch äußerst komplex ist.
Abbildung 1: Screenshot des Annotationsprozesses in CATMA 6
Dienstag, 03.03.2020, 12 Uhr:
Zwischen den Workshops trifft sich die AG Zeitungen & Zeitschriften zu ihrem ersten von zwei Treffen während der Tagung. Dabei hält Dario Kampkaspar fest, dass die Texterkennung historischer Zeitungen mit OCR oder HTR bereits relativ gut funktioniert, weshalb er die neuen Herausforderungen der Arbeitsgemeinschaft besonders im Bereich der Infrastruktur, der Bildqualität und der Layouterkennung sieht. Zudem stellt sich den Anwesenden die Frage, was denn nun eigentlich genau einen Zeitungsartikel ausmacht und wie dieser (automatisch) identifizierbar gemacht werden könnte.
Dienstag, 03.03.2020, 14 Uhr:
Auch im Rahmen des Tagungstagespunkts „Vom Phänomen zur Analyse – ein CRETA-Workshop zur reflektierten Operationalisierung in den DH“ geht es um für Forschende grundlegende Fragen – etwa: Wie können abstrakte und vage Konzepte, die mehr qualitativ als quantitativ gedacht werden, gemessen werden? Eine beispielhafte Antwort, die das CRETA-Team bereithält: Anstelle geisteswissenschaftliche Konzepte in ihrer Gesamtheit bemessen zu wollen, kann es von Vorteil sein, sie im Sinne einer approximativen Operationalisierung in einzelne messbare Aspekte zu zerteilen – eine Strategie, welche andere Teilnehmer*innen und ich direkt anhand eines bereitgestellten Datensets zum Phänomen der „Wertherness“ ausprobieren.
Mittwoch, 04.03.2020, 11 Uhr:
Mit „The Vectorian“ präsentieren Manuel Burghardt und Bernhard Liebl am Beispiel von Shakespeare-Referenzen eine Suchmaschine, die auf die Erforschung intertextueller Bezüge spezialisiert ist und die Ähnlichkeit von Text(stell)en über Word Embeddings und zusätzliches POS-Tagging zu erfassen versucht. Die bei der DHd2020 zum Dreh- und Angelpunkt gemachten „Spielräume“ finden sich dabei in den von den Nutzer*innen selbst setzbaren Parametern der Suchmaschine wieder: So kann beispielweise bestimmt werden, ob Determinierer miteinbezogen werden oder ob ein bestimmtes Word-Embedding-Modell verwendet wird – und die Suche nach intertextuellen Referenzen damit individuell gestaltet werden.
Mittwoch, 04.03.2020, 14 Uhr:
Marcus Willand, Benjamin Krautter, Janis Pagel und Nils Reiter beschäftigen sich mit der Identifikation von Hauptfiguren in Dramen und schlagen vor, zwischen aktiver und passiver Bühnenpräsenz zu unterscheiden – daher zwischen dem Anteil an Szenen, in dem eine Figur spricht, und dem Anteil an Szenen, in dem über eine Figur gesprochen wird. Auf diese Weise könnten auch jene Figuren als handlungsrelevant erkannt werden, die, wie Emilia Galotti, physisch nur relativ selten auf der Bühne anzutreffen sind.
Donnerstag, 05.03.2020, 15 Uhr:
Gemeinsam mit Claudia Resch versuche ich bei der Postersession eine Verbindung zwischen literaturwissenschaftlicher Motivforschung und Digital Humanities herzustellen, indem Typus-Motive korpusbasiert und mithilfe bereits vorhandener Applikationen – wie AntConc oder Voyant Tools – ausfindig gemacht werden sollen. Eine der größten Herausforderungen, die es dabei zu meistern gilt, wird auch von denjenigen thematisiert, mit denen wir erfreulicherweise in längere Gespräche kommen: Die Vagheit des zu Suchenden und seine vielfältigen sprachlichen Erscheinungsformen.
Abbildung 2: Nina C. Rastinger bei der Postersession der DHd2020
Freitag, 06.03.2020, 10 Uhr:
"What’s in the news?" – heißt es beim Panel zu digitalisierten Zeitungen und die Antwort muss wohl lauten: Alles Erdenkliche. So setzt sich etwa Sarah Oberbichler mit Rückkehrmigration, Estelle Bunout mit antimodernen Diskursen über Europa und Lino Wehrheim mit Stimmungen und Erwartungen an der Berliner Börse auseinander. Außerdem entwirft Torsten Roeder das Konzept eines „horizontalen Lesens“, bei welchem Named Entities als metaphorische Angeln dienen sollen, um nach für die Musikwissenschaft relevanten Zeitungstextstellen zu fischen.
Abbildung 3: Torsten Roeder spricht beim DHd2020-Panel "What’s in the news?"
Vom Suchen und Finden: Ein Resümee des Erlebten
In obiger Reihe an ausgewählten Momenten, welche sich unter dem Hashtag #DHd2020 auch vielfach auf Twitter wiederfinden lassen, spiegelt sich bereits die Vielfalt an Themen und disziplinären Hintergründen, welcher man bei der diesjährigen DHd-Tagung begegnen konnte. So wurden die Räume der Universität Paderborn unter anderem Schauplatz editorischer, linguistischer, philologischer und historischer Erkenntnisinteressen und man könnte – um erneut an Torsten Roeders Metaphernwelt anzuknüpfen – sagen, dass alle Beitragenden (und vermutlich auch alle Teilnehmenden) darauf fokussiert waren, eine ganz spezielle Art von Fisch an den Haken zu kriegen.
Und dennoch: Sieht man über diese thematische Artenvielfalt hinweg, taucht in den oben angeführten und anderen Konferenz-Momenten doch immer wieder ein ähnlicher Ansatzpunkt auf – und zwar die Frage danach, was man überhaupt sucht und wie man es finden könnte. Ob es sich dabei nun um intertextuelle Referenzen, literarische Motive, Named Entities, aussagekräftige Zeitungstextstellen oder diverse andere Objekte handelt, mag als „bloße“ Spezifikation in den Hintergrund gerückt werden. Denn viel interessanter erscheinen mir eigentlich die praktischen Implikationen, die ein Fragen nach dem zu Suchendem und dem Suchprozess mit sich bringen. Was sich nämlich in einer Vielzahl an Vorträgen, Workshops und Posterpräsentationen gezeigt hat, ist, dass methodologische Aspekte mindestens genauso viel, wenn nicht sogar mehr textuellen und sprachlichen Raum eingenommen haben wie die jeweiligen Ergebnisse der Beitragenden – eine Tatsache, die manchen vielleicht als ganz normal oder minimaler Nebeneffekt des Tagungsthemas der „Spielräume“ erscheinen mag, aber doch nicht als selbstverständlich erachtet werden darf. Schließlich berichtet etwa Hölter (2005: 134) davon, dass es in der nicht digital orientierten Literaturwissenschaft zu den „professionellen Verzerrungseffekten [gehört], dass die Suche bei der Ergebnispräsentation […] als das leichthändige Nachzeichnen von offen zutageliegenden Strukturen rhetorisiert wird.“ Anstatt neben den Ergebnissen auch die eigene Vorgehensweise zur Diskussion zu stellen und damit die Relativität ihrer „Richtigkeit“ anzuerkennen, wurde und wird in den Geisteswissenschaften oftmals auf das Vorhandensein von Expertenwissen vertraut und dem Suchprozess kurzerhand „unterstellt, dass [die Methodik] sinnvoll, systematisch und ökonomisch gewesen sein musste“ (Hölter 2005: 134). Daher: Die eigentlichen Suchprozesse und die an sie gekoppelten theoretischen Entscheidungen bleiben letztendlich im Dunkeln.
Umso erfreulicher ist es insofern aber nun eben, dass sich dieses Phänomen bei der DHd2020 nur selten beobachten ließ. Im Gegenteil: Mehrfach wurden Suchprozesse ins Rampenlicht gestellt und ihre jeweiligen Potenziale sowie Limitationen genau ausgeleuchtet. Da muss man sich fast fragen: Warum funktioniert hier bereits gut, was in den traditionellen Geisteswissenschaften oftmals noch eine große Herausforderung darstellt? Möglicherweise liegt es nämlich nicht nur an einem stärkeren Einhalten des Gebots guter – im Sinne von transparenter – wissenschaftlicher Praxis, sondern auch am Paradigma der Digital Humanities selbst. Schließlich werden hier komplexe Forschungstätigkeiten, wie beispielsweise Annotation oder Interpretation, deren genaue Regelung früher teilweise einzig in den Köpfen von Expert*innen festgeschrieben stand, über ihre Übersetzung in digitale Angebote nicht nur wesentlich kollektiver und kollaborativer gedacht, sondern auch deutlich manifester gemacht: An die Stelle von schwer greifbaren methodologischen Konzepten treten konkreter Code und anklickbare Applikationen. Demzufolge scheint das Sichtbarmachen von Suchprozessen durch die Digital Humanities bereits in deren Grundkonzeption verankert zu sein.
Vergessen darf man trotzdem nie die Natur der geisteswissenschaftlichen Erkenntnisobjekte und den Suchprozess selbst, denn wie der Begriff „Suchen“ bereits impliziert, liegen hier Vagheiten, Unbekanntes und sicherlich „Spielräume“ vor, ansonsten würden wir nicht suchen, sondern nur finden. Die Fisch-Metapher ist demnach ein wenig zu einfach: Mehr als um konkrete, greifbare Objekte handelt es sich bei dem zu Fangenden um konstant verschwommene Schemen im Wasser, bei denen nicht klar ist, welcher Teil ihrer Gestalt „wirklich“ vorhanden ist und welcher nur von unseren Vorstellungen an sie herangetragen wurde.
Diese Vagheit geisteswissenschaftlicher Konzepte spiegelt sich auch im Tagungsthema der DHd2020 wider und wurde folglich während der Tagung immer wieder aufgegriffen. Operationalisierung, reflektierte Textanalyse und Standardisierung von fachsprachlichem Vokabular sind dabei nur einige Schlüsselbegriffe. Ebenso wurde ein Appell an digital Forschende diskutiert, der unter anderem bereits von Underwood formuliert wurde:
„Researchers can never afford to treat algorithms as blackboxes that generate mysterious authority. If we’re going to use algorithms in our research, we have to crack them open and find out how they work.“ Underwood (2014: 69)
Dieser Meinung war etwa auch Tobias Hodel, der im Panel „Machine Learning“ dazu aufforderte, epistemologische Grundsätze von Algorithmen und Daten offenzulegen. Denn: Was und wie man sucht, verändert logischerweise was man findet. Diese Instabilität von Ergebnissen (und Visualisierungen) machten bei der DHd2020 besonders digitale Tools wie The Vectorian oder CATMA 6 deutlich, deren Such- bzw. Analyse-Parameter von den Nutzer*innen verändert werden konnten und sich direkt auf die Ergebnisse auswirkten.
Wissenschaftliches Arbeiten in digitalen Zeiten
Was heißt das aber nun, außer dass wissenschaftliches Arbeiten sowieso immer reflektiert geschehen sollte? Es bedeutet sicherlich auch, dass die Digital Humanities, als relativ junges wissenschaftliches Feld, immer auch im Zeichen eines Ausprobierens, eines Austestens, eines Experimentierens stehen. Denn wie bereits Novalis feststellte:
„Hypothesen sind Netze, nur der wird fangen, der auswirft.“ Novalis (1969 [1798]: 423)
Außerdem macht es, gerade wegen dieser Innovativität, der Instabilität und den diversen Spielräumen der DH-Forschung, Sinn sich nicht alleine, sondern kollektiv auf die Suche zu begeben – um eben nicht immer wieder bei null anfangen zu müssen, wie es auch bei der AG Zeitungen & Zeitschriften hieß. Schließlich mögen Erkenntnisinteressen noch so verschieden sein, die Methoden, sie zu verfolgen, können sich dennoch stark ähneln – dies als eines von vielen Dingen, die mir während der Teilnahme an der DHd2020 (wieder) bewusst wurden.
Genauso hat sich für mich in den fünf Tagen in Paderborn aber auch gezeigt, dass sich die Digital Humanities-Community im Hinblick auf das gemeinsame Sichtbarmachen von Suchprozessen bereits auf einem guten Weg befindet – man vergleiche allein das Angebot von methodologisch orientierten Workshops, die konstruktiven Diskussionen und das ausführliche Feedback bei der Postersession, die Open-Science-Bestrebungen und nicht zuletzt die bloße Existenz der Tagung selbst. Dafür, dass ich hieran Teil haben konnte, möchte ich mich an dieser Stelle herzlich beim DHd-Verband, CLARIAH-DE, der Universität Paderborn und den Organisator*innen sowie anderen Teilnehmenden der Konferenz bedanken – und auf eine anhaltende Faszination am Finden und ein Wiedersehen im nächsten Jahr hoffen!
Referenzen
Hölter, Achim (2005): „Volltextsuche“, in: Komparatistik. Jahrbuch der Deutschen Gesellschaft für Allgemeine und Vergleichende Literaturwissenschaft, 131–137.
Schulz, Gerhard (Hrsg.) (1969 [1798]): Novalis Werke. München: Beck.
Underwood, Ted (2014): „Theorizing Research Practices We Forgot to Theorize Twenty Years Ago.“ Representations 127, 64–72.
--------------------------
Über die Autorin
Nina Claudia Rastinger (ninaclaudia.rastinger@oeaw.ac.at) verfolgt derzeit das Masterstudium Deutsche Philologie an der Universität Wien und ist am Austrian Centre for Digital Humanities and Cultural Heritage der Österreichischen Akademie der Wissenschaften tätig.
Zitiervorschlag
Rastinger, Nina C. (2020): „Über das Sichtbarmachen des Suchens und die Faszination des Findens: Ein Rückblick auf die DHd2020 anhand ausgewählter Konferenz-Momente.“ In: CLARIN-D Blog, 30.4.20. URL: https://tinyurl.com/yaxsotx5.
Report
My comments