DHd Erfahrungsbericht: Benjamin Krautter (Universität Stuttgart)

Überlegungen zur DHd 2019 in Mainz und Frankfurt 

Zahlenspielerei?

Es hat inzwischen eine gewisse Tradition, dass die Beiträge für DH-Konferenzen selbst quantitativ untersucht werden. Einer der Vorreiter dieser besonderen Form der frühen fachgeschichtlichen Aufarbeitung der Digital Humanities ist mit Sicherheit Scott B. Weingart, der von 2013 bis 2017 die Metadaten der Einreichungen für die internationalen ADHO-Konferenzen in Nebraska, Lausanne, Sydney, Krakau und Montréal ausgewertet hat.[1] Weingarts Vorgehen fand einige Nachahmer, so dass inzwischen eine ganze Reihe an Blogbeiträgen vorliegen, die die Metadaten anderer DH-Konferenzen aufbereiten. Für die diesjährige DH-Konferenz im deutschsprachigen Raum (DHd), die vom 25. bis zum 29. März in Mainz/Frankfurt stattfand, erschienen in kürzester Zeit gleich zwei solcher Blogbeiträge.[2] Fasst man die Einzelstudien zu den verschiedenen Konferenzen zusammen, ließe sich möglicherweise ein vorsichtiger Entwicklungsbogen spannen, der die strukturellen und thematischen Veränderungen im weiten und schnelllebigen Feld der Digital Humanities näher beschreiben könnte – zumindest schlaglichtartig innerhalb des zugegebenermaßen noch recht kleinen Datensets der letzten Jahre.

Ein Blick auf die Zahl der angenommenen Beiträge der ADHO-Konferenzen zwischen 2000 und 2016 lässt international ein recht rapide wachsendes Interesse an den verschiedenen Formen digitaler Geisteswissenschaften erkennen: Bis 2016 verdreifachte sich die Zahl der Präsentationen auf mehr als 400.[3] Große Wachstumsraten sind vor allem ab 2012 zu erkennen – wobei die Konferenz in Sydney 2015 eine Ausnahme darstellt. Sie war die erste außerhalb von Europa oder Nordamerika. Für die jährliche Konferenz im deutschsprachigen Raum, die erstmals 2014 in Passau stattfand, lässt sich ein ähnliches Bild zeichnen, auch wenn die Wachstumsraten kleiner ausfallen und die Zahlen ab 2016 stagnieren, bzw. sogar leicht rückläufig sind (Abbildung 1). Das dürfte auch damit zu erklären sein, dass die Erstauflage in den Zeitraum des großen internationalen DH-„Booms“ fiel, wodurch sich das Programm des deutschsprachigen Pendants schon im ersten Jahr mit insgesamt 104 Vorträgen, Postern, Workshops und Panels dicht besetzt präsentierte. Die Zahl der Beiträge in Passau lag damit auf einem Niveau, das vergleichbar war mit den Zahlen der ADHO Konferenzen zwischen den Jahren 2000 bis 2008. Im Gegensatz dazu zeigt sich die DHd 2017 in Bern als relativ klarer Ausreißer: Mit weniger als 100 Beiträgen fällt sie deutlich aus dem Raster. Die Multilingualität der Schweiz könnte ein Grund für die geringere Beitragszahl sein, da Deutsch im Call for Papers explizit als primäre Sprache der Konferenz benannt wurde. Vergleichsdaten für die Konferenzen in Köln sowie Mainz/Frankfurt zeigen auch, dass Institutionen aus dem Veranstaltungsort und in dessen direktem geographischen Umfeld mit besonders vielen Einreichungen aufwarten. Mit dem DH-Institut an der École polytechnique fédérale de Lausanne (EPFL) und inzwischen zwei DH-Professuren an der Universität Lausanne ist laut Michael Piotrowski jedoch ein Großteil der DH-Aktivitäten in der Schweiz auf den französischsprachigen Teil des Landes konzentriert.[4] Auch Zahlen zu Alters- und Qualifikationskohorten könnten an dieser Stelle weiterführende Einsichten anleiten. Die Vermutung, dass Nachwuchswissenschaftler die Reise nach Bern aufgrund der damit verbundenen Kosten nicht auf sich genommen haben, ist zumindest nicht abwegig.

Mit Blick auf die beiden letzten Konferenzen in Köln[5] sowie Mainz/Frankfurt scheint entweder die Evaluation im Begutachtungsprozess strenger geworden zu sein oder die Qualität der eingereichten Beiträge abgenommen zu haben – falls nicht äußere Gründe wie die Gebäudekapazität die Beitragszahl limitierten. Denn während in Köln noch insgesamt 158 Workshops, Panels, Vorträge und Poster präsentiert wurden, waren es in diesem Jahr nurmehr 135 – und das obwohl die Zahl der Einreichungen (187 zu 189) sogar leicht zugenommen hat. Die Akzeptanzquote ist entsprechend von rund 84 auf 71 Prozent gesunken, liegt damit aber noch immer leicht über den Quoten der ADHO-Konferenzen.[6]

 

Abbildung 1: Beitragszahlen der vergangenen sechs DHd-Konferenzen. Die Zahlen sind den Konferenzprogrammen und den Abstractbänden entnommen.

 

 

Thematische Verschlagwortung

Um etwa eine sinnvolle Zuweisung von GutachterInnen zu ermöglichen, sind einreichende WissenschaftlerInnen aufgefordert, ihre eigenen Beiträge anhand einer vorgegebenen Liste an thematischen Schlagwörtern (Topics) zu kategorisieren, wobei einem Beitrag mehrere dieser vorgegebenen Themen zugeordnet werden dürfen. Interessanter noch als die Entwicklung der Beitragszahlen könnten also die Verschiebungen in der thematischen Verschlagwortung der Beiträge sein, da sich hiervon ausgehend Rückschlüsse auf die innerhalb der DH-Community prävalenten Forschungsobjekte und Methoden ziehen lassen. Die Digitial Humanities ließen sich dann als Querschnitt der jeweils eingereichten und vor allem angenommenen Themen auffassen.[7]

Für die internationalen DH-Tagungen zeichnet die thematische Verschlagwortung der Beiträge ein relativ beständiges Bild. Von den etwa einhundert Themenbereichen sind „Text Analysis“, „Data/Text Mining“, „Archives, Repositories, Sustainability and Preservation“, „Literary Studies“, „Visualisation“ und mit einiger Varianz „Historical Studies“, „Corpora and Corpus Activities“ und „Interdisciplinary Collaboration“ zwischen den Jahren 2013 und 2016 durchweg unter den häufigsten Zuschreibungen zu finden. Jedes dieser Labels ist etwa 15 bis 20 Prozent der Beiträge zugeordnet, wobei jeder Beitrag im Schnitt auf sechs verschiedene Zuschreibungen kommt.[8] Der wissenschaftliche Fokus scheint also – und das sollte keine große Überraschung sein – mehrheitlich auf der Textanalyse, -auswertung, -aufbereitung und -archivierung zu liegen, wobei literaturwissenschaftliche und historische Interessen überwiegen. Diese thematische Auswertung sollte jedoch auch kritisch reflektiert werden. Denn gerade innerhalb der stark frequentierten Themen dürfte die Möglichkeit der Vergabe mehrerer Labels zu Überschneidungen führen: „Corpora and Corpus Activities“, „Text Analysis“ und „Visualisation“ könnten beispielsweise recht plausibel demselben Beitrag zugeordnet sein. Die quantitativen Verschiebungen innerhalb der häufig gebrauchten thematischen Schlagwörter könnten gerade deshalb aufschlussreich sein. Für eine systematische Untersuchung sind Weingarts Daten der Jahre 2013 bis 2016 allerdings nicht umfangreich genug. Auffällig ist dennoch, dass „Text Analysis“ (von 15 auf knapp 25 Prozent) und „Historical Studies“ (von etwa 11 auf 22 Prozent) bis 2016 stark an Repräsentation zugewinnen, während der Wert für „Literary Studies“ (ca. 18 Prozent) sehr stabil bleibt. Einzelne Subkategorien der Literaturwissenschaft wie „English Studies“ oder „Asian Studies“ werden seltener als Schlagwort verwendet, andere Nachbardisziplinen wie „French Studies“ oder „German Studies“ dagegen häufiger. Hierin zeigt sich auch ein Problem der Verschlagwortung: Die Kategorisierung erfolgt frei von Hierarchien. Disziplinen, Themen und Methoden stehen gleichwertig nebeneinander.

Vielleicht haben die Organisatoren der ADHO-Konferenz auch deshalb die Zuschreibung von Themen und Disziplinen für 2017 separiert.[9] 34 Disziplinen standen zusätzlich zu den dadurch etwas ausgedünnten Themen zur Wahl. Sieben dieser Disziplinen sind in über 10 Prozent der Einreichungen genannt. Verglichen mit den Daten aus den Vorjahren steht „Computer Science“ (ca. 33 Prozent) etwas überraschend an der Spitze der Liste. Es folgen die üblichen Verdächtigen: „Literary Studies“, „Cultural Studies“ „Historical Studies“, aber auch „Library and Information Science“. Doch auch die „Film and Media Studies“ und „Creative and Performing Arts“ waren 2017 deutlich stärker wahrzunehmen als in den Jahren zuvor. Diese Zunahme nicht-textgebundener Forschungsarbeiten deckt sich auch mit meinem subjektiven Eindruck der beiden letzten DHd-Konferenzen – 2018 wartete die Tagung in Köln sogar mit einem eigenen Panel zur digitalen Filmanalyse auf. Die verglichen mit vielen traditionellen Disziplinen gefühlt große Diversität und Inklusivität der DH mag also (noch) nicht in Form einer Gleichverteilung von thematischen und disziplinären Schlagwortlisten zu finden sein, bildet sich aber dennoch in deren Umfang und Breite ab.

Für den deutschsprachigen Raum beschränken sich die aufbereiteten Daten auf die letzten beiden Konferenzen, so dass die Topics lediglich eine Momentaufnahme der thematischen Ausrichtung aufzeigen können (Tabelle 1). Größter ‚Verlierer‘ der DHd 2019 ist das Schlagwort „Inhaltsanalyse“, das aus der Liste der zehn häufigsten Begriffe herausfällt und damit sehr viel seltener von den AutorInnen mit ihren Einreichungen in Verbindung gebracht wird. Auch „Modellierung“, das nur noch auf 35 statt 60 Zuschreibungen kommt, verzeichnet einen starken Rückgang. Dennoch ist „Modellierung“ weiterhin Teil der fünf häufigsten Topics, die insgesamt gesehen recht stabil bleiben. Denn „Annotieren“, „Text“ und „Visualisierung“ zählten ebenso wie „Modellierung“ bereits 2018 zur Top 5. Neu in die Liste hinzugekommen ist der Begriff „Daten“, der einerseits im Bereich des Forschungsdatenmanagements anzutreffen ist, andererseits bei der Erstellung von Trainingsdaten und großen Korpora – etwa für das datenhungrige deep learning – eine wichtige Rolle spielt. Für die Listen beider Jahre ist auffällig, dass die häufigsten Schlagwörter allesamt sehr allgemein bleiben. Sie beschreiben keine konkreten Methoden oder Theorien, sondern vielmehr Forschungsobjekte („Text“, „Daten“, „Metadaten“) oder generelle Praktiken („Annotieren“, „Visualisieren“, „Modellieren“, „Programmieren“). Für künftige Untersuchungen dürfte auch das Verhältnis von Topics und Tagungssektionen aufschlussreich sein. Wie verändern sich die Sektionstitel der einzelnen Konferenzen? Werden die in den Topics repräsentierten Themen auch in den Sektionen aufgegriffen? Oder setzen die Sektionstitel eigene thematische Schwerpunkte, die sich etwa an das Motto der Konferenz anlehnen?

 

DHd 2018 [10] (187 Einreichungen)

 

DHd 2019 [11] (189 Einreichungen)

 

Topic

Häufigkeit

Topic

Häufigkeit

Modellierung

60

Annotieren

55

Text

50

Text

54

Annotieren

48

Visualisierung

46

Inhaltsanalyse

44

Modellierung

35

Visualisierung

37

Daten

26

Methoden

Theoretisierung

33

29

Programmierung

Metadaten

26

25

Programmierung

26

Methoden

24

Forschungsprozess

26

Kontextsetzung

23

Kollaboration

25

Literatur

23

 

Tabelle 1: Die zehn häufigsten der insgesamt 75 zur Verfügung stehenden Topics (aus TaDiRAH abgeleitet), die von den Einreichenden der DHd 2018 und 2019 vergeben wurden.

 

 

Erkenntnisse für die Zukunft?

Für meine abschließenden Überlegungen nehme ich einen eher literaturwissenschaftlichen Blickwinkel ein, der etwa auch digitale Editionen bewusst ausklammert, da diese schon seit längerem verstärkt in die Fachdisziplin zurückwirken und wohl bereits zum Standardrepertoire der Editionsphilologie zu zählen sind.

Der Rückgang der „Inhaltsanalyse“, der gleichzeitige Aufschwung von „Daten“ und der Fokus auf das „Annotieren“ scheinen eine generelle Tendenz der aktuellen DH-Forschung abzubilden, die auch in den einzelnen Sektionen der DHd 2019 – zumindest soweit ich diese besucht habe – greifbar wurde. Mit einigen Ausnahmen scheint der Weg fürs Erste wegzuführen vom spezifischen einzelnen Phänomen (etwa Autorschaftsattribution eines anonymen Textes), weg von der Anwendung einzelner Methoden der Textanalyse (etwa explorativer Zugang zu einem Textkorpus über Topic Modeling) – und auch die Operationalisierung einzelner geisteswissenschaftlicher Konzepte und ihre Rückführung in den Fachdiskurs wird für den Moment eher hintenangestellt. Die überwiegende Absenz von Anwendungsbeispielen, die literaturwissenschaftliche Fragestellungen anhand von Topic Modeling, Stilometrie, Sentiment Analysis, Netzwerkanalysen o.ä. hätten aufgreifen können, verstärkt meinen Eindruck dieser Tendenz.

Stattdessen stehen deutlich grundlegendere Forschungsfragen im Fokus, deren Zusammenspiel dann eine gesichertere Basis für komplexere Textanalysen bietet. Dazu gehört unter anderem der Aufbau, die Aufbereitung und die Veröffentlichung von (programmable) Korpora inklusive forschungsrelevanter Metadaten, die Erstellung schlüssiger Findeheuristiken (etwa zur Vorselektion relevanter Texte), das systematische Anfertigen von Trainingsdaten (etwa durch Annotationen) und daran anschließend die Optimierung computerlinguistischer Verfahren für die Domäne Literatur (Part-of-Speech-Tagging, Named-entity recognition usw.) oder die Entwicklung neuer domänenspezifischer Verfahren der textuellen (Vor-)Verarbeitung (etwa die automatische Auszeichnung von direkter Rede oder Hauptfiguren). Eine Sonderstellung nimmt dahingehend die manuelle Annotation und Visualisierung dezidiert literaturwissenschaftlicher Phänomene ein. Hierfür halte ich beispielsweise fast alle Kategorien der Narratologie für geeignet. Die Annotationsdaten werden dann nicht (nur) als Trainingsdaten für maschinelle Automatisierungsverfahren aufgefasst, sondern sollen durch ihre Visualisierung einen Mehrwert erzeugen, der über die reinen Datenwerte hinausreicht. Aus wissenschaftssoziologischer Perspektive erscheint es aufschlussreich, dass die Etabliertheit bestimmter, vor allem informationstechnischer Methoden innerhalb der DH seitens der BeiträgerInnen, ModeratorInnen und OrganisatorInnen häufig betont und hervorgehoben wurde. Die DH müssten sich hinsichtlich ihrer Methoden also nicht hinter der Informatik verstecken. So war etwa die Rede vom bereits „traditionellen“ machine learning oder von inzwischen „klassischen“ deep learning Ansätzen.

Offen bleibt, in welchem Verhältnis die DH im Allgemeinen und die Computational Literary Studies im Speziellen zu ihren etablierten Fachdisziplinen stehen und später einmal stehen sollen bzw. werden. Sollen die Ergebnisse langfristig in die Fachdisziplinen zurückgespielt werden, um mögliche Synergien qualitativer und quantitativer Methoden auszuloten? Oder ist nach dem Vorbild von Linguistik und Computerlinguistik eine dauerhafte Koexistenz analoger und digitaler LiteraturwissenschaftlerInnen das Ziel? Dann möglicherweise mit sehr viel größerer Nähe zur Computerlinguistik, mit Fokus auf die Methodenentwicklung bzw. -anwendung und mit entschiedener Bildung eigener Begriffe, Konzepte und Fragestellungen, die letztlich nicht unbedingt mit dem Begriffsrepertoire der traditionellen Literaturwissenschaft kompatibel sein müssen. Ein größerer Teil der Vorträge und Panels der diesjährigen DHd scheint mir – als Momentaufnahme – eher auf zweiteres zu deuten. Das mag aber auch dem sehr interdisziplinären Charakter der Tagung geschuldet sein, der schon allein deshalb die generische Methodenentwicklung gegenüber einem tiefergehenden monodisziplinären, bzw. monothematischen Ansatz favorisieren muss.

 

[1] Vgl. Scott B. Weingart: DH Quanitified. URL: https://scottbot.net/dh-quantified.

[2] Vgl. Katharina Kiefer: Einreichungen zur DHd 2019. URL: https://dhd-blog.org/?p=11358 und Armin Hoenen: Einreichungen zur DHD 2019 – II. URL: https://dhd-blog.org/?p=11418.

[3] Die Zahlen entnehme ich dem Beitrag von Scott B. Weingart: Acceptances to DH2016. URL: http://scottbot.net/acceptances-to-dh2016-pt-1.

[4] Vgl. Michael Piotrowski: Wo ist die Schweiz? URL: https://dhd-blog.org/?p=11453.

[5] Die Daten für die DHd 2018 in Köln entnehme ich dem Blogbeitrag von Ulrike Henny-Krahmer und Patrick Sahle: Einreichungen zur DHd 2018. URL: https://dhd-blog.org/?p=9001.

[6] Vgl. Scott B. Weingart: Acceptances to DH2016. URL: http://scottbot.net/acceptances-to-dh2016-pt-1. Für die Jahre 2013 bis 2016 kommt Weingart auf folgende Annahmequoten: Nebraska 2013: 64 Prozent, Lausanne 2014: 59 Prozent, Sydney 2015: 72 Prozent, Krakau 2016: 62 Prozent.

[7] Vgl. Patrick Sahle: Digital Humanities? Gibt’s doch gar nicht! In: Grenzen und Möglichkeiten der Digital Humanities. Sonderband der Zeitschrift für digitale Geisteswissenschaften 1. Hg. von Constanze Baum und Thomas Stäcker. 2015. DOI: 10.17175/sb001_004.

[8] Vgl. auch nachfolgend Scott B. Weingart: Acceptances to DH2016. URL: http://scottbot.net/acceptances-to-dh2016-pt-1.

[9] Vgl. auch nachfolgend Scott B. Weingart: Submissions to DH2017. URL: http://scottbot.net/submissions-to-dh2017-pt-1.

[10] Vgl. Ulrike Henny-Krahmer und Patrick Sahle: Einreichungen zur DHd 2018. URL: https://dhd-blog.org/?p=9001.

[11] Vgl. Armin Hoenen: Einreichungen zur DHD 2019 – II. URL: https://dhd-blog.org/?p=11418.

 

Written by : Anastasia Buianova

1000 Characters left