LT for DH: Language Technology Resources and Tools for Digital Humanities
Workshop bei der COLING 2016
Mehr und mehr werden Sprachressourcen nicht nur in der Sprachtechnologie (Language Technology, LT) sondern auch in anderen Bereichen, etwa in den Digital Humanities oder auch Digitalen Geisteswissenschaften verwendet. Wenn die Werkzeuge aus der Sprachtechnologie in diesen Bereichen eingesetzt werden, entstehen neue Blickwinkel auf diese Ressourcen, z.B. hinsichtlich der Anpassung auf eine Fragestellung, Interoperabilität, technischer Anforderungen, Dokumentation und Benutzerfreundlichkeit der Zugänge. Bei diesem Workshop geht es um sprachtechnologische Werkzeuge und Daten, die in den Digital Humanities eingesetzt werden, mit Beispielanwendungen und einer Reihe von Fragestellungen, in denen die Sprachtechnologie eingesetzt werden kann.
Sprachtechnologische Anwendungen werden häufig trainiert und auf bestimmte Texttypen angepasst, manchmal auch auf bestimmte Formate, in denen Korpora vorliegen. Wenn diese Werkzeuge in anderen Zusammenhängen und auf andere Daten angewendet werden, mag es offensichtlich erscheinen, dass die Ergebnisse nicht den gleichen hohen Ansprüchen genügen kann, die Ergebnisse können aber trotzdem einen Erkenntnisgewinn darstellen, z.B. wenn historische Daten bearbeitet werden oder andere Texttypen und 'Genres'. Wenn man diese Werkzeuge etwa in den Geisteswissenschaften einsetzen möchte, werden auch weitere Anforderungen an Daten gestellt, z.B. weil weitere Annotatonen in den Daten vorliegen. Zusätzlich können Datenkonvertierungen notwendig sein , insbesondere dann, wenn Annotationswerkzeuge und Anfragewerkzeuge zusammen verwendet werden sollen oder Daten analysiert und visualisiert werden.
Werkzeuge aus der Sprachtechnologie werden häufig miteinander verkettet und in festen Abläufen angewendet, die Konfiguration hängt dabei häufig von der sprachtechnologischen Anwendung ab. Das gilt auch für Abläufe in der DH-Forschung. Da sich aber DH-Werkzeuge stark von denen in der Sprachtechnologie unterscheiden, müssen neue Konfigurationen verwendet werden, was auch zu weiteren Interoperabilitätsanforderungen für Werkzuege führen kann. Daneben sind die technischen Anfroderungen einiger sprachtechnologischer Werkzeuge teilweise so hoch und die Lernkurve so steil, dass sie für Nutzende aus den DH, die nicht auf diese Werkzeuge spezialisiert sind, eine hohe Hürde darstellen. Das bedeutet unter anderem, dass das Herunterladen von Software samt komplexer lokaler Installation vermieden werden sollte und die Programme stattdessen Web-basiert sein sollten. Außerdem sollten Nutzerstudien für Werkzeuge aus der Sprachtechnologie im Kontext der DH durchgeführt werden, um Rückmeldungen darüber zu erhalten, welche Anpassungen der Werkzeuge, Algorithmen und Zusatzfunktionen notwendig sind.