CLARIN-D Blog

Diskursanalytische Fragestellungen mithilfe des DeReKo (Teil 2)

https://youtu.be/56kF3-03_fY

Im ersten Teil dieses Screencasts erklärte Simon Meier, Mitglied der CLARIN F1, wie für diskursanalytische Fragestellungen das Deutsche Referenzkorpus (DeReKo) in COSMAS II mit der integrierten Funktion der Themenannotation genutzt werden kann. hier geht es zum Blogpost der Teil 1 des Videos behandelt. 

Dieser Blogpost beschäftigt sich nun mit Teil 2 von Meier's Screencast, in dem er zeigt, wie die in Teil 1 gefundenen Belege exportiert und mithilfe des kostenlosen Korpusanalysewerkzeugs AntConc weiter untersucht werden können. 

Im letzten Screencast zeigte Meier bereits, dass Formulierungen wie heute weiß man in populärwissenschaftlichen Texten sowie Texten über Ernährung und Gesundheit besonders häufig vorkommen. Die Frage ist nun, welche Gegenstände typischerweise, und mit welchen sprachlichen Mitteln, so repräsentiert werden. Um die Frage zu beantworten werden die Belege zusammen mit Referenzbelegen in AntConc analysiert.  

Weiterlesen

Diskursanalytische Fragestellungen mithilfe des DeReKo (Teil 1)

https://youtu.be/OOTUB-qC5as

Im ersten Teil dieses Screencasts erklärt Simon Meier, Mitglied der CLARIN F1, wie für diskursanalytische Fragestellungen das Deutsche Referenzkorpus (DeReKo) in COSMAS II mit der integrierten Funktion der Themenannotation genutzt werden kann. Hier geht es zu Teil 2. 

Als Beispiel wählt Meier populärwissenschaftlichen Diskurs in denen Formulierungen wie 

  • heute weiß man
    oder
  • wir wissen heute

genutzt werden. 

Die These lautet: 

Im populärwissenschaftlichen Diskurs als medial vermittelter Experten-Laien-Kommunikation sind wir wissen heute, heute weiß man usw. formelhafte Mittel zur Präsentation von Wissen und Wissensfortschritt.  

Weiterlesen

Sprach-Analysen der Wikipedia-Korpora im DeReKo mithilfe von COSMAS II

https://youtu.be/bKw1yaf_imk

In diesem Screencast zeigt Dr. Eva Gredel von der Universität Mannheim, wie die Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprachanalysen genutzt werden können. 

Ganz konkret geht es um eine von ihr durchgeführte Fallstudie zu itis-Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia.

Das Phänomen
Das Morphem itis, das in medizinischer Fachsprache für Wortbildungsprodukte zum Einsatz kommt, hat als Basiskonstituente üblicherweise Bezeichnungen für Körperteile oder Organe. Seit dem 19. und 20. Jahrhundert kamen dann weitere, gemeinssprachliche itis-Kombinationen wie Telefonitis hinzu. Auch in der Wikipedia, dass sich im 21. Jahrhundert entwickelte, tauchen in bestimmten Kontexten gemeinsprachliche itis-Kombinationen auf. 

Als Beispiele führt Dr. Gredel folgende itis-Kombinationen auf: 

-itisMFS (seit der Antike)   Rach-itis           (Nortmeyer 1987)

-itisBS (19.Jhdt.)                Dichter-itis        (Hoppe 2010)

-itisWikipedia (21.Jhdt.)    Abkürzer-itis     (Gredel 2018)
                                    Newsticker-itis
                                    Zitier-itis

Weiterlesen

CLARIN-D Newsflash Juli 2018

 

Titelseite der ersten Ausgabe der Philosophical Transactions
Titelseite der ersten Ausgabe der Philosophical Transactions

Neue Ressourcen in CLARIN-D

Neue Medien

Sommerschulen und Workshops

Veröffentlichungen

  • Im Sammelband "Computational Social Science—Die Analyse von Big Data" (herausgegeben von Prof. Dr. Andreas Blätte, Prof. Dr. Joachim Behnke, Prof. Dr. Kai-Uwe Schnapp, Prof. Dr. Claudius Wagemann) ist ein Methodenartikel erschienen, in dem die Analyse komplexer sozialwissenschaftlicher Konzepte mit korpusanalytischen Methoden reflektiert wird.
Weiterlesen

Konstruktionsgrammatik - Sprachgebrauchsbasierte Analysen mit den Korpora des DWDS und des DTA

https://youtu.be/wgmzrT9UJxQ

Prof. Dr. Alexander Lasch, Linguist an der TU Dresden, zeigt in diesem Video, wie mit den Ressourcen des DTA und des DWDS sprachgebrauchsbasierte Analysen durchgeführt werden können, um das Deutsche konstruktionsgrammatisch zu beschreiben. Dafür stellt er zwei Leitfragen auf: 

  1. Kann mittels eines konstruktionsgrammatischen Ansatzes Sprachgebrauch gegenstandsadäquat beschrieben werden?
  2. Inwieweit können maschinelle Analysen des Sprachgebrauchs dazu dienen, den sprachgebrauchsbasierten konstruktionsgrammatischen Ansatz zu plausibilisieren?  

Ein sprachgebrauchsbasierter Zugang verlangt die Diskussion darüber, was für uns ein Muster, Pattern, Schema oder eine Konstruktion sei, wovon sowohl die Grammatik des Deutschen, als auch die Konstruktionsgrammatik als Teilgebiet unter spezifischen kognitionslinguistischen Prämissen profitieren können. Der aktuelle Trend ist die Ermittlung solcher Muster durch maschinelle Analysen. Diese Muster werden dann im nächsten Schritt abstrahiert, um aus ihnen Konstruktionen zu gewinnen. Durch diese Vorgehensweise soll Sprachwissen, welches Sprechende zur Produktion der sprachlichen Strukturen verwenden, aus Sprachgebrauch rekonstruiert werden. Für diese Arbeit bieten das DWDS und das DTA gute Mittel.

Weiterlesen

(fast alles) was Sie schon immer über deutsche Grammatik wissen wollten und einfach nachschlagen können …

(fast alles) was Sie schon immer über deutsche Grammatik wissen wollten und einfach nachschlagen können …

 

Seit fast 20 Jahren betreibt das Institut für Deutsche Sprache (IDS) das grammatische Informationssystem grammis (https://grammis.ids-mannheim.de). Grammis vermittelt den hochkomplexen Gegenstandsbereich Grammatik unter Ausnutzung digitaler Sprachressourcen und hypertextueller Navigationsstrukturen gleichermaßen wissenschaftlich fundiert und anschaulich. Forschungsergebnisse werden nicht in Form singulärer Einzelpublikationen transportiert, sondern es wird das gesamte Potenzial multimedialer Medien genutzt. Grammis hebt dadurch Beschränkungen der bisherigen Realisierungsformen von Open Access auf und adressiert variable – insbesondere mobile – Nutzungssituationen. Grammis versammelt multimedial aufbereitetes grammatisches Wissen auf über 3000 Webseiten, ergänzt um linguistisch motivierte Datenbanken, Wörterbücher und Bibliografien. Mit mehr als 100.000 Seitenaufrufen pro Monat zählt es zu den meistgenutzten Online-Ressourcen des IDS.

Weiterlesen

Vom Korpus zum Netz - Prof. Dr. Christian Mair - Forum CA3

https://youtu.be/uJ9JWEn7LSA

Prof. Dr. Christian Mair von der Universität Freiburg geht in seiner Präsentation auf dem Forum CA3 in Hamburg auf die Entwicklungen bezüglich des Community Buildings innerhalb von Forschungsinfrastrukturen wie CLARIN-D ein. In den letzten 50 Jahren gab es bezüglich des Nutzerkreises digitaler Sprachdaten große Veränderungen. Wo früher noch ausschließlich kleine Expertenzirkel ihr Wissen unter sich verbreiteten, wird dies nun mehr und mehr zur massenhaft verbreiteten Kulturtechnik. Die Community, die sich um einen Wissenskreis bildet, ist also nicht mehr so eindeutig abgrenzbar wie früher. Dies liegt in erste Linie an der breiten Digitalisierung der linguistischen Daten wie Schrifttexten, die nun multimodal und multimedial gestaltet werden und somit ein größeres Publikum bedienen können. Des Weiteren werden Texte nicht mehr nur noch gelesen, sondern in Datenform nutztbar gemacht und genutzt. 

Weiterlesen

Analyse von 'sprich' unter Verwendung der DGD und FOLK

https://youtu.be/eBqfSt90ti0

In diesem Screencast wird anhand der Datenbank für Gesprochenes Deutsch (DGD) gezeigt, wie Gesprächslinguistische Phänomene datenbankgestützt aufgezeigt und analysiert werden können. Hierfür wird das Forschungs- und Lehrkorpus gesprochenes Deutsch (FOLK) genutzt. Das untersuchte Wort ist sprich in seiner Verwendungsweise als Reformulierungsindikator, in dem es eine ähnliche Funktion wie das heißt hat und von seiner ursprünglichen imperativen Form entfremdet ist.  

Bei welchen Fragestellungen ist eine solche datenbankgestützte Analyse hilfreich? 

  • Finden sich Kookkurrenzen mit anderen Reformulierungsindikatoren wie also oder das heißt?
  • In welchen Interaktionstypen findet sich sprich häufiger und lassen entsprechende Tendenzen weitere Schlussfolgerungen bezüglich der Funktionalität zu? 
  • Welche grammatischen, semantischen und funktionalen Elemente werden durch sprich miteinander verknüpft und in welchem Verhältnis stehen diese? 
Weiterlesen

WebLicht Experteninterview - Extraktion Prädikativer Nominalphrasen

https://youtu.be/z6Y6m_oj-XU

In diesem Experteninterview wird ein Anwendungsszenario von CLARINs WebLicht besprochen. Genau wird gezeigt, wie prädikativ verwendete Nominalphrasen mittels WebLicht aus literarischen Texten extrahiert werden können. Der Forschungskontext innerhalb dessen diese Arbeitsweise genutzt wurde waren Formen und Funktionen von NPs beim Entwurf literarischer Figuren

Bei prädikativ verwendeten NPs im literarischen Kontext handelt es sich zum Beispiel um Charakterisierungen, wie die im folgenden Textausschnitt aus Thomas Manns Mario und der Zauberberg fett markierte Stelle: 

Ohne Schwierigkeiten fand sich ein junger Mann aus den hinteren Sitzreihen, der bereit war, diktierte Ziffern auf die Tafel zu schreiben. Wir kannten ihn auch: die ganze Unterhaltung gewann etwas Familiärs dadurch, dass man so viele Gesichter kannte. Er war der Angestellte des Kolonialwaren- und Obstladens in der Hauptstraße und hatte uns mehrmals in guter Form bedient. 
Mann 1930: 61
 

Weiterlesen

COSMAS II Screencast

https://youtu.be/0pY2cSgd4kQ

In diesem Screencast wird eine Nutzungsmöglichkeit von COSMAS II gezeigt. COSMAS, das Corpus Search, Management and Analysis System, ist ein Portal für Korpusrecherchen innerhalb textueller Korpora des IDS. Als Beispiel wird die Untersuchung der Entwicklung des öffentlichen Diskurses über Geflüchtete gezeigt

Es wird im Detail gezeigt, welche Schritte für eine solche Analyse in COSMAS II vorgenommen werden müssen. So muss zunächst ein für den Forschungskontext geeignetes Teilkorpus zusammengestellt werden. Hierfür muss nach einer Anmeldung in COSMAS II ein Textarchiv ausgewählt werden. Im Screencast wird beispielsweise das Archiv für geschriebene Sprache ausgewählt. Als Textkorpus werden Texte aus der Zeitung Die Zeit zwischen 1953 und 2015 ausgewählt.

Weiterlesen