Referenzressourcen

Einige Referenzmaterialien werden durch die CLARIN-D-Zentren bereitgestellt. Hier finden Sie eine Auswahl besonders bekannter und oft verwendeter Ressourcen, die mit Hilfe eigener Suchoberflächen erschlossen sind.

GermanetGermaNet ist ein von der Universität Tübingen betriebenes maschinenlesbares lexikalisch-semantisches Netz der deutschen Sprache. Ein Teil davon ist in EuroWordNet integriert, das die Wortnetze mehrerer europäischer Sprachen über einen interlingualen Index miteinander verbindet.

 DeReKoDas Deutsche Referenzkorpus (kurz DeReKo) ist ein elektronisches Archiv von deutschsprachigen Textkorpora geschriebener Sprache, das seit 1964 existiert und vom Institut für Deutsche Sprache (IDS) in Mannheim gepflegt und kontinuierlich ausgebaut wird. Mit derzeit über 25 Milliarden laufenden Textwörtern ist DeReKo die weltweit größte Sammlung elektronischer Korpora der deutschen Gegenwartssprache, die für wissenschaftliche Zwecke bestimmt ist. Über die Webapplikation COSMAS II ist DeReKo öffentlich zugänglich.

Deutsches TextarchivDas Deutsche Textarchiv (DTA) ist ein seit Juli 2007 an der Berlin-Brandenburgischen Akademie der Wissenschaften beheimatetes und von der Deutschen Forschungsgemeinschaft gefördertes wissenschaftliches digitales Textarchiv. Das daraus entstandene, öffentlich zugängliche Textkorpus umfasst einen disziplinen- und gattungsübergreifenden Bestand deutschsprachiger Volltexte aus dem Zeitraum von ca. 1500 bis 1900.

WortschatzDer "Deutsche Wortschatz" ist eine umfangreiche Wortschatz-Datenbank mit 35 Millionen Sätzen und 500 Millionen laufenden Wörtern; er besteht aus mehr als 9 Millionen verschiedenen Wörtern und Wortgruppen.

DWDSDas Digitale Wörterbuch der deutschen Sprache (DWDS) ist ein Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart, das neben verschiedenen Textkorpora und daraus abgeleiteten Sprachstatistiken auch Wörterbücher mit über 465 000 lexikografisch geprüften Einträgen umfasst. Die Wörterbücher werden im Rahmen eines Langzeitvorhabens am Zentrum Sprache zum Teil aktualisiert und überarbeitet.