Korpora

Das Projekt basiert auf Korpusmaterial unterschiedlicher Quellen/Textsorten. Neben Tweets werden auch Zeitungsartikel und Fachpublikationen gesammelt. Weiteres Korpusmaterial befindet sich aktuell in der Erschließung (geplant sind u. a. Webseiten und Blogs mit Bezug zur documenta). Dieses Material soll nach Projektende für Forschungs- und Lehrzwecke frei zur Verfügung gestellt werden. Bitte nutzen Sie unser Kontaktformular, falls Sie Interesse an einer Nutzung haben.

  • Zeitungs-/Fachartikel/Presse-Korpus
    16’469 Dokumente / 10’261’448 Token / 3’048 Autoren / 166 Zeitungen
    Zeitraum (Stand 19.11.2017): 31.07.1995 bis 14.10.2017
  • Tweet-Korpus
    145’795 Tweets / 2’125’751 Token / 22’775 Accounts
    Zeitraum (Stand 03.02.2017): 17.02.2011 bis 24.06.2017
  • d14-Webkorpus
    Das Korpus befindet sich aktuell im Aufbau.
    Es basiert auf der Webseite www.documenta14.de