Korpora

Das Projekt basiert auf Korpusmaterial unterschiedlicher Quellen/Textsorten. Neben Tweets werden auch Zeitungsartikel und Fachpublikationen gesammelt. Weiteres Korpusmaterial befindet sich aktuell in der Erschließung (geplant sind u. a. Webseiten und Blogs mit Bezug zur documenta). Dieses Material soll nach Projektende für Forschungs- und Lehrzwecke frei zur Verfügung gestellt werden. Bitte nutzen Sie unser Kontaktformular, falls Sie Interesse an einer Nutzung haben.

  • Zeitungs-/Fachartikel/Presse-Korpus
    14’405 Dokumente / 9’288’582 Token / 2’839 Autoren
    Zeitraum (Stand 29.05.2017): 31.07.1995 bis 11.05.2017
  • Tweet-Korpus
    145’795 Tweets / 2’125’751 Token / 22’775 Accounts
    Zeitraum (Stand 03.02.2017): 17.02.2011 bis 24.06.2017
  • d14-Webkorpus
    Das Korpus befindet sich aktuell im Aufbau.
    Es basiert auf der Webseite www.documenta14.de