Kookkurrenz-Analyse – Projekt: Reden über Kunst

Für die Kookkurrenzanalyse werden die Wortpartner des jeweiligen Suchwortes ermittelt, also diejenigen Wörter, die besonders häufig in der Umgebung eines Suchworts in den Texten zur documenta 14 vorkommen. Mittels der sog. Possion-Verteilung lässt sich abschätzen, ob zwei Wörter nur zufällig miteinander vorkommen oder ob es sich um eine statistisch auffällige Kombination handelt.

Zum Vergleich der Projekt-Korpora wurde jeweils eine Kookkurrenz-Analyse der Begriffe documenta, Kassel, Athen und Szymczyk durchgeführt. Die Analyse erfolgt mittels der Software CorpusExplorer , die auch die Visualisierung auf der Basis von TagPies erzeugt. Darunter die Auswertung des Tweet-Korpus.

Zeitungsartikel zur documenta: häufigste Kombinationen zu

documenta – Kassel – Athen – Szymczyk

Tweets zur documenta: häufigste Kombinationen zu

documenta – Kassel – Athen – Szymczyk

In dieser ersten Projektphase wurden alle Tweets zur documenta ausgewertet. Wie sich zeigt, ist der unerwünschte Beifang recht groß. Daher müssen in der zweiten Projektphase diejenigen Tweets entfernt werden, die für die Inhaltsanalyse irrelevant sind (was z.B. der Fall ist, wenn ein Nutzer den Hashtag #documenta14 nutzt, um seinen Kasseler Schlüsseldienst während der documenta anzupreisen).

(Text, Analyse und grafische Aufbereitung: Prof. Dr. Andreas Gardt, Jan Oliver Rüdiger)