Technische Grundlagen

Die Grafik oben skizziert die einzelnen Prozessabschnitte.

  1. Korpora erfassen – Es werden unterschiedlichste Textsorten über einen langen Zeitraum gesammelt. Details siehe Korpora.
  2. CorpusExplorer – Das Material wird mittels CorpusExplorer aufbereitet. Dies umfasst z. B. auch die automatische Annotation von Satz-, Wort-, Part-of-Speech (Wortart) und Lemma-Informationen.
  3. Auswertung – Die Auswertung geschieht mittels unterschiedlicher Tools. Hierzu zählen:
    • CorpusExplorer – OpenSource / Promotionsprojekt an der Universität Kassel – Tool für Text-Mining/Visualisierung
    • ElasticSearch – in Verbindung mit Kibana
    • ReportEngine – basiert auf dem CorpusExplorer und erlaubt eine papierbasierte Auswertung.
    • Microsoft Power BI & Microsoft Excel – Für Grafiken
    • Tableau – Für Grafiken
  4. Visualisierungen – Die so gewonnenen Analysedaten werden grafisch aufbereitet. Hierzu werden neben den oben genannten Auswertungs-Tools auch andere Programme verwendet, wie Microsoft Excel, R, Tableau, uvm.