Skip to content

Analyse von Wahlprogrammen zur Bundestagswahl - Ein Projekt für das Seminar Textanalyse in den Politikwissenschaften

Notifications You must be signed in to change notification settings

katjakon/Text-Mining-Wahlprogramme

Repository files navigation

Text-Mining-Wahlprogramme

Ein Projekt für das Seminar Textanalyse in den Politikwissenschaften

Idee und Fragestellung

In Wahlprogrammen stellen Parteien ihre Meinung und Ausrichtung dar und positionieren sich klar zu Themen, die ihnen wichtig erscheinen.
Das wirft unter anderem folgende Fragen auf:

  • Gibt es Begriffe, die typisch für bestimmte Parteien/Ausrichtungen sind?
  • Wie präsent sind Themen wie Klimawandel in Wahlprogrammen?
  • Stellen Parteien, die zum Zeitpunkt der Wahl an der Regierung beteiligt waren, die Lage in Deutschland positiver dar?

Benötigte R-Bibliotheken

  • quanteda, siehe hier für Informationen zur Installation.
  • readtext, siehe hier für Informationen zur Installation.
  • udpipe, siehe hier für Informationen zur Installation.
  • tidyverse, siehe hier für Informationen zur Installation.

Erklärungen zum Code

Für jeden Abschnitt im Bericht können auf folgender Seite der Code, mit dem die Untersuchungen durchgeführt wurden, und dazugehörige Erklärungen abgerufen werden:
https://katjakon.github.io/Text-Mining-Wahlprogramme/

Korpus

Das Korpus enthält Wahlprogramme zur Bundestagswahl von 2002 bis 2017. Die Originale sind hier abrufbar:

Die Dateien wurden mithilfe von pdftotext und optical character recognition in Text-Dateien umgewandelt. Die manuelle Nachbearbeitung beinhaltete folgende Punkte:

  • Entfernung von Seitenzahlen
  • Entfernung von Impressen
  • Entfernung von Seitenumbrüchen
  • Entfernung von Worttrennungen
  • Korrektur von falsch erkannten Zeichen
  • Korrektur von vertauschten Absätzen durch zweispaltiges Layout

Autoren

About

Analyse von Wahlprogrammen zur Bundestagswahl - Ein Projekt für das Seminar Textanalyse in den Politikwissenschaften

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages