Der Manifesto Corpus: ein mehrsprachiges, annotiertes und digitales Wahlprogrammarchiv

Quelle: Manifesto Project

 

Autoren: Pola Lehmann, Jirka Lewandowski, Theres Matthieß, Nicolas Merz und Sven Regel

Der Berliner Digital-Humanities Preis ging dieses Jahr an den Manifesto Corpus. Der Interdisziplinäre Forschungsverbund Digital Humanities in Berlin zeichnet mit diesem Preis „herausragende Berliner Projekte auf dem Gebiet der Digital Humanities“ aus. Doch, was ist der Manifesto Corpus eigentlich, wo kommt er her, was kann man mit ihm machen und wie kann man ihn nutzen?

 Eine Einführung

Der Manifesto Corpus ist ein frei zugänglicher, digitaler, mehrsprachiger und annotierter Textkorpus von Wahlprogrammen. Er erlaubt die Analyse von Sprache, Positionen und Prioritäten von politischen Parteien in vielfältiger Art und Weise. Die Textsammlung umfasst Wahlprogramme von Parteien aus über 45 Ländern in 34 Sprachen. Dabei handelt es sich größtenteils um OECD-Demokratien. Damit hat die Sammlung einen starken Fokus auf europäische Länder (West und Osteuropa), doch sie umfasst auch zahlreiche außereuropäische Demokratien wie Australien, Neuseeland, USA, Mexiko und Südafrika. Insgesamt beinhaltet die Sammlung fast 2.000 maschinenlesbare Dokumente von mehr als 500 Parteien und 350 Wahlen seit 1945. Folgende Grafik veranschaulicht die Abdeckung des Manifesto Corpus: Je stärker ein Land eingefärbt, desto mehr Dokumente sind digital verfügbar.

 

 

Quelle: Manifesto Project

Wo kommt er her: Auf den Schultern von (analogen) Giganten

Die Wurzeln des Manifesto Corpus reichen bis in die späten 1970er Jahre zurück. Damals wurde die Manifesto Research Group (MRG) als Forscher_innengruppe von Ian Budge initiiert mit dem Ziel, auf Basis einer inhaltsanalytischen Untersuchung von Wahlprogrammen länderübergreifende vergleichbare Analysen über die Positionen der Parteien machen zu können. Hans-Dieter Klingemann institutionaliserte das Forschungsvorhaben und siedelte das Projekt als Comparative Manifestos Project (CMP) ab 1989 am Wissenschaftszentrum Berlin für Sozialforschung (WZB) an. Seit 2009 wird das Projekt als Manifesto Research on Political Representation (MARPOR) im Rahmen einer Langfristförderung durch die Deutsche Forschungsgemeinschaft finanziert. Aktuell ist es unter der Leitung von Andrea Volkens am Wissenschaftszentrum Berlin für Sozialforschung in der Abteilung Demokratie & Demokratisierung von Wolfgang Merkel angesiedelt

Forschungsinteresse des Manifesto-Projekts sind Positionen und Prioritäten von politischen Parteien in Demokratien. Wie verändert sich eine Partei ideologisch über Zeit und welche Themen priorisiert sie: Gibt es Belege für eine Sozialdemokratisierung der CDU? Wendet sich die SPD in den letzten Jahren stärker neoliberalen Wirtschaftspositionen zu? Zudem lässt sich auch untersuchen, wie sich Position und Prioritäten zwischen Parteien unterscheiden: Vertreten grüne Parteien in unterschiedlichen Ländern nicht nur bei Umweltfragen ähnliche Themen? Welche Rolle spielen Wirtschaftsthemen oder die Europäische Union für unterschiedliche Parteien? Um solche Fragen zu beantworten, analysieren Länderexpert_innen jedes Statement in den Wahlprogrammen nach einem 56 Kategorien umfassenden Analyseschema, das alle relevanten Politikbereiche und Themen umfasst. Damit können Aussagen darüber gemacht werden, welche Themen wie oft in einem Wahlprogramm vorkommen und welche Positionen Parteien einnehmen. Die erhobenen Daten stellt das Manifesto-Projekt schließlich in einem frei zugänglichen Datensatz Wissenschaftler_innen und politisch Interessierten zur Verfügung.

In der Vergangenheit mussten die Wahlprogramme direkt vor Ort gesammelt werden und analog, mit Stift auf Papier, analysiert werden. Seit 2009 hat das Projekt alle vorhandenen Manifestos sowie schließlich auch den Prozess der Dokumentensammlung und -aufbereitung digitalisiert. Die Originaldokumente werden seitdem als PDFs gesammelt, maschinenlesbar gemacht und mit Metadaten zu Sprache, Partei und Wahljahr versehen. Im Anschluss annotieren Muttersprachler_innen digital jedes Statement eines Wahlprogramms nach dem vorgegeben Analyseschema.

Ein wesentliches Ergebnis dieses digitalen Prozesses ist der Manifesto Corpus. Er enthält die Originaltexte sowie Annotationen, schafft somit eine hohe Transparenz der Datenerhebung und ermöglicht vollständig reproduzierbare Analysen. Damit eröffnen sich neue Wege in der Nutzung der Daten und gestatten einen umfassenden Zugriff auf die Programmatik von Parteien.

Was kann man mit dem Corpus machen?

Die von Länderexpert_innen vorgenommenen Annotationen erlauben den Vergleich zwischen verschiedenen Parteien und welche Bedeutung sie einem bestimmten Thema in ihrem Wahlprogramm einräumen. Mit Hilfe des Corpus‘ und automatisierter Textanalyse lässt sich nun noch viel genauer beobachten, wie Parteien über diese Themen sprechen und ob sie sich in der Art, wie sie Themen diskutieren, unterscheiden. Die menschlichen Kodierungen können beispielsweise genutzt werden, um aus einem Wahlprogramm alle Textstellen zu einem bestimmten Thema zu extrahieren. Eine beispielhafte Illustration findet sich in der folgenden Grafik:

Quelle: Manifesto Project

Die Grafik zeigt die Worthäufigkeiten in den Programmen von CDU/CSU und den Grünen zu den Themen Multikulturalismus und kulturelle Traditionen. Je größer die Wörter, desto häufiger sind sie im Wahlprogramm zu finden. „Deutschland“ ist bei beiden Parteien das am meisten vorkommende Wort, aber darüber hinaus gibt es deutliche Unterschiede. Während bei den Grünen Worte wie „Gesellschaft“, „Menschen“ und „Vielfalt“ im Vordergrund stehen, sind es bei CDU/CSU „Deutsche“, „Land“ und „unsere“. Dieser Vergleich der Worthäufigkeiten gibt einen ersten Eindruck darüber, in welchem Zusammenhang Multikulturalismus von beiden Parteien diskutiert wird und eignet sich damit als Startpunkt für detailliertere Analysen.

Die Forschungsfragen müssen dabei nicht auf Deutschland begrenzt sein, denn der Corpus beinhaltet Wahlprogramme aus 45 Ländern. Wir können uns also nicht nur den Diskurs über Multikulturalismus innerhalb eines Landes anschauen, sondern auch wie dieses Thema in unterschiedlichen Ländern von Parteien diskutiert wird. Hier zum Beispiel in Deutschland, in den USA und in Finnland:

Quelle: Manifesto Project

In allen Ländern sind das eigene Land und die eigenen Bürger die wichtigsten Worte im Zusammenhang mit Multikulturalismus: „Deutschland“, „Americans“, „America“ und „Suomen“. Es lässt sich erkennen, dass die Debatte in den USA besonders mit der nationalen Sicherheit verknüpft ist, in Deutschland Integration und Gesellschaft eine wesentliche Rolle spielen und in Finnland der Name einer rechtspopulistischen Partei (perussuomalaisten, die „Wahren Finnen“) aber auch das Wort „sozial“ eine wichtige Rolle spielen.

Die Wahlprogramme lassen sich auch unabhängig von der menschlichen Kodierung betrachten, um etwa die Konjunktur eines bestimmten Begriffs in dem politischen Diskurs zu beobachten. Aktuell ist „Flucht“ eines der bedeutendsten Themen in der öffentlichen Debatte in Deutschland. Bereits in der Vergangenheit hat das Thema schon eine wichtige Rolle gespielt. Die folgende Grafik zeigt, dass sich die deutschen Parteien auch in den 50er Jahren viel mit Fluchtthematiken beschäftigt haben – damals im Kontext der eigenen Fluchterfahrung vieler Deutscher.

Quelle: Manifesto Project

Ein ganz anderes Bild ergibt sich, wenn man sich die Häufigkeit des Wortes „digital“ in den Wahlprogrammen anschaut – ein Thema ohne das es Projekte wie den Manifesto Corpus nicht geben würde. Lange Zeit kam es auf der politischen Agenda so gut wie nicht vor, bis seine Bedeutung in den neunziger Jahren exponentiell anstieg.

Wie kann man ihn nutzen: Vielseitiger Zugang

Über unsere Webseite und eine API (engl. application programming interface – dt. Programmierschnittstelle) stellen wir verschiedene Zugriffsmöglichkeiten auf die Daten bereit. So können Forscher_innen und politisch Interessierte unterschiedlichen Fragen zur thematischen Ausrichtung von Parteien nachgehen. Die Daten sind am einfachsten über die Projektseite abrufbar. Sie können sowohl als Rohdaten heruntergeladen werden als auch auf unserer Website analysiert werden. Technisch versiertere Nutzer_innen können die API mit ihrer präferierten Programmiersprache ansprechen. Zudem haben wir das Software-Paket manifestoR entwickelt, welches den Zugriff auf und den Umgang mit den Daten in R – einer der Standardsprachen für statistische Problemstellungen  –  erleichtert und eine Integration in bestehende Textanalyse-Werkzeuge derselben erlaubt. Die Software ist frei zum Download verfügbar und quelloffen.

Der Manifesto Corpus ist die umfangreichste, mehrsprachige, annotierte, digitale Sammlung von Wahlprogrammen. Er wird ständig erweitert, ist frei zugänglich und ermöglicht die Bearbeitung vielfältiger Fragestellungen. Bereits in der Vergangenheit hat das Projekt zahlreiche Forschungsarbeiten angeregt und möchte zukünftig mit dem Manifesto Corpus Inspiration und Datengrundlage sein für Forschung in Politikwissenschaft, Soziologie, Linguistik, Computer Science, Economics, etc.

 

Mehr Informationen zum Manifesto Corpus:

 

 

Getagged mit: , ,
0 Kommentare zu “Der Manifesto Corpus: ein mehrsprachiges, annotiertes und digitales Wahlprogrammarchiv
1 Pings/Trackbacks für "Der Manifesto Corpus: ein mehrsprachiges, annotiertes und digitales Wahlprogrammarchiv"
  1. […] dieser Beitrag ist bereits zuvor auf dem digital humanities Blog erschienen. […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*