Wie man Wahlprognosen richtig interpretiert

Praxis

Die Meinungsforschung steht in der Kritik. Es gab Wahlen in Deutschland, bei denen einzelne Institute mit einer Abweichung von acht Prozentpunkten ziemlich danebenlagen. Auch die US-Wahl 2016 hat für Aufsehen gesorgt. Wie kann es zu solchen Irrtümern kommen? Ist der Wähler zum undurchschaubaren Wesen mutiert? Müssen für die Auswertungen neue Formeln entwickelt werden oder manipulieren die Meinungsforscher gar die Auswertungen?

Namhafte Institute stellen regelmäßig etwa 1.000 bis 2.000 Wahlberechtigten die sogenannte „Sonntagsfrage“, um deren aktuelle politische Parteienpräferenz herauszufinden und Wahlprognosen zu erstellen. Hierfür werden die Wahlberechtigten zumeist auf ihrer Festnetznummer angerufen. Da heute viele Menschen keinen Festnetzanschluss mehr haben, werden im sogenannten Dual-Frame-Verfahren Mobilfunknummern einbezogen. Weitere Befragungsarten sind Face-to-Face-Interviews oder Online-Befragungen.

Es wird zwischen den sogenannten Rohdaten und der Projektion unterschieden. Die Rohdaten spiegeln nur die aktuelle politische Stimmung wider, d. h. eine Wahlabsicht, die nicht mit dem tatsächlichen Wahlverhalten gleichzusetzen ist. Mit der Frage „Wen würden Sie wählen, wenn am Sonntag Bundestagswahl wäre?“ versucht man die Wahlabsicht zu erheben.

Um von der aktuellen politischen Stimmung auf ein mögliches Wahlverhalten zu schließen, ergänzen die Institute die Rohdaten durch ihre speziellen Gewichtungsfaktoren. Das Ergebnis dieser Transformation von Wahlabsicht zu Wahlverhalten wird als Projektion bezeichnet, die auch veröffentlicht wird. Was genau einfließt, bleibt Geheimnis eines jeden Instituts. Aus wissenschaftlicher Sicht ist das intransparent, aber welcher Koch verrät schon sein Rezept?

Zufallsauswahl und Repräsentativität

Um überhaupt von einer Stichprobe auf das Wahlverhalten der Grundgesamtheit – d.h. aller Wahlberechtigten – schließen zu können, muss die Auswahl zufällig und repräsentativ sein. Insbesondere die Zufallsauswahl ist eine sehr strenge Anforderung, nach der die Wahrscheinlichkeit für jeden Wahlberechtigten in die Stichprobe aufgenommen zu werden, gleich hoch sein muss.

Bei telefonischen Umfragen auf Basis von Festnetzanschlüssen werden nur Wahlberechtigte befragt, die einen Festnetzanschluss haben. Wahlberechtigte ohne Festnetzanschluss haben keine Chance, ihre Wahlabsicht zu äußern. Online-Befragungen basieren in der Regel auch nicht auf einer Zufallsauswahl, da sich der Teilnehmer durch Anmeldung beziehungsweise Registrierung gewissermaßen selbst auswählt. Bei Face-to-Face-Interviews sind diese Einschränkungen aber nicht gegeben.

Repräsentativität bedeutet, dass die Stichprobe strukturgleich mit der Grundgesamtheit sein muss. Bei geringen Abweichungen wird die Stichprobe gewichtet. Diese Gewichtung ist nicht zu verwechseln mit der Projektion, da sie dazu dient, die Repräsentativität zu gewährleisten. Hier gibt es keine Unterschiede zwischen den Forschungsinstituten, denn die Struktur der wahlberechtigten Bevölkerung ist hinreichend gut bekannt.

Von Mitläufern und Underdogs

Je weiter der Wahltag vom Tag der Befragung entfernt liegt, desto höher ist die Volatilität der Stimmung beziehungsweise Willensbildung. Bis zum Wahltag können sich Trends und Wahlabsichten noch deutlich verändern.

Die 18-Uhr-Prognose (Exit Poll) am Wahltag ist die zuverlässigste Vorhersage, da die Wähler befragt werden, nachdem sie ihre Stimme abgegeben haben. Es gibt darum keine unentschlossenen Wähler. Beim Exit Poll wird nicht die Wahlabsicht, sondern das tatsächliche Abstimmungsverhalten erhoben.

Welche Faktoren fließen in die Projektion ein? Da wären der sogenannte Mitläufereffekt und der Underdog-Effekt zu nennen. In beiden Fällen geben die Befragten bewusst nicht ihre tatsächliche Präferenz an. Beim Mitläufereffekt schließen sie sich der vorherrschenden und politisch erwünschten Meinung an, insbesondere, wenn die eigene nicht opportun erscheint. Dies zeigte sich beispielsweise bei den im Vergleich zu Vorhersagen überraschend hohen Erfolgen der AfD bei den Landtagswahlen 2016.

Wenn die Befragten aus Protest „Luft ablassen wollen“ und bei der Wahlbefragung die Minderheitsmeinung beziehungsweise die politisch nicht erwünschte Meinung vertreten, wird dies als Underdog-Effekt bezeichnet. So verhalten sich mitunter verärgerte Stammwähler, um auf Missstände aufmerksam zu machen. Darüber hinaus werden langfristige Parteibindungen und die Frage, wie gut man sich an das letzte relevante Wahlergebnis erinnern kann, in die Projektion einbezogen. Nicht auszuschließen ist sicherlich, dass eine gute Portion Bauchgefühl des Wahlforschers in die Projektion einfließt.

Eine spezielle Personengruppe, die nur bei Wahlbefragungen auftritt, sind die unentschlossenen Wähler. Ihr potenzielles Wahlverhalten versucht man ebenfalls bei der Projektion zu berücksichtigen. Den Nichtwählern in den Kopf zu schauen, ist am schwierigsten, zu unterschiedlich sind die Motivationen, nicht zur Wahl zu gehen. Grundsätzlich gilt, je höher der Anteil der Nichtwähler, desto höher ist auch die Unsicherheit der aktuellen Prognose.

Ein wichtiger Punkt, der häufig bei der Interpretation von Wahlbefragungen unterschätzt wird, ist die Mobilisierbarkeit von Wählern. Potenzielle Stammwähler können zu Hause bleiben oder werden durch bestimmte Themen oder Persönlichkeiten motiviert, doch zu wählen.

Was es mit den Schwankungsbreiten auf sich hat

Trotz Zufallsauswahl und Repräsentativität der 1.000 bis 2.000 Befragten bleibt eine statistische Ungenauigkeit, da eben nicht alle Wahlberechtigten befragt werden können. Um sie zu berechnen, gibt es statistische Methoden, die die Größe der Stichprobe und den Anteilswert einer Partei einbeziehen.

Wenn sich beispielsweise aus einer zufälligen, repräsentativen Befragung von 1.000 Wahlberechtigten ein Wert von 35 Prozent für eine Partei als Rohdatenwert ergibt, wird dieser durch die gegebene Projektion zu einem Wert von 31 Prozent transformiert. Jetzt kann man für diesen Wert die Schwankungsbreite unter Annahme einer vorgegebenen Sicherheit bestimmen. Üblicherweise beträgt die vorgegebene Sicherheit 95 Prozent. Es ergibt sich für die Untergrenze der Schwankungsbreite ein Wert von 28,24 Prozent und für die Obergrenze ein Wert von 33,97 Prozent.

Demnach liegt der Fehlerbereich bei einem prognostizierten Projektions-Ergebnis von 31 Prozent für eine Partei bei etwa +/- 2,8 Prozentpunkten. Das ist eine ganze Menge und bedeutet: Würde man 100 repräsentative Wahlbefragungen mit jeweils 1.000 Personen durchführen, lägen bei 95 von ihnen die Anteilswerte zwischen 28,24 und 33,97 Prozent. Bei fünf Befragungen würden die prognostizierten Werte außerhalb dieses Bereichs liegen. Der Fehlerbereich gibt also an, wie gut man von 1.000 Befragten auf alle Wahlberechtigten schließen kann.

Bei einem erwarteten Anteilswert von 31 Prozent für eine Partei kann man also mit fast hundertprozentiger Sicherheit sagen, dass die sieben großen Forschungsinstitute Allensbach, Emnid, Forsa, Forschungsgruppe Wahlen, GMS, Infratest Dimap und INSA Anteilswerte für diese Partei zwischen 28,24 und 33,97 Prozent liefern werden.

Auffällig wäre jedoch, wenn ein Institut sehr häufig zu kleine oder zu hohe Werte für eine Partei prognostiziert. Das ließe darauf schließen, dass dieses Institut bei seinen Projektionen entsprechende Gewichtungsfaktoren einfließen lässt.

Die magische 7,4-Prozent-Grenze

Kleinere Parteien haben häufig das Problem der Fünf-Prozent-Hürde. Daher ist für sie die Frage, bei welchem prognostizierten Wert der (Wieder-)Einzug in den Bundestag als sicher angenommen werden kann, von existenzieller Bedeutung. Auch hierfür bietet die Statistik eine Lösung: Es sind ca. 7,4 Prozent. Das bedeutet, bei einem auf Grund der Projektion zu erwartenden Wert von 7,4 Prozent beträgt bei 1.000 Befragten die Wahrscheinlichkeit für ein Ergebnis unter fünf Prozent fast Null. Die 29 bis 30 Kandidaten von kleinen Parteien auf den vorderen Listenplätzen können erst bei einer stabilen Prognose von 7,4 Prozent und mehr ruhiger schlafen.

Selbst wenn sich alle sieben großen Meinungsforschungsinstitute einig sein sollten und für eine Partei sechs Prozent vorhersagen, ist die Fünf-Prozent-Hürde noch nicht sicher geschafft. Wie viele Meinungsforschungsinstitute ein Ergebnis prognostizieren, ist nicht relevant – wegen der Schwankungsbreite kommt es auf die magische Grenze an.

Fazit

Welche Parteien mit ihren Strategien letztlich am erfolgreichsten sind, ist mit Gewissheit erst am Wahltag zu sagen. Im Vorfeld geben Umfragen Orientierung, spiegeln Trends wider und schaffen Transparenz. Auch wenn durch die Black-Box, das „Hexenwerk“ der Projektion, die Gefahr der Manipulation durch Meinungsforschungsinstitute besteht, ist diese doch als gering einzustufen. Die meisten Unterschiede sind einfach der statistischen Unsicherheit geschuldet. Außerdem kann die Projektion auch gut validiert werden, da alle vier Jahre die realen Werte zweifelsfrei bekannt sind. Kein Meinungsforschungsinstitut kann es sich dauerhaft leisten, auf diese Validierung zu verzichten. Es kommt – wie so häufig – auf die richtige Interpretation von Zahlen an.