Stichprobenziehung und Repräsentativität

Über den Begriff der Repräsentativität von Stichproben gibt es viele Missverständnisse. Aber auch innerhalb der Umfrageforschung handelt es sich um einen teils umstrittenen Begriff.

Erfolg seit 2004

Über den Begriff der Repräsentativität von Stichproben gibt es viele Missverständnisse. Aber auch innerhalb der Umfrageforschung handelt es sich um einen teils umstrittenen Begriff. Viele Studierende streben hohe Stichprobengrössen und Ausschöpfungsraten an, um repräsentative Schlüsse aus ihren Analysen ziehen zu können. Der folgende Beitrag argumentiert, dass diese Kennzahlen in der Regel keinen Einfluss auf die Repräsentativität einer Stichprobe haben. Stattdessen ist das Auswahlverfahren der befragten Personen von entscheidender Bedeutung.

Zufallsauswahl als Bedingung für Repräsentativität

Häufig wird angenommen, dass eine beeindruckend hohe Anzahl befragter Personen ausreicht, um repräsentative Schlüsse für eine grössere Grundgesamtheit zu ziehen. Als Grundgesamtheit wird der Teil einer Population bezeichnet, aus dem eine Stichprobe gezogen wird, um mithilfe der Inferenzstatistik Aussagen über ebendiese Bevölkerungsgruppe zu treffen. Zum Beispiel wird häufig angestrebt, die deutschsprachige Wohnbevölkerung ab einem Alter von 18 Jahren zu untersuchen.

Die Stichprobengrösse als alleiniger Indikator für Repräsentativität lässt ausser Acht, über welchen Auswahlmechanismus diese Personen für die Umfrage gewonnen wurden. Entscheidendes Kriterium für die Repräsentativität einer Stichprobe ist jedoch die Zufallsauswahl der befragten Personen. Das wird deutlicher, wenn man sich folgendes Beispiel vor Augen führt:

Durch eine Umfrage in einer Fussgängerzone kann leicht eine hohe Stichprobengrösse erreicht werden. Bezeichnet man diese Stichprobe aber als repräsentativ, lässt man ausser Acht, dass sich diese Personen allein durch ihre Anwesenheit in der Fussgängerzone systematisch von Menschen unterscheiden, die dort nicht anzutreffen sind. Personen in den Innenstädten könnten z. B. überdurchschnittlich gesünder und mobiler sein, neigen eher zu sozialen Interaktionen, verfügen über eine höhere Kaufkraft oder leben eher in einem städtischen Umfeld. Ähnliche Abweichungen ergeben sich in der Regel für Umfragen im Internet, sodass auch an Onlineumfragen Teilnehmende andere Eigenschaften haben als Personen, die entweder keinen Onlinezugang haben oder keine Teilnahmebereitschaft aufweisen.

Es ist leicht vorstellbar, dass eine Ansprache in der Fussgängerzone oder im Internet andere Ergebnisse liefert als eine zufällig ausgewählte Personengruppe. Dieser Zufallsmechanismus stellt auf Grundlage statistischer Gesetzmässigkeiten sicher, dass sich die Kennzahl einer Stichprobe dem der Grundgesamtheit nähert. Aus diesem Grund arbeiten auch Meinungsforschungsinstitute mit Zufallsstichproben, die aus einem Pool gezogen werden, der als Auswahlrahmen bezeichnet wird. Geeignete Auswahlrahmen sind beispielsweise Telefonverzeichnisse, Einwohnermelderegister oder eine Liste aller Schülerinnen und Schüler einer Bildungseinrichtung. Der Auswahlrahmen bzw. die Liste sollte die untersuchte Grundgesamtheit also möglichst exakt abbilden. Der Zufallsmechanismus stellt sicher, dass für jede Person innerhalb des Auswahlrahmens eine exakte Auswahlwahrscheinlichkeit angegeben werden kann. Genau genommen sind nur in diesem Fall inferenzstatistische Verfahren anwendbar.

Abbildung 1: Vergleich willkürliche vs. zufällige Auswahl.

Die Abbildungen verdeutlichen den Unterschied zwischen einer willkürlichen und einer zufälligen Auswahl. Während man links Personen aus einem bestimmten Umfeld und mit ähnlichen Eigenschaften wählt, bildet die Zufallsauswahl rechts einen Querschnitt der Grundgesamtheit ab.

Auch die Ausschöpfungsrate einer Umfrage, also der Anteil der Rückläufer an der Summe der ausgewählten Personen, hat in vielen Fällen keinen Einfluss auf deren Repräsentativität. Anders als man zunächst vermuten könnte, hängt die Teilnahmebereitschaft einer Person nämlich häufig nicht mit ihrem Antwortverhalten in der Umfrage zusammen. Eine Verzerrung durch eine niedrige Ausschöpfungsrate ergibt sich also nur in den Fällen, in denen sich das Antwortverhalten von Respondenten (Teilnehmenden) und Nonrespondenten (nicht Teilnehmenden) unterscheidet. In der Umfragemethodik unterscheidet man daher zwischen verschiedenen Ausfallprozessen. Fallen Personen völlig zufällig („missing completely at random“, MCAR) aus der Stichprobe, ergeben sich daraus auch bei geringer Ausschöpfung keine Verzerrungen. Sozialwissenschaftliche Bevölkerungsumfragen erreichen daher auch mit einer Ausschöpfungsrate um 30 % repräsentative Ergebnisse.

Repräsentativität einer Stichprobe in studentischen Arbeiten

Eine echte, repräsentative Zufallsstichprobe ist im Rahmen einer Seminar- oder Abschlussarbeit kaum zu realisieren. Häufig liegt das Augenmerk in diesen Arbeiten aber auch nicht auf einer methodisch einwandfreien Zufallsstichprobe, sondern auf der korrekten Anwendung statistischer Verfahren. Bei den meisten studentischen Arbeiten handelt es sich um eine Stichprobe aus dem persönlichen Umfeld oder sozialen Medien, die methodisch als willkürliche Stichprobe bezeichnet werden muss. Entscheidend ist daher, reflektiert mit dem Auswahlmechanismus einer Stichprobe umzugehen und mögliche Unzulänglichkeiten zu benennen. Die Zuhilfenahme von Literatur zum Thema Stichprobenziehung und Umfragemethodik ist ohnehin anzuraten.

Die konkrete Ausgestaltung hängt aber häufig auch von den methodischen Ansprüchen der Dozentinnen oder Dozenten ab, sodass entsprechende Nachfragen und Vorgespräche Unsicherheiten beseitigen können. In keinem Fall sollte Repräsentativität einfach unterstellt werden, auch dann nicht, wenn die Stichprobe bestimmte Quoten erfüllt. Bei einer solchen Quotenstichprobe strebt man an, das Verhältnis der Geschlechter oder Altersgruppen innerhalb einer Grundgesamtheit bei der Zusammenstellung der Stichprobe nachzubilden.

In der Umfrageforschung ist es jedoch umstritten, ob eine solche Quotenstichprobe repräsentative Anforderungen erfüllt. Kritische Stimmen merken u. a. an, dass dabei der Einfluss der auswählenden Person zu hoch und die Auswahlwahrscheinlichkeit einzelner Merkmalstragender unbekannt ist. Befürwortende hingegen betonen den im Vergleich zu Zufallsstichproben geringeren Aufwand und führen an, dass Quotenstichproben eine ebenso hohe Genauigkeit wie Zufallsstichproben erreichen. So arbeitet beispielsweise das bekannte Institut für Demoskopie Allensbach (IfD) mit Quotenstichproben und erreicht damit Ergebnisse, die mit Resultaten aus Zufallsstichproben vergleichbar sind. Nach Rücksprache mit der Dozentin oder dem Dozenten kann eine Quotenstichprobe also eine geeignete Alternative sein, sofern eine willkürliche Auswahl vermieden werden soll.

Zusammenfassung:

  • Voraussetzungen für die Repräsentativität einer Stichprobe:
    • Die Stichprobe ist eine Zufallsstichprobe aus einer definierten Grundgesamtheit.
    • Die Ausfallprozesse der Nicht-Teilnehmenden sind zufällig und hängen nicht systematisch mit den Inhalten einer Umfrage zusammen. Hat die Teilnahmeverweigerung von ausgewählten Personen systematische Gründe, sind diese Ausfälle unter Umständen korrigierbar (Stichwort Ausfallprozesse).

Weiterführende Literatur:

  • Baur, N., Blasius, J. (Hrsg.) (2014). Handbuch Methoden der empirischen Sozialforschung. Wiesbaden: Springer.
  • Döring, N., Bortz, J. (2016). Forschungsmethoden und Evaluation. Wiesbaden: Springer.
  • Wolf, C., Best, H. (Hrsg.) (2010). Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesbaden: Springer.