Das Skalenniveau von Variablen

Eigenschaften der drei Skalenniveaus mit Beispielen

Erfolg seit 2004

Das Wissen über das Skalenniveau bzw. Messniveau von Variablen ist einer der zentralen Gesichtspunkte bei der Erstellung eines Fragebogens und der Wahl der statistischen Methoden zur Prüfung von Hypothesen. Konkret ist das jeweils vorliegende Skalenniveau abhängig von der Art der Antwortausprägungen eines Items. Nachdem ein anderer Artikel bereits Frageformen behandelt und Antwortausprägungen am Rande berührt hat, liegt das Augenmerk nun auf einem Überblick über die drei Skalenniveaus.

Skalenniveaus

 

Grundsätzlich kann zwischen einer Nominalskala, einer Ordinalskala und einer metrischen Skala unterschieden werden. Bevor die jeweiligen Eigenschaften und Besonderheiten der Skalentypen vorgestellt werden, kann man bereits eine grobe Differenzierung nach Informationsgehalt vornehmen. Stellt man sich ein Kontinuum von „minimaler Informationsgehalt“ bis „maximaler Informationsgehalt“ vor, so könnten die Skalentypen wie folgt zugeordnet werden. Oft ist daher auch die Rede von niedrigen und hohen Skalenniveaus.

Nominalskala

Das Skalenniveau mit dem geringsten Informationsgehalt ist die Nominalskala. Sie folgt einer geschlossenen Frage ohne Reihenfolge der Antwortvorgaben und wird beispielsweise verwendet, um Gruppenzugehörigkeiten zu erfassen. Innerhalb der Antwortausprägungen einer Nominalskala kann also keine sinnvolle Reihenfolge gebildet werden. Am Beispiel der Erfassung des Geschlechts von befragten Personen wird das deutlich, hier stehen in der Regel maximal drei Antwortoptionen ohne Rangfolge zur Verfügung.

Antwortoptionen

In Abhängigkeit der Anzahl der dargebotenen Antwortausprägungen kann eine Nominalskala weiter unterschieden werden. Ein erster Spezialfall ist die dichotome Skala, die dann vorliegt, wenn die Antworten lediglich zwei Stufen umfassen (z. B. „ja“ und „nein“). In diesem Fall will die forschende Person erfassen, ob ein Merkmal vorhanden ist oder nicht, also z. B., ob eine Person raucht oder ein Auto besitzt.

Liegt hingegen ein nominalskaliertes Item mit mehr als zwei Antwortausprägungen vor, so handelt es sich um eine polytome Antwortskala. Fragt man Personen nach dem Bundesland, in dem ihr Hauptwohnsitz liegt, ist genau eine Antwort zutreffend. Zugleich kann auch aus diesen Antwortausprägungen, den 16 deutschen Bundesländern, keine sinnvolle Reihenfolge gebildet werden. Gleiches gilt z. B. auch für die Frage nach der Partei, die bei der letzten Bundestagswahl gewählt wurde.

Häufig werden die ursprünglichen Ausprägungen einer Antwortskala verwendet, um sie in andere Werte zu überführen bzw. zu transformieren. Wenn der vollständige Informationsgehalt erhalten bleiben soll, darf die numerische Ausprägung der Nominalskala (z. B. 1 = „ja“, 2 = „nein“) nach der Transformation weiterhin nur die Werte der ursprünglichen Ausprägung enthalten (z. B. 0 = „nein“, 1 = „ja“) (Eindeutigkeitstransformation).

Nominalskala

Häufig nimmt man aber bewusst einen Informationsverlust in Kauf, indem man Unterschiede in aggregierten Gruppen untersucht. Man könnte z. B. die nominalskalierte Variable der 16 Bundesländer als Ausgangspunkt verwenden, um mithilfe einer neuen Variable dichotom zwischen Befragten aus den alten und neuen Bundesländern zu unterscheiden.


Ordinalskala

Eine Ordinalskala resultiert im Falle einer geschlossenen Frage mit geordneter Reihenfolge der Antwortkategorien. Sie wird also dann verwendet, wenn eine sinnvolle Reihenfolge gebildet, aber der Wert der einzelnen Antwortausprägungen nicht genau quantifiziert werden kann. Fragt man Personen nach der Wohndichte ihres Wohnortes und bietet ihnen fünf Ausprägungen „Einzelhof auf dem Land“, „Kleines Dorf“, „Mittleres Dorf“, „Kleinstadt“ und „Grossstadt“, handelt es sich um eine Ordinalskala. Zwar kann aus der Skala abgeleitet werden, dass eine Grossstadt urbaner ist als ein kleines Dorf, aber es lässt sich nicht bemessen, ob eine Person in einer Grossstadt doppelt oder dreimal so urban lebt wie eine Person auf dem Dorf.

Reihenfolge Antwortausprägungen

Die geordnete Reihenfolge der Antwortausprägungen muss den befragten Personen dabei intuitiv verständlich sein. Dies gelingt in der Regel, indem höhere Werte eine stärkere Ausprägung beinhalten. Es sollte im vorliegenden Beispiel also vermieden werden, der Grossstadt den Wert 1 und einem kleinen Dorf den Wert 5 zuzuordnen.

Im Falle der Ordinalskala wird keine weitere Typisierung in Abhängigkeit von der Anzahl der Antwortausprägungen vorgenommen. Eine Ordinalskala mit 3 Ausprägungen ist ebenso denkbar wie eine mit 10 oder mehr Ausprägungen, wobei einschränkend die methodischen Grundsätze der Frage- und Antwortformulierung beachtet werden sollten.

Will man eine ordinalskalierte Variable unter Beibehaltung aller Informationen transformieren, so muss die Reihenfolge der Ausprägungen erhalten bleiben (monotone Transformation). Davon unabhängig lassen sich auch aus einer ordinalen Skala neue Variablen berechnen, die beispielsweise befragte Personen mit einer bestimmten Antwortausprägung markieren oder Antwortausprägungen für eine übersichtliche grafische Darstellung zusammenfassen (z. B. addierter Anteil der Befragten, die mit „stimme eher nicht zu“ oder „stimme nicht zu“ antworten).


Metrische Skala

Die metrische Skalierung (auch Kardinalskala) verfügt über den höchsten Informationsgehalt. Sie ist im Ansatz vergleichbar mit einer Ordinalskala, jedoch lässt sich innerhalb der Antwortausprägungen nicht nur eine sinnvolle Reihenfolge bilden, sondern die Abstände zwischen den Skalenpunkten sind zusätzlich quantifizierbar. In Fragebögen treten Items mit metrischer Skalierung z. B. auf, wenn eine Ratingfrage vorliegt oder befragte Personen Körpergrösse oder -gewicht angeben sollen. Man kann sich eine metrische Skala also als Massband vorstellen, das verschiedenste Einheiten erfassen kann.

Auch die metrische Skala kann weiter nach Intervallskalen und Verhältnisskalen unterschieden werden. Im Falle der häufiger verwendeten Intervallskala liegt kein natürlicher Nullpunkt vor aber die Abstände zwischen den Ausprägungen sind gleich. Beispiele sind Temperaturmessungen oder Jahresangaben, da der jeweilige Nullpunkt einer willkürlichen Interpretation unterliegt. Eine Transformation der Skala unter Beibehaltung der relativen Abstände kann im Zuge einer linearen Transformation erfolgen. Ein Anwendungsfall ist die Umrechnung der Temperatur von Grad Celsius in Grad Fahrenheit.

Lineare Transformation

Kann neben gleichen Abständen zusätzlich ein natürlicher Nullpunkt definiert werden, handelt es sich um eine Verhältnisskala oder Ratioskala. Die o. g. Beispiele Körpergrösse und -gewicht oder die Anzahl der Kinder werden auf einer solchen Verhältnisskala abgebildet. Hier kann jeweils klar definiert werden, wo der Nullpunkt der erfragten Grössen liegt (das mögliche Spektrum der Anzahl der Kinder einer befragten Person beginnt bei 0). In diesem Fall kann eine Ähnlichkeitstransformation vorgenommen werden, die den natürlichen Nullpunkt der Skala erhält. So kann z. B. das Körpergewicht von Kilogramm in die Einheiten Gramm oder Pounds umgerechnet werden.

Fazit Skalenniveaus

Grundsätzlich besteht das Ziel, mithilfe einer Skala einen möglichst hohen Informationsgehalt zu erreichen. Die Transformation einer nominalen Skala auf eine Skala mit mehr Informationen ist im Nachhinein nicht möglich. Hat man zur Erfassung von Elternschaft bspw. nur eine dichotome Ja-Nein-Frage gestellt und stellt im Nachhinein fest, dass auch die Anzahl der Kinder von Interesse ist, lassen sich diese Informationen nicht mehr aus den Daten ableiten. Umgekehrt kann aus einer Verhältnisskala zur Erfassung der Anzahl von Kindern leicht eine Variable mit dichotomen Ausprägungen erstellt werden, die die Elternschaft erfasst.

Nominalskala (Geschlecht)Ordinalskala (Wohndichte)Metrische Skala (Anzahl Kinder)
AusprägungWertAusprägungWertAusprägungWert
1Weiblich1Einzelhof auf dem Land11 Kind
2Männlich2Kleines Dorf22 Kinder
3Divers3Mittleres Dorf33 Kinder
4Kleinstadt44 Kinder
5Grossstadt55 Kinder

 


 

Weiterführende Literatur:
Kähler, W.-M. (2010). Statistische Datenanalyse. Verfahren verstehen und mit SPSS gekonnt einsetzen. Wiesbaden: Vieweg + Teubner, Springer Fachmedien.
Müller-Benedict, V. (2001). Grundkurs Statistik in den Sozialwissenschaften. Wiesbaden: VS Verlag für Sozialwissenschaften.