abhängige Stichproben
t-Tests für abhängige Stichproben
Eine weitere Variante des t-Tests sind solche für abhängige, verbundene oder gepaarte Stichproben. Wie der Name bereits vermuten lässt, wendet man diesen an, wenn die Stichprobeneinheiten bzw. Messungen auf unterschiedliche Weise miteinander verbunden sind. Das ist z. B. der Fall, wenn man an denselben Personen mehrere Messungen durchführt. Man könnte bspw. den Akzeptanzwert von Personen für Laborfleisch vor einem Treatment in Form eines Informationsfilms messen, um im Anschluss eine weitere Messung durchzuführen. Sind signifikante Mittelwertunterschiede das Ergebnis, so ist die Veränderung des Akzeptanzwertes mit hoher Wahrscheinlichkeit auf das Treatment zurückzuführen.
Nicht vergessen
Je nach Quelle entsprechen z. B. Werte ab r = 0,10 einem schwachen, ab 0,30 einem mittleren und ab 0,50
Um abhängige Stichproben handelt es sich aber auch, wenn die Stichprobeneinheiten auf natürliche Weise miteinander verbunden sind, z. B. im Falle von Ehepaaren. In allen Fällen kann von einer Beeinflussung des Messwertes durch die verbundene Stichprobeneinheit bzw. die vorangegangene Messung ausgegangen werden.
Wie für den t-Test für unabhängige Stichproben ist auch für den t-Test für abhängige Stichproben Voraussetzung, dass die abhängige Variable eine metrische Skalierung besitzt. Wenn eine Stichprobe weniger als 30 Einheiten umfasst, sollte zudem auf Normalverteilung der Differenzen zwischen den verbundenen Messwerten getestet werden. Abhängigkeiten dürfen darüber hinaus lediglich innerhalb der verbundenen Einheiten bestehen, nicht darüber hinaus. Konkret wird z. B. eine statistische Verbindung innerhalb eines Ehepaares angenommen, nicht aber über die Ehepaare hinweg.
Für das Anwendungsbeispiel wird erneut ein Datensatz mit 40 Stichprobeneinheiten verwendet. In diesem Beispiel wird an jeder Person zweimalig eine Messung vorgenommen. Zu beiden Messzeitpunkten sollten die Personen auf einer siebenstufigen Ratingskala von „stimme überhaupt nicht zu“ (1) bis „stimme voll und ganz zu“ (7) angeben, wie hoch ihre Akzeptanz für Laborfleisch ist. Die entsprechenden Variablen werden als „messung_t1“ für den ersten und „messung_t2“ für den zweiten Messzeitpunkt bezeichnet. Zwischen den Messzeitpunkten haben sich die Personen einen Aufklärungsfilm über das Thema gesehen.

Zum t-Test für abhängige Stichproben gelangt man über das Menü „Analysieren“, „Mittelwerte vergleichen“ und schliesslich „t-Test für verbundene Stichproben“. Das nachfolgende Dialogfeld zeigt auf der linken Seite die im Datensatz verfügbaren Variablen an. Neben „Paar“ auf der rechten Seite wird nun definiert, welche Variablen die verbundenen Messungen beinhalten. Per Drag and Drop oder durch Betätigung des blauen Pfeils werden die Variablen nun zugeordnet. Als Variable 1 wird „messung_t1“, als Variable 2 „messung_t2“ festgelegt. Da zudem analog zum o. g. Beispiel die Effektstärke von Interesse ist, wird das Häkchen bei „Effektgrössen schätzen“ gesetzt. Nach Bedarf können unter „Optionen“ ausserdem Konfidenzintervall und Behandlung fehlender Werte verändert werden.


Die Einstellungen werden mit „OK“ bestätigt und SPSS produziert die gewünschte Ausgabe. Auch hier werden zunächst deskriptive Statistiken in der Tabelle „Statistik bei gepaarten Stichproben“ dargestellt. Bereits hier lässt sich erkennen, dass sich die Akzeptanzwerte für Laborfleisch im Mittel von 3,78 bei der ersten Messung auf 4,63 bei der zweiten Messung erhöht haben. SPSS berechnet anschliessend „Korrelationen bei gepaarten Stichproben“.
Bereits erwähnt wurde die Annahme, dass die Messungen zu beiden Zeitpunkten durch ihre Verbundenheit miteinander korrelieren. Der Wert r = 0,859 weist auf eine hohe Korrelation, sodass die Akzeptanzwerte zum zweiten Messzeitpunkt in engem Zusammenhang mit den Akzeptanzwerten zum ersten Messzeitpunkt stehen.
Die zentralen Ergebnisse des t-Tests folgen in der Tabelle „Test bei gepaarten Stichproben“. In der Spalte „Mittelwert“ lässt sich die Mittelwertdifferenz zwischen den Messzeitpunkten ablesen, der hier -0,850 beträgt. Anschliessend folgen die Teststatistiken des t-Tests. Zur abschliessenden Beurteilung der Mittelwertdifferenzen ist vor allem der Signifikanzwert von Interesse, der im Beispiel bei p = 0,000 liegt. Damit zeigt sich, dass der Aufklärungsfilm einen signifikanten Einfluss auf die Akzeptanzwerte für Laborfleisch hat.
Die Effektstärke lässt sich anhand der Tabelle „Effektstärke bei Stichproben mit paarigen Werten“ beurteilen. Auch hier wird Cohens d ausgewiesen, dessen Wert im Beispiel bei d = -0,809 liegt. Damit kann ein starker Effekt abgeleitet werden. Auch hier sollte man auf „Hedges‘ Korrektur“ ausweichen, wenn eine sehr kleine Stichprobe vorliegt.

Die Syntax zur Durchführung des t-Tests bei abhängigen Stichproben wird mit „T-TEST PAIRS“ eingeleitet, woraufhin die Variablennamen der verbundenen Messungen definiert werden. Anschliessend werden Ausgabe von Effektgrössen, Konfidenzintervall und Umgang mit fehlenden Werten festgelegt.
T-TEST PAIRS=messung_t1 WITH messung_t2 (PAIRED)
/ES DISPLAY(TRUE) STANDARDIZER(SD)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.