next up previous contents
Next: Probleme der Metaanalyse Up: Mehr Effektgrößen - Metaanalyse. Previous: Mehr Effektgrößen - Metaanalyse.

Ein Beispiel

Der Input für eine Metaanalyse sind Effektgrößen aus Einzelstudien, aus denen dann, und das ist meist das Hauptanliegen der Metaanalyse, der Populationseffekt geschätzt werden soll. Tabelle 2 zeigt die Effektgrößen (Korrelationen) aus 30 fiktiven Studien zur Wirksamkeit von Aufmerksamkeitstrainings. ``Programm X'' und ``Programm Y'' unterscheiden sich nach Ansicht der Experten nur geringfügig und sollen deshalb einer gemeinsamen Analyse unterworfen werden. In jeder der 30 Studien wurde eine Kontrollgruppe mit einer Experimentalgruppe verglichen und die Stichprobengröße pro Gruppe war jeweils n=20.

Tabelle 2: Ergebnisse aus 30 hypothetischen Studien, in denen Programm X, bzw. Programm Y mit je einer Kontrollgruppe verglichen wurde. Der Treatment-Effekt (Ergebnis für Trainingsgruppe minus Ergebnis für Kontrollgruppe) ist als r wiedergegeben. Die Werte sind Zufallsziehungen aus zwei Stichprobenverteilungen mit den vorgegebenen Mittelwerten rho =.24 und rho=.44 für Programm X und Programm Y respektive.
r Programm signifikant (alpha=.05, zweiseitig)
0.41 X ja
0.63 Y ja
0.50 Y ja
0.52 Y ja
0.43 Y ja
0.02 X nein
0.39 X ja
0.53 X ja
0.31 Y nein
0.36 Y ja
0.43 X ja
0.15 X nein
0.33 X ja
0.33 X ja
0.32 Y ja
0.22 X nein
0.68 Y ja
0.20 X nein
0.18 X nein
0.33 Y ja
0.62 Y ja
0.21 Y nein
0.45 X ja
0.39 Y ja
0.44 Y ja
0.41 X ja
0.11 X nein
0.14 X nein
0.46 Y ja
0.33 Y ja

Zunächst werden in der psychometrischen Metaanalyse die einzelnen Effektgrößen von Artefakten gesäubert, worauf an dieser Stelle nicht eingegangen werden kann (siehe hierzu Hunter & Schmidt, 1990 [42]). Danach wird der mit der Stichprobengröße gewichtete durchschnittliche Effekt berechnet: tex2html_wrap_inline1251, wobei tex2html_wrap_inline1253 für die Gesamt-Stichprobengröße in Studie i (konstant N=40 in unserem Beispiel) und tex2html_wrap_inline1259 für den in Studie i gefundenen Effekt steht. Der gesuchte Mittelwert für unsere 30 Studien ist tex2html_wrap_inline1263=.36. Beim nächsten Schritt wird klar, warum dieses Verfahren ``psychometrische Metaanalyse'' genannt wurde. In Analogie zur in der klassischen Testtheorie verwendeten Formel tex2html_wrap_inline1265 - das beobachtete Testergebnis tex2html_wrap_inline1267 setzt sich zusammen aus dem ``wahren Wert'' tex2html_wrap_inline1269 und einem Fehleranteil tex2html_wrap_inline1271 - verwenden Hunter und Schmidt (1990) [42] die folgende Gleichung: tex2html_wrap_inline1273 - die Varianz der analysierten Stichproben-Korrelationen setzt sich zusammen aus der Varianz der Populations-Korrelationen und der beim Ziehen von Zufallsstichproben zu erwartenden Fehler-Varianz. Wenn nun die Varianz in den gefundenen Effektgrößen ausschließlich durch den Stichprobenfehler zustande kam, müßte die Varianz der Populations-Korrelationen 0 sein. Dies würde dann heißen, daß die Effektgrößen aus einer einzigen Population (und nicht aus mehreren unterschiedlichen Populationen) stammen. Wie steht es nun in unserem Beispiel damit? Die Fehler-Varianz (tex2html_wrap_inline1275) und die Varianz der Stichprobenkorrelationen (tex2html_wrap_inline1277) werden folgendermaßen berechnet (Hunter & Schmidt, 1990, S. 108-109 [42] - die Autoren verwenden in ihren Beispielen konsistent das Symbol tex2html_wrap_inline1279 anstelle von s):
displaymath1283
und
displaymath1285
wobei tex2html_wrap_inline1287 der Mittelwert aller Stichprobengrößen pro Studie ist. In unserem Beispiel (mit den Werten aus Tabelle 2) ist tex2html_wrap_inline1275 =.0194 und die mit der Stichprobengröße pro Studie gewichtete Varianz der Stichproben-Korrelationen ist tex2html_wrap_inline1277 =.0246. Die Varianz der Populations-Korrelationen ist somit tex2html_wrap_inline1293 =.0052. Diese Varianz ist zwar verhältnismäßig klein, schließt aber nicht aus, daß der gefundene durchschnittliche Effekt nicht einen, sondern mehrere Populationseffekte repräsentiert. Der nächste Schritt ist deshalb, nach theoretisch fundierten Moderatorvariablen zu suchen. Eine solche Moderatorvariable in unserem Beispiel ist die Art des angewandten Programms, X oder Y. Die Ergebnisse der entsprechenden Analyse dieser zwei Subgruppen sind, zusammen mit den ursprünglichen Ergebnissen, in Tabelle 3 aufgelistet.

Tabelle 3: Ergebnisse der psychometrischen Metaanalyse (gerundet) aufgeteilt nach ``Programm X'' versus ``Programm Y''. Die Ergebnisse f"ur die Gesamtgruppe (``kombiniert'') sind zum Vergleich nochmals dargeboten.
Programm X Programm Y kombiniert
rMean .29 .44 .36
sigma2r .0212 .0169 .0246
sigma2e .0215 .0167 .0194
sigma2rho -.0003 .0002 .0052

Wenn man für die beiden Programme getrennte Analysen durchführt, werden die Varianzen der Populations-Korrelationen deutlich kleiner (-.0003 für Programm X und .0002 für Programm Y) als die Varianz der Populations-Korrelationen für alle 30 Studien (unterste Zeile in Tabelle 3).gif Dies deutet darauf hin, daß Programm X weniger wirksam ist als Programm Y. In der Tat wurden die Daten aus zwei unterschiedlichen Stichprobenverteilungen für r mit den Mittelwerten tex2html_wrap_inline1299=.24 und tex2html_wrap_inline1299=.44 für Programm X, bzw Programm Y mittels einer Computersimulation generiert.gif

 figure274
Abbildung 7: Stamm-und-Blatt Darstellung der Ergebnisse aus 30 hypothetischen Studien, in denen Programm X, bzw. Programm Y mit je einer Kontrollgruppe verglichen wurden (jeweils 15 Studien). Der Treatment-Effekt (Ergebnis für Trainingsgruppe minus Ergebnis für Kontrollgruppe) ist als r wiedergegeben. Die Werte sind Zufallsziehungen aus zwei Stichprobenverteilungen mit den Mittelwerten r=.24 und r=.44 für Programm X und Programm Y respektive.

Abbildung 7, eine Stamm & Blatt Darstellung der Information in Tabelle 2 zeigt (neben der Demonstration, daß ein Stamm & Blatt Diagramm eine viel kompaktere und übersichtlichere Darstellung erlaubt als eine Tabelle) eine für manche vielleicht erstaunliche Tatsache, die man leicht aus dem Blick verliert, wenn man die Ergebnisse von Einzelstudien beurteilt: Die Variation, die alleine aus dem Stichprobenfehler herrührt, ist enorm. Für Programm X variieren die Werte zwischen r=.02 und r=.53 und für Programm Y ergab die Simulation Werte zwischen r=.21 und r=.68. Diese kleine Demonstration verdeutlicht, daß das alleinige Auszählen von Signifikanzen keine zufriedenstellenden Ergebnisse liefern kann. Sie zeigt aber auch den Grund für die Wichtigkeit von Replikationen.


next up previous contents
Next: Probleme der Metaanalyse Up: Mehr Effektgrößen - Metaanalyse. Previous: Mehr Effektgrößen - Metaanalyse.

Methods of Psychological Research 1996, Vol.1, No.4
© 1997 Pabst Science Publishers