Zur Hauptseite  ..\

zur Glossarseite    Ohne Frames


Poweranalyse zur Bestimmung der Fallzahl

 

Am Anfang der Planung von Experimenten durchgeführte Analyse, um den notwendigen Umfang des Experimentes (z.b. Fallzahl) zu ermitteln.

Die Ermittlung der notwendigen Stichprobengrösse, um einen vorher festgelegte Effektgrösse mit einer vorher festgelegten statistischen Sicherheit nachweisen zu können.

Poweranalyse heisst auf deutsch Fallzahlanalyse oder Fallzahlschätzung. 

 

Generell benötigt man für eine Poweranalyse folgende Informationen:

Beispiel:

Es soll die folgende Hypothese überprüft werden: "Männer sind im Mittel um 6 cm grösser als Frauen".

 

Wie viele Personen müssen untersucht werden, damit dieser Grössenunterschied -sofern er in Wahrheit existiert- mit mindestens 95% Wahrscheinlichkeit durch die Untersuchung aufgedeckt wird? 

95% ist die Power der Untersuchung.

 

Die bisher gegebenen führen noch nicht zu maximaler Testaussage, deshalb soll dieses Beispiel weiterentwickelt werden:

Falls in Wahrheit Männer im Mittel nur um maximal 4 cm grösser sein sollten, dann soll die Untersuchung dies ebenfalls mit  95% Wahrscheinlichkeit zeigen.

Nun ist die Fragestellung umfassender:

Wie viele Personen muss man untersuchen, damit man mit 95 % Sicherheit einen wahren mittleren Grössenunterschied Mann-Frau von höchstens 4 cm und mindestens 6 cm in der Untersuchung erkennt? Die 2 cm zwischen den 4 und 6 cm werden als "bedeutsam" erachtet. Diesen bedeutsamen Unterschied bezeichnet man als Effektgrösse.

 

Das nun so formulierte Beispiel macht zwar keine Aussage darüber, wie sicher das Ergebnis ist, wenn der wahre mittlere Grössenunterschied zufällig genau zwischen 4 und 6 cm liegen würde. Es sagt aber aus, dass die Untersuchung mit 95% Wahrscheinlichkeit erkennt, wenn der mittlere Grössenunterschied in Wahrheit wenigstens 6 cm oder höchstens 4 cm beträgt.

 

Genau genommen fehlen in diesem Beispiel noch Angaben über die Verteilungsfunktion der Grössenverteilung.

Es sei angenommen, dass die Grössen beider Geschlechter normalverteilt sind mit einer Standardabweichung von 3 cm.

 

Mathematisch anschaulich passiert nun Folgendes:

Man denkt sich 2 Normalverteilungen mit den Mittelwerten 4 bzw. 6. Beide Standardabweichungen seien = 3.

Man zieht aus beiden Verteilungen viele (der Übersichtlichkeit halber gleich grosse) Stichproben und berechnet die Standardabweichung. Nach dem zentralen Grenzwertsatz erwartet man für die Standardabweichung der Stichproben den Wert 3/(n1/2), wobei n die Stichprobengrösse ist und n hinreichend gross sein muss, damit die Formel gültig ist.

 

Die Verteilung der Stichprobenmittelwerte beider Ausgangsverteilungen sind nach dem zentralen Grenzwertsatz also 2 Normalverteilungen, wieder mit den selben Mittelwerten, aber mit einer kleineren Standardabweichung, nämlich 3/(n1/2).

 

n ist der gesuchte Parameter. Gesucht ist derjenige Wert von n, bei dem die beiden Stichprobenmittelwertverteilungen gerade so schmal (oder breit) sind, dass das Lot des Schnittpunktes auf die horizontale Achse von jeder Verteilung genau 5% (=100-95%) der Fläche abschneidet.

Folgendes Bild verdeutlicht die Zusammenhänge.

Effektgrösse Beispiel

 

Den gesuchten Wert für n unter den zuvor genannten Bedingungen erhält man, indem man folgende Gleichung nach n auflöst:

Effektgrösse Beispiel  Hier bedeutet Z95 das 95% Quantil der Standardnormalverteilung und die Standardabweichung des Mittelwertes einer Stichprobe des Umfangs n.
4 bzw. 6 sind die Mittelwerte und 3 die beiden Standardabweichungen.

 -->

Z95 kann man mit der Excelformel STANDNORMVERT(0,95) berechnen: =1,6448.

Für n erhält man den Wert 24,35, also aufgerundet 25.

Man muss also 25 Paare, bestehend aus je einer Frau und einem Mann befragen, um mit 95 % Wahrscheinlichkeit einen wahren durchschnittlichen Grössenunterschied von wenigstens 6 cm oder höchstens 4 cm zu erkennen.

Dabei erhält man 25 Messwerte: 25 Grössendifferenzen der Paare.

Dieser Test wurde also als paarweiser Test aufgezogen. Man hat zwar 2*25=50 Leute befragt, jedoch nur 25 Messwerte.

 

Anmerkung 

Die allgemeine Form obiger Formel lautet: 

Effektgrösse, mit s : Standardabweichung der Stichprobe. 

1-a, weil von der linken Kurve der rechte kleine Teil interessiert, und 1-b, weil von der rechten Kurve der linke kleine Teil interessiert, dafürsteht vor dem Z ein Minus. Man kann statt -Z1-b auch +Zb schreiben.

Nach n umgeformt ergibt dies

, bzw. , mit h: Effektstärke 

Hätte man von jedem Geschlecht 25 Individuen befragt und den Mittelwert berechnet (ohne zu paaren), dann sieht die Sache anders aus. Dann hätte man nämlich 50 Messwerte anstelle 25.

Unter der Rubrik t-Test findet man für den Fall bekannter Varianzen die Formel

t-Test bekannte Varianzen

In unserem Beispiel ist s1 =s2 =3,   µ1=6,   µ2=4,   n1=n2=n.

Damit ergibt sich

Für n erhält man nun den Wert 12,17, also aufgerundet 13.

Bei dieser Testform genügen also bereits 13 Individuen je Geschlecht, um die oben beschriebenen Unterschiede mit 95% Wahrscheinlichkeit aufzudecken (falls sie tatsächlich vorhanden sind)

 

Siehe auch das Beispiel "Design eines 2-seitigen Stichprobentests", das zwar mit Poissonverteilungen arbeitet und andere Werte verwendet, im Gedankengang jedoch dem zuvor skizzierten Beispiel entspricht.

 

Bei umfangreichem und komlexem Datenmaterial kann es sinnvoll sein, über geschichtete Stichproben nachzudenken, da der Standardfehler dann unter Umständen erheblich kleiner ist und die Stichproben bei gleicher Aussagekraft kleiner ausfallen können.


Datenschutzhinweise