zurück zum Glossar (Kolmogorov - Smirnov Anpassungstest)
Kolmogorov Smirnov Anpassungstest (KS Anpassungstest)
Ein Anpassungstest.
Vorbemerkung
Testet eine unbekannte
Verteilungsfunktion gegen eine vollständig bekannte Verteilungsfunktion.
Eine Messreihe wird gegen explizite Verteilungsparameter getestet, die aus anderen Quellen stammen müssen. Damit liegt der Verteilungstyp, auf den getestet wird, vor dem Test bereits fest.
Lilliefors Variante des KS Anpassungstests
Testet eine unbekannte
Verteilungsfunktion gegen eine Verteilungsfunktion, deren
grundsätzlicher Typ zwar bekannt, die Verteilungsfunktionsparameter
jedoch unbekannt sind.
Testet 2 unbekannte
Verteilungsfunktionen auf Gleichheit.
Der Kolmogorov Smirnov Anpassungstest testet eine empirische (kumulierte) Verteilungsfunktion gegen eine (beliebige) Verteilung, deren Parameter vollständig bekannt sein müssen. (Falls unbekannt, dann Lilliefors Test). In den allermeissten praktischen Fällen ist unter "beliebig" Normalverteilung zu verstehen.
Kontinuierliches Skalenniveau.
Prüfgrösse ist die maximale Differenz der beiden Verteilungsfunktionen (an einer beliebigen Stelle).
Bei gerichteten (einseitigen) Tests nimmt man die gerichtete Differenz.
Meisstens testet man eine empirische Verteilungsfunktion gegen die Normalverteilung, in der Hoffnung, dass die empirische Verteilungsfunktion nicht systematisch von der Normalverteilung abweicht, damit man mit parametrischen Tests (die praktisch alle Normalverteilung verlangen) weiter auswerten kann.
Für Stichprobengrössen N < 40 sind die Schwellenwerte tabelliert. (Siehe Tabelle unten)
Für Stichprobengrössen N >40 gelten einfache Näherungen ~N-0,5
Nachteil des Kolmogorov Smirnov Anpassungstests ist seine geringe Sensitivität an den Randbereichen der Verteilungsfunktionen
Diesen Nachteil gleichen neuere Tests wohl aus, jedoch auf Kosten eines derart grossen Rechenaufwandes, dass man ohne Software kaum zu Rande kommt.
Siehe hierzu weitere Anpassungstests.
Beispiel:
Es soll überprüft werden, ob eine Messreihe normalverteilt ist mit Mittelwert 23 und Standardabweichung 4.
Also Nullhypothese: "Die Messwerte sind N(23;4)-verteilt".
0.) Ausgangsdaten
Messreihe | 21 | 19 | 29 | 26 | 24 |
1.) Aufsteigend geordnete Messreihe
Messreihe | 19 | 21 | 24 | 26 | 29 |
2.)
Ermittlung der Quantile der Normalverteilung N(23;4) zu den gegebenen Messwerten.
Die kann man mit der Excelfunktion NORMVERT(Messwert;23;4;wahr) durchführen.
Es ergibt sich:
Messreihe | 19 | 21 | 24 | 26 | 29 | Beispielsweise bedeutet das Wertepaar (21|0,309), dass 30,9% aller Werte der Normalverteilung N(23;4) kleiner oder gleich 21 sind. |
Quantile N(23;4) | 0,159 | 0,309 | 0,599 | 0,773 | 0,933 |
3.)
Vergleich der Quantile der Normalverteilung N(23;4) mit den Quantilen der Verteilungsfunktion der Messreihe
und berechnen der jeweiligen Differenzen.
Messreihe | 19 | 21 | 24 | 26 | 29 | Beispielsweise bedeutet das Wertepaar (21|0,4), dass 40% aller Werte der Messreihe kleiner oder gleich 21 sind. |
Quantile N(23;4) | 0,159 | 0,309 | 0,599 | 0,773 | 0,933 | |
Quantile Messreihe | 0,2 | 0,4 | 0,6 | 0,8 | 1 | |
Differenz | 0,041 | 0,091 | 0,001 | 0,027 | 0,067 |
Die grösste Differenz beträgt 0,091.
In untenstehender Tabelle findet man für N=5 und Alpha Risiko 10% den Wert 0,447.
Die grösste Differenz ist deutlich kleiner, was bedeutet, dass man die Annahme, dass die Messreihe normalverteilt ist mit Mittelwert 23 und Standardabweichung 4, beiweitem nicht verwerfen kann.
Wäre die grösste Differenz grösser als 0,447, dann kann die Messreihe immer noch normalverteilt sein, allerdings sehr wahrscheinlich mit anderem Mittelwert und/oder Standardabweichung.
Für diesen Fall siehe Lillefors Test.
Das folgende Bild veranschaulicht die Funktionsweise des Kolmogorov Smirnov Anpassungstests anhand des gezeigten Beispiels.
Signifikanztabelle für den Kolmogorov Smirnov Anpassungstest bei zweiseitigem Test.
(Es werden also die Beträge der Differenzen betrachtet. Bei einseitigem Test muss man den Wert mit dem halben AlphaRisiko aus der Tabelle nehmen. Testet man beispielsweise einseitig zum Alpharisiko 10%, dann muss man den Wert in der Spalte 20% nehmen.)
Siehe weitere Anpassungstests.
Mai 2019
zurück zum Glossar (Kolmogorov - Smirnov Anpassungstest)
zurück zum Glossar (Kolmogorov - Smirnov Omnibustest)
Kolmogorov Smirnov Omnibustest
Vorbemerkung
Testet eine unbekannte
Verteilungsfunktion gegen eine vollständig bekannte Verteilungsfunktion.
Eine Messreihe wird gegen explizite Verteilungsparameter getestet, die aus anderen Quellen stammen müssen. Damit liegt der Verteilungstyp, auf den getestet wird, vor dem Test bereits fest.
Lilliefors Variante des KS Anpassungstests
Testet eine unbekannte
Verteilungsfunktion gegen eine Verteilungsfunktion, deren
grundsätzlicher Typ zwar bekannt, die Verteilungsfunktionsparameter
jedoch unbekannt sind.
Testet 2 unbekannte
Verteilungsfunktionen auf Gleichheit.
Verallgemeinerung des Kolmogorov Smirnov Anpassungstests.
Eigentlich ein Rangtest, wie in der Beschreibung der Vorgehensweise weiter unten deutlich wird.
Vergleich zweier empirischer Verteilungsfunktionen, deren Form und Parameter nicht bekannt zu sein brauchen.
(Falls doch, dann entweder Kolmogorov Smirnov Anpassungstest oder Lilliefors Test)
Testet die Nullhypothese:
"Beide Stichproben haben die selbe Verteilungsfunktion".
Wie bei Omnibustests typisch, macht dieser Test keine Aussage über die Art eines evtl. vorhandenen Unterschieds, d.h.:
Er sagt nichts aus, ob die Mittelwerte oder sonstige Eigenschaften voneinander abweichen.
Dieser Test bietet sich als Vortest zum Mann Whitney Test an.
Vorgehensweise:
Beide Stichproben zusammenwerfen und in eine gemeinsame Rangfolge ordnen.
Dieser Test verwertet nur die Ranginformation.
Berechnen der Verteilungsfunktionen für jede einzelne Stichprobe.
Weiteres Vorgehen wie beim Kolmogorov Smirnov Anpassungstest: Bestimmung der grössten Differenz
und Vergleich mit Schwellenwerten aus Tabellen.
Beisipel:
0.) Ausgangsdaten
Reihe 1 | 21 | 19 | 29 | 26 | 24 |
Reihe 2 | 40 | 22 | 38 | 31 | 35 |
1.) Gemeinsame geordnete Rangreihe
Rang Nr. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Reihe 1 | 19 | 21 | 24 | 26 | 29 | |||||
Reihe 2 | 22 | 31 | 35 | 38 | 40 |
2.) + 3.) Berechnen der Verteilungsfunktionen und Bestimmung der grössten Differenz
Reihe 1 | 0,2 | 0,4 | 0,4 | 0,6 | 0,8 | 1,0 | 1,0 | 1,0 | 1,0 | 1,0 |
Reihe 2 | 0,0 | 0,0 | 0,2 | 0,2 | 0,2, | 0,2 | 0,4 | 0,6 | 0,8 | 1,0 |
Differenz | +0,2 | +0,4 | +0,2 | +0,4 | +0,6 | +0,8 | +0,6 | +0,4 | +0,2 | 0,0 |
Grösste Differenz also 0,8.
Für das Alpha Risiko 5% und N=10 Werte entnimmt man aus der unteren Tabelle einen kritischen Wert von 0.5.
Dieser Wert wird in diesem Beispiel deutlich überschritten.
Man kann also zum Alpha Risiko von 5% davon ausgehen, dass die beiden Verteilungsfunktionen unterschiedlich sind.
Signifikanztabelle für den Kolmogorov Smirnov Omnibustest bei zweiseitigem Test.
(Es werden also die Beträge der Differenzen betrachtet. Bei einseitigem Test muss man den Wert mit dem halben AlphaRisiko aus der Tabelle nehmen. Testet man beispielsweise einseitig zum Alpharisiko 10%, dann muss man den Wert in der Spalte 20% nehmen.)
Siehe weitere Omnibustests.
Mai 2019
zurück zum Glossar (Kolmogorov - Smirnov Omnibustest)
zurück zum Glossar (Lilliefors Test)
Vorbemerkung
Testet eine unbekannte
Verteilungsfunktion gegen eine vollständig bekannte Verteilungsfunktion.
Eine Messreihe wird gegen explizite Verteilungsparameter getestet, die aus anderen Quellen stammen müssen. Damit liegt der Verteilungstyp, auf den getestet wird, vor dem Test bereits fest.
Lilliefors Variante des KS Anpassungstests
Testet eine unbekannte
Verteilungsfunktion gegen eine Verteilungsfunktion, deren
grundsätzlicher Typ zwar bekannt, die Verteilungsfunktionsparameter
jedoch unbekannt sind.
Testet 2 unbekannte
Verteilungsfunktionen auf Gleichheit.
Modifikation des Kolmogorov Smirnov Anpassungstests.
Vergleich einer empirischen Verteilungsfunktion meisstens mit einer Normalverteilung, deren Parameter erst geschätzt werden müssen. (Und zwar aus den Daten der zweiten Stichprobe.
Zur Verdeutlichung:
Man hat 2 Stichproben, A und B. Von B "weiss" man, dass sie normalverteilt ist, kennt aber deren Parameter nicht.
Aus den Daten von B bestimmt man die Parameter und testet schliesslich A auf Anpassung an B.
(Falls nicht, dann Kolmogorov Smirnov Anpassungstest)
Der Lillefors Test funktioniert genau gleich wie der Kolmogorov Smirnov Anpassungstest (Beispiel siehe dort),
lediglich die Schwellenwerte sind anders.
Für Stichprobengrössen < 30 sind die Schwellenwerte zuminderst für Normalverteilung tabelliert.
Für Stichprobengrössen >30 gelten einfache Näherungen ~1/(N0,5).
Folgende Tabelle gibt die Schwellenwerte an für den Fall Normalverteilung.
Mai 2019
zurück zum Glossar (Lilliefors Test)