Kolmogoroff Smirnoff und Lilliefors Test

Anpassungstests für beliebige Verteilungsfunktionen

Ohne Frames

Den Kolmogoroff Smirnoff Test gibt es in drei Varianten:
Kolmogoroff Smirnoff (KS) Anpassungstest, KS Omnibustest und Lilliefors Test. Vorteil sind die Anwendbarkeit auf beliebige Verteilungsfunktionen und die  Einfachheit der Durchführung, Nachteil die relativ geringe Sensitivität, besonders in den Randbereichen.

zurück zum Glossar (Kolmogorov - Smirnov Anpassungstest)

 

Kolmogorov  Smirnov Anpassungstest (KS Anpassungstest)

Ein Anpassungstest.

 

Vorbemerkung

Der Kolmogorov Smirnov Anpassungstest testet eine empirische (kumulierte) Verteilungsfunktion gegen eine (beliebige) Verteilung, deren  Parameter vollständig bekannt sein müssen. (Falls unbekannt, dann Lilliefors Test). In den allermeissten praktischen Fällen ist unter "beliebig" Normalverteilung zu verstehen.  

Kontinuierliches Skalenniveau.

Prüfgrösse ist die maximale Differenz der beiden Verteilungsfunktionen (an einer beliebigen Stelle).

Bei gerichteten (einseitigen) Tests nimmt man die gerichtete Differenz.

Meisstens  testet man eine empirische Verteilungsfunktion gegen die Normalverteilung, in der Hoffnung, dass  die empirische Verteilungsfunktion nicht systematisch von der Normalverteilung abweicht, damit man mit parametrischen Tests (die praktisch alle Normalverteilung verlangen) weiter auswerten kann.

Für Stichprobengrössen N < 40 sind die Schwellenwerte tabelliert. (Siehe Tabelle unten)

Für Stichprobengrössen N >40 gelten einfache Näherungen  ~N-0,5 

 

Nachteil des Kolmogorov Smirnov Anpassungstests ist seine geringe Sensitivität an den Randbereichen der Verteilungsfunktionen 

Diesen Nachteil gleichen neuere Tests wohl aus, jedoch auf Kosten eines derart grossen Rechenaufwandes, dass man ohne Software kaum zu Rande kommt. 

Siehe hierzu weitere Anpassungstests

 

Beispiel:

 

Es soll überprüft werden, ob eine Messreihe normalverteilt ist mit Mittelwert 23 und Standardabweichung 4.

Also Nullhypothese: "Die Messwerte sind N(23;4)-verteilt".

 

0.) Ausgangsdaten

Messreihe 21 19 29 26 24

 

1.) Aufsteigend geordnete Messreihe

Messreihe 19 21 24 26 29

 

2.)

Ermittlung der Quantile der Normalverteilung N(23;4) zu den gegebenen Messwerten.

Die kann man mit der Excelfunktion NORMVERT(Messwert;23;4;wahr) durchführen.

Es ergibt sich:

Messreihe 19 21 24 26 29 Beispielsweise bedeutet das Wertepaar (21|0,309), dass 30,9% aller Werte der Normalverteilung N(23;4) kleiner oder gleich 21 sind.
Quantile N(23;4) 0,159 0,309 0,599 0,773 0,933

 

3.)

Vergleich der Quantile der Normalverteilung N(23;4) mit den Quantilen der Verteilungsfunktion der Messreihe

und berechnen der jeweiligen Differenzen.

Messreihe 19 21 24 26 29 Beispielsweise bedeutet das Wertepaar (21|0,4), dass 40% aller Werte der Messreihe kleiner oder gleich 21 sind.
Quantile N(23;4) 0,159 0,309 0,599 0,773 0,933
Quantile Messreihe 0,2 0,4 0,6 0,8 1
Differenz 0,041 0,091 0,001 0,027 0,067

 

Die grösste Differenz beträgt 0,091.

In untenstehender Tabelle findet man für N=5  und Alpha Risiko 10% den Wert 0,447.

Die grösste Differenz ist deutlich kleiner, was bedeutet, dass man die Annahme, dass die Messreihe normalverteilt ist mit Mittelwert 23 und Standardabweichung 4, beiweitem nicht verwerfen kann.

Wäre die grösste Differenz grösser als 0,447, dann kann die Messreihe immer noch normalverteilt sein, allerdings sehr wahrscheinlich mit anderem Mittelwert und/oder Standardabweichung.

Für diesen Fall siehe Lillefors Test.

 

Das folgende Bild veranschaulicht die Funktionsweise des Kolmogorov Smirnov Anpassungstests anhand des gezeigten Beispiels.

Kolmogorov Smirnov Anpassungstest Beispiel

 

Signifikanztabelle für den Kolmogorov Smirnov Anpassungstest bei zweiseitigem Test.

(Es werden also die Beträge der Differenzen betrachtet. Bei  einseitigem Test muss man den Wert mit dem halben AlphaRisiko aus der Tabelle nehmen. Testet man beispielsweise einseitig zum Alpharisiko 10%, dann muss man den Wert in der Spalte 20% nehmen.)

Kolmogorov Smirnov Anpassungstest Schwellenwerte

 

Siehe weitere Anpassungstests.

Mai 2019

zurück zum Glossar (Kolmogorov - Smirnov Anpassungstest)


zurück zum Glossar (Kolmogorov - Smirnov Omnibustest)

 

Kolmogorov Smirnov Omnibustest

 

Vorbemerkung

Verallgemeinerung des Kolmogorov Smirnov Anpassungstests.

Eigentlich ein Rangtest, wie in der Beschreibung der Vorgehensweise weiter unten deutlich wird.

Vergleich zweier empirischer Verteilungsfunktionen, deren Form und Parameter nicht bekannt zu sein brauchen.

(Falls doch, dann entweder Kolmogorov Smirnov Anpassungstest oder Lilliefors Test)

Testet die Nullhypothese:

"Beide Stichproben haben die selbe Verteilungsfunktion".

Wie bei Omnibustests typisch, macht dieser Test keine Aussage über die Art eines evtl. vorhandenen Unterschieds, d.h.:

Er sagt nichts aus, ob die Mittelwerte oder sonstige Eigenschaften voneinander abweichen.

Dieser Test bietet sich als Vortest zum Mann Whitney Test an.

 

Vorgehensweise:

  1. Beide Stichproben zusammenwerfen und in eine gemeinsame Rangfolge ordnen.

    Dieser Test verwertet nur die Ranginformation.

  2. Berechnen der Verteilungsfunktionen für jede einzelne Stichprobe.

  3. Weiteres Vorgehen wie beim Kolmogorov Smirnov Anpassungstest: Bestimmung der grössten Differenz

    und Vergleich mit Schwellenwerten aus Tabellen.

Beisipel:

 

0.) Ausgangsdaten

Reihe 1 21 19 29 26 24
Reihe 2 40 22 38 31 35

 

1.) Gemeinsame geordnete Rangreihe

Rang Nr. 1 2 3 4 5 6 7 8 9 10
Reihe 1 19 21   24 26 29        
Reihe 2     22       31 35 38 40

 

2.) + 3.) Berechnen der Verteilungsfunktionen und Bestimmung der grössten Differenz

Reihe 1 0,2 0,4 0,4 0,6 0,8 1,0 1,0 1,0 1,0 1,0
Reihe 2 0,0 0,0 0,2 0,2 0,2, 0,2 0,4 0,6 0,8 1,0
Differenz +0,2 +0,4 +0,2 +0,4 +0,6 +0,8 +0,6 +0,4 +0,2 0,0

 

Grösste Differenz also 0,8.

Für das Alpha Risiko 5% und N=10 Werte entnimmt man aus der unteren Tabelle einen kritischen Wert von 0.5.

Dieser Wert wird in diesem Beispiel deutlich überschritten.

Man kann also zum Alpha Risiko von 5% davon ausgehen, dass die beiden Verteilungsfunktionen unterschiedlich sind.

 

Signifikanztabelle für den Kolmogorov Smirnov Omnibustest bei zweiseitigem Test.

(Es werden also die Beträge der Differenzen betrachtet. Bei  einseitigem Test muss man den Wert mit dem halben AlphaRisiko aus der Tabelle nehmen. Testet man beispielsweise einseitig zum Alpharisiko 10%, dann muss man den Wert in der Spalte 20% nehmen.)

Kolmogoroff Smirnof Omnibus Schwellenwerte

 

Siehe weitere Omnibustests.

Mai 2019

 

zurück zum Glossar (Kolmogorov - Smirnov Omnibustest)

 


zurück zum Glossar (Lilliefors Test)

 

Lilliefors Test

 

Vorbemerkung

Modifikation des Kolmogorov Smirnov Anpassungstests.

Vergleich einer empirischen Verteilungsfunktion meisstens mit einer Normalverteilung, deren Parameter erst geschätzt werden müssen. (Und zwar aus den Daten der zweiten Stichprobe. 

 

Zur Verdeutlichung: 

Man hat 2 Stichproben, A und B. Von B "weiss" man, dass sie normalverteilt ist, kennt aber deren Parameter nicht. 

Aus den Daten von B bestimmt man die Parameter und testet schliesslich A auf Anpassung an B.

(Falls nicht, dann Kolmogorov Smirnov Anpassungstest)

Der Lillefors Test funktioniert genau gleich wie der Kolmogorov Smirnov Anpassungstest (Beispiel siehe dort),

lediglich die Schwellenwerte sind anders.

Für Stichprobengrössen < 30 sind die Schwellenwerte zuminderst für Normalverteilung tabelliert.

Für Stichprobengrössen >30 gelten einfache Näherungen ~1/(N0,5).

 

Folgende Tabelle gibt die Schwellenwerte an für den Fall Normalverteilung.

Lillieforstest Schwellenwerte

Mai 2019

zurück zum Glossar (Lilliefors Test)

Datenschutzhinweise