Chi Quadrat Test

Anpassungstest und Unabhängigkeitstest

Chi Quadrat Tests sind das Standardmittel beim Vergleich von Häufigkeiten. Der Chi Quadrat Unabhängigkeitstest vergleicht direkt Häufigkeiten. Der Chi Quadrat Anpassungsstest meint zwar den Vergleich zweier Verteilungsfunktionen, allerdings wird hier zunächst eine Einteilung in Klassen (und damit Häufigkeiten) vorgenommen, sodass daraus wieder ein Unabhängigkeitstest wird.

zurück zum Glossar (Chi Quadrat Unabhängigkeitstest)

Chi Quadrat Unabhängigkeitstest

Universelle Testkategorie auf nominalem, höchstens jedoch ordinalem Skalenniveau, bei der die Chi Quadrat Verteilung zum Einsatz kommt.

Asymptotisches Pendant zum Binomial- und Polynomialtest.

Der Vierfeldertafel-Test ist eine spezielle Form davon.

Der Chi Quadrat Test untersucht Häufigkeitsdaten verschiedener Klassen auf signifikanten Unterschied, das heisst, ob die Besetzungszahlen von Klassen signifikant von ihren jeweiligen Erwartungswerten abweichen.

Eine kurze anschauliche Einführung in die Funktionsweise des Chi Quadrat Tests befindet sich hier.

Bedingungen:

Wenigstens 80% der Besetzungszahlen sollten >5, der Rest > 1 sein, was man notfalls durch Zusammenfassen von Klassen erreicht.

Besonders bei kleinen Stichprobengrössen sollte die Yates Korrektur angewendet werden.

Bei Vorhandensein wenigstens einer Null in den Besetzungszahlen sollte die Delta Option angewendet werden.

Führt die ermittelte Prüfgrösse zu einem "deutlich" grösseren Signifikanzniveau als gefordert, so ist der Chi Quadrat Test auch bei "zu kleinen" Besetzungszahlen noch gültig.

Bei schwach besetzten Klassen kommen modifizierte Chi Quadrat Tests zum Einsatz, z.B. nach Craddock-Flood oder Haldane-Dawson. Beide jedoch sind sehr rechenintensiv, sodass man hierfür spezielle Software heranziehen sollte.

Anwendung:

Prüfen, ob die zu betrachtende Häufigkeitsverteilung mit einer gegebenen Häufigkeitsverteilung übereinstimmt,
Prüfen, ob die betrachtete Verteilungsfunktion mit der theoretisch erwarteten übereinstimmt ( Anpassungstest). In diesem Fall sollte die Anzahl der gebildeten Klassen etwa Wurzel(N) sein, N=
grösse.

Vorgehensweise:

Aufschreiben der Häufigkeiten in eine Tabelle.
Falls notwendig (d.h.: wenn man nicht gegen eine erwartete Häufigkeitsverteilung testet, sondern die Erwartungswerte aus der Stichprobe bestimmen muss) Berechnen der Randhäufigkeiten und daraus der erwarteten Häufigkeiten.

Werden Wechselwirkungen vermutet, so muss man mit dem Log-Linearen Modell arbeiten.
Berechnung der Anzahl Freiheitsgrade

f=(k-1)*(l-1), k,l: Spalzen- bzw. Zeilenzahl.
Bestimmung der Chi Quadrat Prüfgrösse
Bestimmung des Signifikanzniveaus.

Beispiel: Verkaufserfolg zweier Verkäufer

1.) Originaldaten

Verkauftes Produkt		Hut	Pullover	Hose	Socken	Unterhemd
Anzahl verkaufter Einheiten	Verkäufer A	25	35	10	12	12
Anzahl verkaufter Einheiten	Verkäufer B	20	25	15	20	24

Nullhypothese:

Das Verkaufsverhalten beider Verkäufer ist gleich, d.h.: die Unterschiede in den Häufigkeiten sind rein zufällig..

2.) Berechnen der Randhäufigkeiten und daraus der erwarteten Häufigkeiten.

Dies ist notwendig, da man nicht gegen erwartete Häufigkeiten testet,

sondern diese erst aus den vorhandenen Häufigkeiten schätzen muss.

(Siehe auch Schätzen)

Verkauftes Produkt	Hut	Pullover	Hose	Socken	Unterhemd	Gesamt
Anzahl verkaufter Einheiten Verkäufer A	25	35	10	12	12	94
Anzahl verkaufter Einheiten Verkäufer A	94/198*45 =21.4	94/198*60 =28.5	usw. =11.9	=15.2	=17.1	94
Anzahl verkaufter Einheiten Verkäufer B	20	25	15	20	24	104
Anzahl verkaufter Einheiten Verkäufer B	104/198*45 =23.6	104/198*60 =31.5	usw. =13.1	=16.8	=18.9	104
Gesamt	45	60	25	32	36	198

3.) Bestimmung der Anzahl Freiheitsgrade:

2 Verkäufer und 5 Produktgruppen, --> f = (2-1)*(5-1) = 4

4. Bestimmung der Prüfgrösse:

= 8.79 --> Signifikanzniveau = 93.3%.

-> Die Nullhypothese "Das Verkaufsverhalten beider Verkäufer ist gleich" muss verworfen werden, falls man sich mit einem Signifikanzniveau von 90% zufrieden gibt. Forderte man 95%, dann würde das vorhandene Datenmaterial nicht eindeutig genug sein, die Nullhypothese zu verwerfen.

Das Signifikanzniveau wurde mit der Excelfunktion [1-CHIVERT(Prüfgrösse,f)] berechnet.

Für eine Berechnung des Chi Quadrat Tests in Excel siehe das Tabellenblatt "Chitest" dieser Exceltabelle.

Anmerkung 1:

Chi Quadrat Tests sind ausschliesslich ungerichtet (=zweiseitig) durchführbar. Einzige Ausnahme bei Vorliegen nur eines Freiheitsgrades (---> Vierfeldertafel Test).

Da die Chi Quadrat Verteilung mit nur einem Freiheitsgrad gerade die quadrierte Normalverteilung ist, kann in diesem Fall auch gerichtet (=einseitig) getestet werden.

Anmerkung 2:

Log-lineare Modelle liefern im Gegensatz zum Chi Quadrat Test zusätzlich noch Wechselwirkungsinformation zwischen den Zellen.

(ANOVA auf nominalem Skalenniveau)

Siehe Log-lineare Modelle

27.08.2005

zurück zum Glossar (Chi Quadrat Unabhängigkeitstest)

Datenschutzhinweise