Log
lineare Modelle sind multivariate Verfahren auf höchstens ordinalem,
meistens jedoch nominalem Skalenniveau. Die Mächtigkeit und
Vorgehensweise ist vergleichbar mit der Varianzanalyse, ANOVA,
auf
metrischem
Skalenniveau.
zurück zum Glossar (Log-Lineare Modelle)
Auf dem allgemeinen linearen Modell beruhendes multivariates statistisches Verfahren auf nominalem, höchstens aber ordinalem Skalenniveau.
Log-Lineare Modelle sind ungerichtet, das heisst, es wird nicht unterschieden zwischen abhängigen und unabhängigen Variablen.
Logit Modelle sind aus Log-Linearen Modellen abgeleitet und unterscheiden abhängige und unabhängige Variablen.
Log-Lineare Modelle und ANOVA sind vom Vorgehen her sehr ähnlich.
Im Gegensatz zur ANOVA, bei der Mittelwertsunterschiede untersucht werden (->Additives Modell), werden bei Log-linearen Modellen jedoch bedingt durch das Skalenniveau Häufigkeitsverhältnisse einer Kontingenztabelle untersucht. (-->Multiplikatives Modell).
Faktor A | |||
A1 | A2 | ||
Faktor B | B1 | n11 | n12 |
B2 | n21 | n22 |
Die Kontingenztabelle wird als 2-faktorielles System aufgefasst.
Das Zustandekommen einer Zellhäufigkeit nij folgt daher aus einer Konstante, den Faktoren A, B und deren Wechselwirkung AB:
Die durch das multiplikative Modell beschreibbaren Häufigkeitsverhältnisse lassen sich durch Logarithmieren in ein additives Modell überführen.
-----> Dies ist das Log-Lineare Modell.
Der Vorteil gegenüber "normaler" Analyse von Kontingenztafeln mit dem Chi Quadrat Test besteht darin, dass analog zur ANOVA auch Informationen über Wechselwirkungen gewonnen werden.
Mit Hilfe des sogenannten "Critical Ratios", der Teststatistik für loglineare Modelle, lassen sich die Besetzungszahlen auf Signifikanz überprüfen.
Das Critical Ratio folgt asymptotisch einer Standard-Normalverteilung und ist der Quotient aus dem betreffenden geschätzten Parameter und seinem Standardfehler. Siehe dazu unten stehendes Beispiel.
Vorgehensweise:
Logarithmieren der Besetzungszahlen
Berechnen der Randwerte (arithmetische Zeilen- und Spaltenmittelwerte)
Berechnung der Effekte
Berechnen der Critical Ratios und Prüfen auf Signifikanz
Beispiel:
Rauchverhalten einer grösseren Reisegruppe nach Geschlechtern getrennt
Rauchverhalten |
Die nicht-logarithmierten Randhäufigkeiten haben in folgenden Rechenschritten keine Bedeutung |
||||
Raucher | Nichtraucher | ||||
Geschlecht | M | 47 | 8 | 55 | |
W | 18 | 39 | 57 | ||
65 | 47 | 112 |
1.) Logarithmieren der Besetzungszahlen mit dem natürlichen Logarithmus liefert
ln(47) = 3,85 | ln(8) = 2,08 |
ln(18 = 2,89 | ln(39) = 3,66 |
2.) Berechnen der Randwerte
Die Zeilen (Spalten) -Randwerte berechnen sich aus den arithmetischen Mitteln der Zeilen (Spalten).
Da durch das Logarithmieren ein additives Modell geworden ist und die Zellbesetzungen nun als Ausprägungen der Faktorstufen interprätierbar sind, können die arithmetischen Zeilen- und Spaltenmittelwerte als durchschnittliche Ausprägungen jeweils eines Faktors bei Konstanthalten der Stufe des anderen Faktors aufgefasst werden.
Raucher | Nichtraucher | ||
M | 3,85 | 2,08 | =0,5*(3,85+2,08) |
W | 2,89 | 3,66 | =0,5*(2,89+3,66) |
=0,5*(3,85+2,89) | =0,5*(2,08+3,66) | =0,25*(3,85+2,08+2,89+3,66) |
-->
Raucher | Nichtraucher | ||
M | 3,85 | 2,08 | 2.96 |
W | 2,89 | 3,66 | 3.28 |
3.37 | 2.87 | 3.12 |
3.) Berechnung der Effekte
3a) Haupteffekte
= -0,25
= +0,25 Effekt bedeutet "Bei konstant gehaltenem Geschlecht ist das Rauchverhalten nicht gleichverteilt"
= +0,16
= -0,16 Effekt bedeutet "Bei konstant gehaltenem Rauchverhalten sind die Geschlechter nicht gleichverteilt"
-->
Raucher | Nichtraucher | ||
M | 3,85 | 2,08 | +0.16 |
W | 2,89 | 3,66 | -0.16 |
-0.25 | +0.25 | 3.12 |
3b) Wechselwirkung
= +0,64
= -0,64
= -0,64
= +0,64 Wechselwirkung bedeutet: "Das Rauchverhalten ist bei konstant gehaltenem Geschlecht nicht gleichverteilt, und das Verhältnis kehrt sich um, wenn man das jeweils andere Geschlecht betrachtet.
-->
Raucher | Nichtraucher | ||
M | +0,64 | -0,64 | +0.,6 |
W | -0,64 | +0,64 | -0,16 |
-0,25 | +0,25 | 3,12 |
4.) Berechnen der Critical Ratios und Prüfen auf Signifikanz
Zur Berechnung des Critical Ratios benötigt man die ursprüngliche Besetzungstabelle.
Rauchverhalten | , | |||
Raucher | Nichtraucher | |||
Geschlecht | M | 47 | 8 | |
W | 18 | 39 |
In diesem Beispiel ist = 0,119
-->
Ergebnistabelle
Faktor | Standardfehler | Critical Ratio | Signifikanzniveau |
0,119 | 2,10 | 98,2 % | |
0,119 | 1,34 | 91,0 % | |
0,119 | 5,38 | 99,999996 % |
Das Critical Ratio folgt asymptotisch einer Standard-Normalverteilung: --> Rechenbeispiel mit Excel: 2,10 = STANDNORMINV(98,2%), bzw. NORM.S.INV(98,2%).
Da die Wechselwirkung hochsignifikant ist, bedeutet das, dass sich das Rauchverhalten bei den Frauen generell anders ist als bei den Männern.
Anmerkungen:
a.)
Wenn man im Voraus davon ausgeht, dass Rauchverhalten und Geschlecht voneinander unabhängig sein sollen, also keine Wechselwirkung existiert, dann ermittelt man zunächst die erwarteten Zellhäufigkeiten aufgrund der Randhäufigkeiten. (Siehe dazu Chi Quadrat Test, Schritt 2).
Danach geht man die Schritte 1 bis 4 wie im oben geschilderten Beispiel durch.
Als Ergebnis erhält man wiederum Critical Ratios. Das Critical Ratio der Wechselwirkung wird sich jedoch erwartungsgemäss als = 0 herausstellen.
b)
Geht man zusätzlich davon aus, dass nicht nur keine Wechselwirkung, sondern zusätzlich auch noch kein Effekt im Rauchverhalten vorliegt, so geht man wiederum analog a) vor.
(Die erwarteten Zellhäufigkeiten werden natürlich einfacher als in a) berechnet).
Als Ergebnis erhält man wiederum Critical Ratios. Zusätzlich zum Critical Ratio der Wechselwirkung wird sich jedoch erwartungsgemäss noch das Critical Ratio des Effektes Rauchverhalten als = 0 herausstellen.
Entsprechendes gilt, wenn statt des Effektes Rauchverhalten der Effekt Geschlecht als nicht vorhanden angenommen wird.
c)
Wenn man annimmt, dass alle Besetzungszahlen unabhängig voneinander, also gleichverteilt sind, so testet man mit dem Chi Quadrat Test.
zurück zum Glossar (Log-Lineare Modelle)
27.08.2005