Log Lineare Modelle 

Varianzanalyse für Nominalskala und Ordinalskala

Ohne Frames

Log lineare Modelle sind multivariate Verfahren auf höchstens ordinalem, meistens jedoch nominalem Skalenniveau. Die Mächtigkeit und Vorgehensweise ist vergleichbar mit der Varianzanalyse, ANOVA, auf metrischem Skalenniveau.

zurück zum Glossar (Log-Lineare Modelle)

Log-Lineare Modelle

 

Auf dem allgemeinen linearen Modell beruhendes multivariates statistisches Verfahren auf nominalem, höchstens aber ordinalem Skalenniveau.  

Log-Lineare Modelle sind ungerichtet, das heisst, es wird nicht unterschieden zwischen abhängigen und unabhängigen Variablen. 

Logit Modelle sind aus Log-Linearen Modellen abgeleitet und unterscheiden abhängige und unabhängige Variablen. 

Log-Lineare Modelle und ANOVA sind vom Vorgehen her sehr ähnlich. 

Im Gegensatz zur ANOVA, bei der Mittelwertsunterschiede untersucht werden (->Additives Modell), werden bei Log-linearen Modellen jedoch bedingt durch das Skalenniveau Häufigkeitsverhältnisse einer Kontingenztabelle  untersucht. (-->Multiplikatives Modell). 


Für nominalskalierte Daten lassen sich ja nur Häufigkeiten für einzelne Kategorien (Zellen in den Tafeln) angeben.
Die Kategoriegrössen werden dabei sinnvollerweise als Anteile an der Gesamthäufigkeit definiert.
Das Zustandekommen jeder Kategoriehäufigkeit lässt sich nun durch ein multiplikatives Modell beschreiben, was im Folgenden anhand eines Beispiels (2x2 Kontingenztabelle) gezeigt wird.

 

  Faktor A
A1 A2
Faktor B B1 n11 n12
B2 n21 n22

Die Kontingenztabelle wird als 2-faktorielles System aufgefasst. 

Das Zustandekommen einer Zellhäufigkeit nij folgt daher aus einer Konstante, den Faktoren A, B und deren Wechselwirkung AB: 

Die durch das multiplikative Modell beschreibbaren Häufigkeitsverhältnisse lassen sich durch Logarithmieren in ein additives Modell überführen.

  -----> Log Lineares Modell   Dies ist das Log-Lineare Modell. 

 

 

Der Vorteil gegenüber "normaler" Analyse von Kontingenztafeln mit dem Chi Quadrat Test besteht darin, dass analog zur ANOVA auch Informationen über Wechselwirkungen gewonnen werden.

 

Mit Hilfe des sogenannten "Critical Ratios", der Teststatistik für loglineare Modelle, lassen sich die Besetzungszahlen auf Signifikanz überprüfen. 

Das Critical Ratio folgt asymptotisch einer Standard-Normalverteilung und ist der Quotient aus dem betreffenden geschätzten Parameter und seinem Standardfehler. Siehe dazu unten stehendes Beispiel.

 

Vorgehensweise: 

  1. Logarithmieren der Besetzungszahlen 

  2. Berechnen der Randwerte (arithmetische Zeilen- und Spaltenmittelwerte) 

  3. Berechnung der Effekte 

  4. Berechnen der Critical Ratios und Prüfen auf Signifikanz

 

Beispiel: 

Rauchverhalten einer grösseren Reisegruppe nach Geschlechtern getrennt

 

  Rauchverhalten  

Die nicht-logarithmierten

 Randhäufigkeiten haben in folgenden Rechenschritten keine Bedeutung  

Raucher Nichtraucher
Geschlecht M 47 8 55
W 18 39 57
  65 47 112

 

1.) Logarithmieren der Besetzungszahlen mit dem natürlichen Logarithmus liefert 

 

ln(47) = 3,85 ln(8) = 2,08
ln(18 = 2,89 ln(39) = 3,66

 

2.) Berechnen der Randwerte 

 

Die Zeilen (Spalten) -Randwerte berechnen sich aus den arithmetischen Mitteln der Zeilen (Spalten). 

Da durch das Logarithmieren ein additives Modell geworden ist und die Zellbesetzungen nun als Ausprägungen der Faktorstufen interprätierbar sind, können die arithmetischen Zeilen- und Spaltenmittelwerte als durchschnittliche Ausprägungen jeweils eines Faktors bei Konstanthalten der Stufe des anderen Faktors aufgefasst werden. 

  Raucher Nichtraucher  
M 3,85 2,08 =0,5*(3,85+2,08)
W 2,89 3,66 =0,5*(2,89+3,66)
  =0,5*(3,85+2,89) =0,5*(2,08+3,66) =0,25*(3,85+2,08+2,89+3,66)

-->

  Raucher Nichtraucher  
M 3,85 2,08 2.96
W 2,89 3,66 3.28
  3.37 2.87 3.12

 

3.) Berechnung der Effekte 

 

3a) Haupteffekte

            = -0,25 

      =  +0,25          Effekt bedeutet "Bei konstant gehaltenem Geschlecht ist das Rauchverhalten nicht gleichverteilt"

           =  +0,16

            =  -0,16             Effekt bedeutet "Bei konstant gehaltenem Rauchverhalten sind die Geschlechter nicht gleichverteilt"

 --> 

  Raucher Nichtraucher  
M 3,85 2,08 +0.16
W 2,89 3,66 -0.16
  -0.25 +0.25 3.12

 

 3b) Wechselwirkung 

            =  +0,64

         =   -0,64

           =  -0,64

       =  +0,64        Wechselwirkung bedeutet: "Das Rauchverhalten ist bei konstant gehaltenem Geschlecht nicht gleichverteilt, und das Verhältnis kehrt sich um, wenn man das jeweils andere Geschlecht betrachtet.

--> 

  Raucher Nichtraucher  
M +0,64 -0,64 +0.,6
W -0,64 +0,64 -0,16
  -0,25 +0,25 3,12

 

4.) Berechnen der Critical Ratios und Prüfen auf Signifikanz

 

Zur Berechnung des Critical Ratios benötigt man die ursprüngliche Besetzungstabelle.

  Rauchverhalten Log Lineares Modell Critical Ratio,   Log Lineares Modell Standardfehler
Raucher Nichtraucher
Geschlecht M 47 8
W 18 39

 

In diesem Beispiel ist     =  0,119 

-->

Ergebnistabelle

Faktor Standardfehler Critical Ratio Signifikanzniveau
0,119  2,10 98,2 %
0,119  1,34 91,0 %
0,119  5,38 99,999996 %

Das Critical Ratio folgt asymptotisch einer Standard-Normalverteilung:  --> Rechenbeispiel mit Excel: 2,10 = STANDNORMINV(98,2%), bzw. NORM.S.INV(98,2%).


Da die Wechselwirkung hochsignifikant ist, bedeutet das, dass sich das Rauchverhalten bei den Frauen generell anders ist als bei den Männern.

 

Anmerkungen: 

a.)

Wenn man im Voraus davon ausgeht, dass Rauchverhalten und Geschlecht voneinander unabhängig sein sollen, also keine Wechselwirkung existiert, dann ermittelt man zunächst die erwarteten Zellhäufigkeiten aufgrund der Randhäufigkeiten. (Siehe dazu Chi Quadrat Test, Schritt 2). 

Danach geht man die Schritte 1 bis 4 wie im oben geschilderten Beispiel durch. 

Als Ergebnis erhält man wiederum Critical Ratios. Das Critical Ratio der Wechselwirkung wird sich jedoch erwartungsgemäss als = 0 herausstellen.

 

b) 

Geht man zusätzlich davon aus, dass nicht nur keine Wechselwirkung, sondern zusätzlich auch noch kein Effekt im Rauchverhalten vorliegt, so geht man wiederum analog a) vor.  

(Die erwarteten Zellhäufigkeiten werden natürlich einfacher als in a) berechnet). 

Als Ergebnis erhält man wiederum Critical Ratios. Zusätzlich zum Critical Ratio der Wechselwirkung wird sich jedoch erwartungsgemäss noch das Critical Ratio des Effektes Rauchverhalten als = 0 herausstellen. 

 

Entsprechendes gilt, wenn statt des Effektes Rauchverhalten der Effekt Geschlecht als nicht vorhanden angenommen wird. 

 

c) 

Wenn man annimmt, dass alle Besetzungszahlen unabhängig voneinander, also gleichverteilt sind, so testet man mit dem Chi Quadrat Test

zurück zum Glossar (Log-Lineare Modelle)

27.08.2005

Datenschutzhinweise