Docstoc

Herzlich willkommen zur Vorlesung Statistik Zusammenhnge zwischen

Document Sample
Herzlich willkommen zur Vorlesung Statistik Zusammenhnge zwischen Powered By Docstoc
					               FB 1   W. Ludwig-Mayerhofer   Statistik – Kreuztabellen   1


Grundlagen
Häufigkeiten
                                Herzlich willkommen zur
Lagemaße
Streuung
                                  Vorlesung Statistik
Inferenzstatistik
Kreuztabellen
Gruppen-                   Zusammenhänge zwischen
unterschiede
Kovarianz/               nominalen (und/oder ordinalen)
Korrelation
Lineare                           Merkmalen:
Regression
                          Kreuztabellenanalyse und
                              Assoziationsmaße
                FB 1   W. Ludwig-Mayerhofer        Statistik – Kreuztabellen   2


Grundlagen
Häufigkeiten                                  Allgemeines
Lagemaße
Streuung
Inferenzstatistik       • Kreuztabellen eignen sich zur Darstellung
Kreuztabellen             und Analyse von Zusammenhängen
 Allgemeines
 Gestaltung               zwischen nominal- und ordinalskalierten
 Graphiken
 Differenzen und          Merkmalen (in allen Kombinationen).
  Proportionen
 Chi-Quadrat-Test       • Metrische Merkmale (mit vielen Ausprägun-
 Größere Tabellen
 Assoziations-            gen) müssen für eine Präsentation in
  maße
Gruppen-                  Kreuztabellen in geeigneter Weise
unterschiede              zusammengefasst werden.
Kovarianz/
Korrelation             • Dies sollte – wenn überhaupt – nur zum
Lineare                   Zweck der übersichtlichen Präsentation von
Regression
                          Daten geschehen, auf keinen Fall für die
                          statistische Analyse (Informationsverlust!).
                FB 1   W. Ludwig-Mayerhofer          Statistik – Kreuztabellen           3


Grundlagen
Häufigkeiten               Anordnung der Merkmale in der
Lagemaße
Streuung
                                   Kreuztabelle
Inferenzstatistik
Kreuztabellen          Wenn möglich: Unabhängige (erklärende)
 Allgemeines
 Gestaltung
                       Variable als Spaltenvariable, abhängige Variable
 Graphiken
 Differenzen und
                       als Zeilenvariable. Prozentuierung in den Spalten!
  Proportionen
 Chi-Quadrat-Test      Beispiel (fiktiv, aber nicht ganz unrealistisch): Beruf des
 Größere Tabellen
 Assoziations-
                       Vaters und Schulbesuch des Kindes (Spaltenprozent)
  maße
Gruppen-                                      Arbeiter   Angestellter                n
unterschiede
Kovarianz/
Korrelation
                       Hauptschule                 90                  45         630
Lineare
Regression             RS/Gymnasium                10                  55         370

                       n                          400                600         1000
                FB 1   W. Ludwig-Mayerhofer       Statistik – Kreuztabellen            4


Grundlagen
Häufigkeiten              Schlechte Gestaltung der Tabelle
Lagemaße
Streuung               SPSS nimmt die Sache mit den „Zellen“ einer
Inferenzstatistik
Kreuztabellen
                       Kreuztabelle zu wörtlich: Die Tabellen sehen aus
 Allgemeines           wie ein Fenstergitter („Knast-Look“). Bitte nicht in
 Gestaltung
 Graphiken             eigene Arbeiten übernehmen (Punktabzug!).
 Differenzen und
  Proportionen
 Chi-Quadrat-Test
 Größere Tabellen                             Arbeiter      Angestellter      gesamt
 Assoziations-
  maße
Gruppen-               Hauptschule               360                  270       630
unterschiede                                   90,0%                45,0%     66,0%
Kovarianz/
Korrelation            RS/Gymnasium                40                 330       370
Lineare                                        10,0%                55,0%     34,0%
Regression
                       gesamt                     400                   600    1000
                FB 1   W. Ludwig-Mayerhofer   Statistik – Kreuztabellen   5


Grundlagen
Häufigkeiten               Weitere Hinweise zur Gestaltung
Lagemaße
Streuung               • Normalerweise (vor allem bei ohnehin
Inferenzstatistik
Kreuztabellen
                         fehlerbehafteten Stichprobendaten) ist die
 Allgemeines             Angabe der Prozentwerte mit Nachkomma-
 Gestaltung
 Graphiken               stellen überflüssig!
 Differenzen und
  Proportionen         • Auch genügt es, die absoluten Zahlen in den
 Chi-Quadrat-Test
 Größere Tabellen        Randverteilungen auszuweisen.
 Assoziations-
  maße                 • Ebenso wenig muss das Prozentzeichen hinter
Gruppen-
unterschiede             jeder einzelnen Prozentzahl stehen.
Kovarianz/             • Dafür sollte möglichst in der Tabellenüber-
Korrelation
Lineare                  schrift angegeben sein, ob es sich um Spalten-
Regression               oder Zeilenprozent (oder evtl. beides) handelt.
                FB 1   W. Ludwig-Mayerhofer   Statistik – Kreuztabellen   6


Grundlagen
Häufigkeiten                    Graphische Darstellung:
Lagemaße
Streuung
                              Gruppiertes Säulendiagramm
Inferenzstatistik
Kreuztabellen
 Allgemeines
 Gestaltung
 Graphiken
 Differenzen und
  Proportionen
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
unterschiede
Kovarianz/
Korrelation
Lineare
Regression
                FB 1   W. Ludwig-Mayerhofer   Statistik – Kreuztabellen   7


Grundlagen
Häufigkeiten                    Graphische Darstellung:
Lagemaße
Streuung
                              Gestapeltes Säulendiagramm
Inferenzstatistik
Kreuztabellen
 Allgemeines
 Gestaltung
 Graphiken
 Differenzen und
  Proportionen
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
unterschiede
Kovarianz/
Korrelation
Lineare
Regression
                FB 1   W. Ludwig-Mayerhofer    Statistik – Kreuztabellen   8


Grundlagen
Häufigkeiten                         Achtung: Chart Junk!
Lagemaße
Streuung
Inferenzstatistik
Kreuztabellen
 Allgemeines
 Gestaltung
 Graphiken
 Differenzen und
  Proportionen
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
unterschiede
Kovarianz/
Korrelation
Lineare
Regression
                FB 1   W. Ludwig-Mayerhofer     Statistik – Kreuztabellen      9


Grundlagen
Häufigkeiten             Formale Notation zur Bezeichnung
Lagemaße
Streuung
                          der Zellen (Beispiel: Vierfelder-
Inferenzstatistik                     Tabelle)
Kreuztabellen
 Allgemeines
 Gestaltung
                                              X=1                X=2          Σ
 Graphiken
 Differenzen und
  Proportionen          Y=1                   n11                  n12      n1•
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-          Y=2                   n21                  n22      n2•
  maße
Gruppen-
unterschiede            Σ                      n•1                 n•2      n ••
Kovarianz/
Korrelation
Lineare
Regression               Die Indices – hier für die Häufigkeiten
                         angegeben – gelten in analoger Weise auch
                         für die Anteilswerte pij
                FB 1   W. Ludwig-Mayerhofer       Statistik – Kreuztabellen   10


Grundlagen
Häufigkeiten             Formale Notation zur Bezeichnung
Lagemaße
Streuung
                          der Zellen: bedingte Anteilswerte
Inferenzstatistik
                                               X=1                 X=2
Kreuztabellen
 Allgemeines
 Gestaltung
 Graphiken
                        Y=1                   p1|X=1             p1|X=2
 Differenzen und
  Proportionen
 Chi-Quadrat-Test       Y=2                   p2|X=1             p2|X=2
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
unterschiede
Kovarianz/
Korrelation
Lineare
Regression
                FB 1   W. Ludwig-Mayerhofer          Statistik – Kreuztabellen           11


Grundlagen
Häufigkeiten               Anteilswerte/bedingte Anteilswerte:
Lagemaße
Streuung
                                   Hier: Anteilswerte
Inferenzstatistik                             X=1                  X=2              Σ
Kreuztabellen
 Allgemeines
 Gestaltung            Y=1                     p11                   p12           p1•
 Graphiken
 Differenzen und
  Proportionen         Y=2                     p21                   p22           p2•
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße                 Σ                       p•1                   p•2          p ••
Gruppen-
unterschiede                                  X=1                   X=2              Σ
Kovarianz/
Korrelation            Y=1                    36 %                27 %           63 %
Lineare
Regression
                       Y=2                    4%                  33 %           37 %

                       Σ                      40 %                60 %           100 %
                FB 1    W. Ludwig-Mayerhofer            Statistik – Kreuztabellen   12


Grundlagen
Häufigkeiten             Anteilswerte/bedingte Anteilswerte:
Lagemaße
Streuung
                             Hier: bedingte Anteilswerte
Inferenzstatistik
Kreuztabellen                                   X=1                   X=2
 Allgemeines
 Gestaltung
 Graphiken             Y=1                     p1|X=1               p1|X=2
 Differenzen und
  Proportionen
 Chi-Quadrat-Test      Y=2                     p2|X=1               p2|X=2
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
unterschiede                                   X=1                   X=2
Kovarianz/
Korrelation            Y=1                       90                    45
Lineare
Regression             Y=2                       10                    55
                FB 1   W. Ludwig-Mayerhofer            Statistik – Kreuztabellen    13


Grundlagen
Häufigkeiten                          Prozentsatzdifferenz
Lagemaße
Streuung
Inferenzstatistik      „Bei spaltenbezogener Prozentuierung kann
Kreuztabellen          die Differenz der Spaltenprozentwerte
 Allgemeines
 Gestaltung            innerhalb einer Zeile als Maß für die Stärke des
 Graphiken
 Differenzen und       Zusammenhangs herangezogen werden.“
  Proportionen
 Chi-Quadrat-Test
                       (K&K, S. 317)
 Größere Tabellen
                                        n11 n12 
                                        n − n  = 100 ⋅ ( p1| X =1 − p1| X = 2 )
 Assoziations-
  maße                  d XY % = 100 ⋅          
Gruppen-
unterschiede
                                        •1   •2 

Kovarianz/              Spaltenprozent11 − Spaltenprozent12
Korrelation
Lineare
Regression
                       Gilt in analoger Weise für Zeilenprozent, wenn
                       erklärende Variable als Zeilenvariable
                       angeordnet ist.
                FB 1   W. Ludwig-Mayerhofer             Statistik – Kreuztabellen   14


Grundlagen
Häufigkeiten                              Relatives Risiko
Lagemaße
Streuung                Das relative Risiko ist das Verhältnis zweier
Inferenzstatistik
Kreuztabellen
                        interessierender Anteilswerte. Im Beispiel: Das
 Allgemeines            Risiko von Arbeiterkindern, nur die Haupt-
 Gestaltung
 Graphiken              schule zu besuchen ist mit 90% / 45% = 2
 Differenzen und
  Proportionen          doppelt so groß wie das von Angestellten-
 Chi-Quadrat-Test
 Größere Tabellen       kindern. Allgemein:
 Assoziations-
  maße                        p1| X =1        wenn die unabhängige Variable als
Gruppen-               rr =
unterschiede                  p1| X = 2       Spaltenvariable abgetragen ist
Kovarianz/
Korrelation                   p1| X =1        wenn die unabhängige Variable als
                       rr =
Lineare                       p2| X =1        Zeilenvariable abgetragen ist
Regression

                       Statt der Prozentwerte in der ersten Zeile bzw. der ersten
                       Spalte können auch die Werte aus anderen Zeilen oder
                       Spalten zu einander in Beziehung gesetzt werden.
                FB 1    W. Ludwig-Mayerhofer            Statistik – Kreuztabellen   15


Grundlagen
Häufigkeiten                             Odds Ratio
Lagemaße
Streuung
                                   (Kreuzproduktverhältnis)
Inferenzstatistik
Kreuztabellen          Odds = „Gewinnchancen“; Ratio= Verhältnis.
 Allgemeines
 Gestaltung            Die Odds Ratio (im folgenden mit γ bezeichnet) ist also
 Graphiken
 Differenzen und       das Verhältnis der „Chancen“ von Arbeiterkindern auf
  Proportionen         einen Hauptschulbesuch zu den „Chancen“ von
 Chi-Quadrat-Test
 Größere Tabellen      Angestelltenkindern auf einen Hauptschulbesuch.
 Assoziations-
  maße
                                            360
Gruppen-               γ (1,2 | Arbeiter) =     = 9,0
unterschiede                                 40
Kovarianz/
                                                  270
Korrelation
                       γ (1,2 | Angestellter) =       = 0,818
Lineare                                           330
Regression
                            360 / 40 360 ⋅ 330   9
                       γ=            =         =     = 11
                            270 / 330 40 ⋅ 270 0,818
                FB 1   W. Ludwig-Mayerhofer      Statistik – Kreuztabellen            16


Grundlagen
Häufigkeiten                            Odds Ratio
Lagemaße
Streuung
                                  (Kreuzproduktverhältnis)
Inferenzstatistik
Kreuztabellen           Allgemein formuliert:
 Allgemeines
 Gestaltung

                                         n11 p1| X =1
 Graphiken
                                                                  Praktisch ist die
                       γ (1,2 | X = 1) =    =
 Differenzen und
  Proportionen                                                    Berechnung
 Chi-Quadrat-Test
 Größere Tabellen
                                         n21 p2| X =1             anhand von n
 Assoziations-
  maße
                                                                  vorzuziehen, da
Gruppen-                                 n12 p1| X = 2            die Anteilswerte
unterschiede           γ (1,2 | X = 2) =    =                     meist gerundet
Kovarianz/                               n22 p2| X = 2            vorliegen.
Korrelation
Lineare
                          n11 / n21 n11 ⋅ n22
Regression
                       γ=          =
                          n12 / n22 n12 ⋅ n21
                FB 1     W. Ludwig-Mayerhofer                    Statistik – Kreuztabellen               17


Grundlagen
Häufigkeiten
                              Prozentsatzdifferenz, RR oder OR?
Lagemaße
                                                             95                      95 / 5
Streuung                d XY % (1960 ) = 35; rr(1960 )     =    = 1,58; γ (1960 ) =         = 12,66
Inferenzstatistik                                            60                     60 / 40
Kreuztabellen
 Allgemeines
 Gestaltung                                                  90                   90 / 10
 Graphiken              d XY % ( 2000 ) = 45; rr( 2000 )   =    = 2; γ ( 2000 ) =         = 11
 Differenzen und                                             45                   45 / 55
  Proportionen
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
                       Spaltenprozent                      1960                              2000
unterschiede
Kovarianz/                    Väter: →            Arbeiter           Ange-           Arbeiter       Ange-
Korrelation
                       Kinder:↓                                      stellte                        stellte
Lineare
Regression             Hauptschule                         95             60                 90         45

                       RS/Gymnasium                          5            40                 10         55
                FB 1     W. Ludwig-Mayerhofer              Statistik – Kreuztabellen               18


Grundlagen
Häufigkeiten
                             Prozentsatzdifferenz, RR oder OR?
Lagemaße                      Erste vs. zweite Zeile (nur 2000)
Streuung
Inferenzstatistik                          90          90 / 10
Kreuztabellen            d XY % = 45; rr =    = 2; γ =         = 11
 Allgemeines                               45          45 / 55
 Gestaltung
 Graphiken                                      10               10 / 90
 Differenzen und        d XY % = −45; rr =         = 0.1818; γ =         = 0,09 = 1 / 11
  Proportionen                                  55               55 / 45
 Chi-Quadrat-Test
 Größere Tabellen
 Assoziations-
  maße
Gruppen-
                       Spaltenprozent                1960                              2000
unterschiede
Kovarianz/                    Väter: →          Arbeiter       Ange-           Arbeiter       Ange-
Korrelation
                       Kinder:↓                                stellte                        stellte
Lineare
Regression             Hauptschule                   95             60                 90         45

                       RS/Gymnasium                   5             40                 10         55