Theorie Multi les 1 by 5RtS4h6

VIEWS: 0 PAGES: 16

									Theorie MVDA week 1.
Multipele Regressie Analyse-MRA.
MRA voorspelt afhankelijke intervalvariabele Y met meerdere
onafhankelijke intervalvariabelen of categorische variabelen X.
Interval= vele uitkomsten in interval mogelijk.
NOM= Categorisch= paar groepen, bijv. Man/Vrouw, Belg/Duits/Nederlander.

MRA met ongestandaardiseerde B.
Y = Constante B0 + B1 * X1 + B2 * X2 + e
Model geeft de voorspellende waarde van X1 en X2 op Y.
e geeft alle overige invloeden op Y die niet in Model zitten.
B1 laat het effect van X1 op Y zien als X1 met 1 punt stijgt,
terwijl X2 gelijk blijft.
    _         _         _
B0= Y – (B1 * X1 + B2 * X2)

Overzicht van de correlaties.
R= correlatie tussen gemeten Y en Modelschatting yPRED.
In tekening: A+B+C/Y
ryx1= correlatie Y en X1, niet gecorrigeerd voor X2.
In tekening: A+B/Y
ry(x1.x2)= part correlatie Y en X1,
           = unieke verklaring X1.                                  X1
In tekening: =A/Y

                                                            A
                                                  Y             B
                          C


                                                            X2

R2= correlatie (Y,X1)2 + part correlatie (Y,X2)2=(A+B)+C
R2= correlatie (Y,X2)2 + part correlatie (Y,X1)2=(B+C)+ A

MRA met gestandaardiseerde .
YZ = 1 * XZ1 + 2 * XZ2 + e (geen constante in Model).
Gestandaardiseerde XZ= (X-M)/S
Variabele met hoogste gestandaardiseerde  is belangrijkste voorspeller.
β is geschikt om variabelen te vergelijken die zijn gemeten in een
verschillende schaal, bijv. uren therapie met dosis medicijn.
1 laat het effect van X1 op Y zien als X1 met 1 standaard eenheid stijgt,
terwijl X2 gelijk blijft.
Simpel (=1 predictor X): β= rXY

t-toets.
t-toets of variabele X iets toevoegt aan overige X-variabelen.
Vergelijk met partcorrelatie.

F-change.
F-change om na te gaan of extra variabele(n) significant iets
toevoegen aan het Model dat je al hebt.
Het selecteren van variabelen X in Model.
Forward Enter begint met niks en laat de computer zoeken naar de meest
significante X en stopt als extra X niet meer significant is.
Backward Enter begint met alle X en laat de X weg met de slechtste
significantie totdat alle variabelen significant zijn.
Stepwise is variant op Enter iets met meer mogelijkheden om variabelen
in te voegen.
Hiërarchisch= theoriegeleid: Op basis van logisch denken voeg je
verklarende variabelen toe.

Spurieze correlatie= schijnsamenhang.
Wel gemeten correlatie (rX1Y > 0), maar geen causaal effect (YX1=0).
X1 en Y worden allebei beinvloed door X2.

                 X2

X1                            Y
Voorbeeld: Hoge inkomen ouders (X1) hangt samen met IQ van kinderen (Y).
Het IQ van de ouders verklaart allebei: Slimme ouders verdienen meer en krijgen
slimme kinderen. Kinderen worden niet slimmer als ouders meer gaan verdienen.

X2 heeft suppressor-effecten op X1.
Geen gemeten correlatie (rX1Y=0), maar wel causaal effect (YX1 > 0).
Er is relatie tussen X1 en Y, maar die wordt onderdrukt door X2.
Voorbeeld: Geen relatie tussen therapie (X1) en levensplezier (Y).
Het levensplezier voor de therapie (X2) is vaak laag,
komt door therapie weer op gemiddeld niveau.

X2 is Moderator.
Geen directe relatie X2 en Y.
X2 heeft wel invloed op relatie X1 en Y.
Voorbeeld: samenhang tussen kindermishandeling (X1) en Psychose
als volwassene (Y) is sterker als dagelijkse stress hoog is (X2).

Adjusted R Square= R2a
R2 schat samenhang Y en Model in steekproef.
R2a schat samenhang in de populatie.
Samenhang in populatie wordt door R2 overschat. Daarom R2a.

Multicollineariteit.
De X-en hangen onderling sterk samen.
Probleem als TOL < 0,1.
Voorbeeld: Verklaar lengte persoon met lengte linkerbeen en rechterbeen.
           1 van de 2 is overbodig.

Assumpties lineaire regressie.
1. Relatie tussen X en Y is lineair= recht lijntje.
2. Homoscedasticiteit= gelijke spreiding van e voor alle trajecten van X.
   Tekening met toenemende variantie        e-waarden


 Y                                             e


                                                0


                      X                                              X


3. errors zijn normaal verdeeld, meeste errors in de buurt
   van gemiddelde error=0 en weinig uitbijters.
   Uitbijters worden meestal verwijderd,
   maar dienen wel uitgebreid geanalyseerd te worden.
Theorie week 2.
Anova.
Anova onderzoekt of groepsgemiddelden van categorische variabelen
A en B verschillen op intervalvariabele y.

Enkelvoudig Anova.                                         Tweevoudig Anova.
De standaardvorm van de data:                                  B1    B2
Groep 1: y y y y y                                         A1 yyy    yyy
Groep 2: y y y                                             A2 yyy    yyy
Groep 3: y y y y                                           A3 yyy    yyy

F-toets in enkelvoudig Anova-model.
H0: Geen verschil Groepsgemiddelden: μ1= μ2= μ3
H1: Tenminste twee van de gemiddelden verschillen.

Anovamodel:
Bron      df      SS        MS                   F              significance
Between   K-1     SSBetween MSB=SSB/K-1          MSB/MSE        p-waarde
Within    N-K     SSE       MSE=SSE/N-K
C.Total   N-1     SST

N= aantal waarnemingen in de steekproef
K= aantal groepen in de steekproef
SST= SSBetween + SSE
F > CV-waarde en de H0 wordt verworpen
p-waarde < α en de H0 wordt verworpen (p-waarde is gegeven in SPSS)
R2= SSBetween/SST (meestal laag, dus al snel vrij hoog).
F voor significant verschil groepen, R2 voor belang van groepsindeling.

F-toets in tweevoudig Anova-model.
H0: Alle celgemiddelden gelijk.
H0: Alle A-gemiddelden gelijk
H0: Alle B-gemiddelden gelijk
H0: Geen interactie

Source      df          SS          MS                      F           sig
GROEP      AB-1         SSBetween   SSBet/AB-1              MSBet/MSE   p-value
A           A-1         SSA         SSA/A-1                 MSA/MSE     p-value
B           B-1         SSB         SSB/B-1                 MSB/MSE     p-value
AB         (A-1)(B-1)   SSAB        SSAB/(A-1)(B-1)         MSAB/MSE    p-value
ERROR       N-AB        SSE         SSE/N-AB
C.Total     N-1         SST

N= aantal waarnemingen in de steekproef
A= aantal A-klassen
B= aantal B-klassen
MODEL=       SSBetween = SSA + SSB + SSAB
dfMODEL=     AB-1         = A-1 + B-1 + (A-1)(B-1)
SST= MODEL + SSE (=error e)
p-value < α en de H0 wordt verworpen
η2= SSEFFECT/SST
η2PARTIAL= SSEFFECT/(SSEFFECT+SSE)

Verschil η2 en η2partial.
Stel SST=100
Met alleen Factor A verklaar je 80.
Dus 80% verklaard en 20 onverklaard.
Met Factor B erbij verklaar je 90.
Verklaring is met 10% gestegen (η2B=10%)
Van de 20 die je nog niet verklaard had, is nu de helft,
10 van 20, verklaard (η2Bpartial=50%).
Interactie.
Interactie treedt op als een combinatie van A en B een
apart effect heeft bovenop de hoofdeffecten A en B.
Voorbeeld: Dosis valium heeft effect. Dosis alcohol heeft effect.
De combinatie van valium en alcohol heeft extra effect
bovenop de 2 effecten afzonderlijk.

Voordelen van 2-weg Anova.
- Je hebt in een keer 2 effecten getest.
- Je hebt de invloed van A, gecorrigeerd voor de invloed van B.
- Je kunt interactie nagaan.
- Meer power voor A, want B en AB-effect verlagen error.

Als 3 categorische variabelen met resp. K, L en M groepen.
Hoofdeffecten:          K-1 + L-1 + M-1
Interactie 1e-orde:    (K-1)*(L-1) + (K-1)*(M-1) + (L-1)*(M-1)
Interactie 2e-orde:    (K-1)*(L-1)*(M-1)
Totaal aantal effecten: K*L*M - 1

Ongebalanceerde designs (=ongelijke aantallen per cel).
Als gebalanceerd: SSBetween= SSA + SSB + SSAB:
Toetsen met Type I.
Als unbalanced A en B afhankelijk. Vergelijkingen gelden niet meer:
Toetsen met Type III. Type III geeft de extra verklaring van elke variabele
(vergelijk met part correlatie).

De celgemiddelden in een figuurtje.
- Als lijntje pieken en dalen heeft        ->    A-effect.
- Als lijntje hoger ligt                   ->    B-effect.
- Als lijntjes niet parallel               ->    Interactie




                                                 B2                       B1


                                                 B1
                                                                          B2



       A1   A2   A3              A1   A2        A3            A1    A2   A3
Theorie MVDA week 3.
Ancova.
Onderzocht wordt het effect van 2 onafhankelijke variabelen
(de groepsindeling=categorisch en de covariaat x=interval)
op 1 afhankelijke interval variabele y.

Doelstelling Ancova.
1. Corrigeren van groepsgemiddelden voor systematische bias op covariaat.
   Als de groepen verschillend scoren op de covariaat, kan dit doorwerken
   op de y-waarden en dit vertekent het verschil tussen de
   groepsgemiddelden. Ancova haalt deze bias weg met adjusted means.
   Systematisch bias alleen als groepen verschillend scoren op covariaat.
2. De covariaat verkleint de errorvariantie.
   Als rxy(w)0 verlaagt de covariaat de error en kan het verschil tussen de
   groepen makkelijker worden aangetoond= meer power.

Het ANCOVA-model
Bron       SS       df      MS                  F             significance
C.Model    SSB*     K-1     MSB*=SSB*/K-1       MSB*/MSW*     p-waarde
Error      SSW*     N-K-1   MSW*=SSW*/N-K-1
C.Total    SST*

N= het aantal waarnemingen
K= het aantal groepen
F-Anova om te toetsen of gemiddelden verschillen.
F-Ancova om te toetsen of Adjusted Mean verschillen.

SSW*= (1 - r2xy(w)) * SSW
SST*= (1 - r2xy ) * SST
SSB*= SST* - SSW*
rxy is correlatie X en Y in populatie.
rxy(w) is correlatie X en Y per Groep.

Adjusted Mean.
Adjusted Mean is groepsgemiddelde gecorrigeerd voor de werking van de covariaat.
Formule: ADJUSTED MEAN= OBSERVED MEAN - b . (GROUPMEAN X - MEAN X OVERALL)
Of aflezen in tekening bij X-gemiddeld.

De voorwaarden voor Ancova.
- Alle voorwaarden Anova +:
1. Geen error= betrouwbaar gemeten.
2. Relatie x en y lineair (= recht lijntje).
3. Relatie x en y in alle groepen hetzelfde= homogeneity of regression
   slopes= parallelle regressielijnen= geen interactie Groep.

Speciaal geval. Interactie Covariaat X en groep.
Interactie betekent dat de relatie x en y per Groep verschilt
(dus niet voorwaarde 3).
Theorie MVDA, week 4.
Logistische regressieanalyse-LRA.
Regressieanalyse om te voorspellen          P < 0,5                 P > 0,5
of iets wel of niet gebeurt.                NIET                    WEL
Dat noem je een
dichotome kwalitatieve variabele.       P
Je schat de kans p.
Als p < 0,5: Je voorspelt: Niet.
Als p > 0,5: Je voorspelt: Wel.         0                    0,5              1

Basisbegrippen.
      eg      odds
p=        =
   1 + eg    1 + odds                   ODDS
g= schatting met logit

odds= kans wel/kans niet= p/(1-p)       0                    1                ∞
odds= eg
logit g= ln(ODDS)


                                        LOGIT


                                       -∞                   0                 ∞




Toetsen met Interval.                                 Toetsen met z en CV
Interval b1: b1  z* * SE                             z= b1/SE met CV=z*
Als b1=0 niet in interval -> b10                     z* in tabel
Conclusie: Stijging van x werkt door op de kans.

Interval Odds Ratio: e(b1  z* * SE)
Als Odds Ratio=1 niet in interval -> Odds Ratio1
Conclusie: Stijging van x werkt door op de Odds.

Wald t-toets.
H0: b1= 0
Wald= (b/s.e.)2
KW met X21 tabel en anders p-value in SPSS.
Als H1 eenzijdig, p-value SPSS/2 en nagaan of richting schatting b klopt.

Vergelijken van Groot model met Klein model.
H0: Groot model voegt niets toe aan Klein model.
H1: Groot model schat p significant beter dan Klein model.

Toetsingsgrootheid X2= -2LL Klein – -2LL Groot
-2LL= -2 Log Likelihood uit SPSS
-2LL is 0 als Model steekproef perfect voorspelt. Als voorspelling
steekproef slechter, -2LL groter. Dus hoe lager –2LL, hoe beter.

KW met X2df=m-n in tabel.
m= aantal variabelen Groot, n= aantal variabelen Klein
Je kan ook toetsen met steps.
Interpreteren van logit regressiemodellen.
Logit g= Constante + b1 * X1 + b2 * X2
Als X1 met 1 stijgt, stijgt logit met b1 -> relatie X en logit lineair.
Probleem: logit heeft geen begrijpelijke betekenis.
  LOGIT




                                       X

Odds:
Als X1 met 1 stijgt en X2 blijft gelijk, stijgt odds met Odds Ratio=eb1.
Relatie X met odds is exponentieel.
Probleem: odds blijft een beetje moeilijk te begrijpen.


   ODDS
                           OR > 1                            OR < 1




                               X                                      X


p:
Probleem: b1 heeft geen vaste betekenis.
De relatie tussen p en X1 verandert voor elke waarde van X2.
Voor constante waarde van X2 -> relatie X1 en p is S-vorm.
Een verandering van logit heeft het grootste effect op p als logit in de
buurt van 0.
Voorbeeld:
Model: Wel/niet voldoende= Talent + Inspanning.
Talent haalt sowieso voldoende. Inspanning verhoogt nauwelijks de kans.
Inspanning meest effectief voor iemand die qua talent op randje voldoende zit.

         1                                     1

     P                                     P

                       X2=Talent



                                                                          X2=Geen talent



         0                                     0
                    X1=inspanning                                                  X1
Kiezen van de juiste techniek.
Overzicht van de variabelen.
Een kwantitatieve variabele=numeriek geeft hoeveelheden.
Een kwalitatieve variabele=categorisch geeft kenmerken.
Een nominale (=naam geven) variabele is een kwalitatieve variabele.
Variabele heeft wel of niet een kenmerk.
Bijv.: Belg/Ned, Man/Vrouw.
Een ordinale (=rangordenen) variabele rangordent scores van laag naar hoog.
Afstand van 1 tot 2 ≠ afstand van 2 tot 3.
Bijv.: Uitslag na sportwedstrijd.
Een interval schaal gaat van laag naar hoog met vaste onderliggende schaal.
Afstand van 1 tot 2 = afstand van 2 tot 3.
Bijv: hoogte van gewicht.

Multipele Regressie Analyse-MRA.
MRA voorspelt intervalvariabele Y met meerdere intervalvariabelen
of Dummy variabelen X.
Ordinaal met 5-puntsschaal wordt vaak al als interval opgevat.
Dummy= nominaal of ordinaal

Logistische Regressie Analyse- LRA.
Regressieanalyse om te voorspellen of iets wel of niet gebeurt.
Dat noem je een binair=dichotoom (=wel/niet) categorische variabele.
Je schat de kans p.
Als p < 0,5: Je voorspelt dat het niet gebeurt.
Als p > 0,5: Je voorspelt dat het wel gebeurt.

Anova.
Anova onderzoekt of gemiddelde van groepen (onafhankelijk en meetniveau
nominaal of ordinaal) verschillen op afhankelijke intervalvariabele y.

Enkelvoudig Anova.                          Tweevoudig Anova.
De standaardvorm van de data:                   B1    B2
Groep 1: y y y y y                          A1 yyy    yyy
Groep 2: y y y                              A2 yyy    yyy
Groep 3: y y y y                            A3 yyy    yyy

Ancova.
Onderzocht wordt het effect van 2 onafhankelijke variabelen (de groepen=
nominaal en covariaat x=interval) op 1 afhankelijke interval variabele y.

Standaardvorm ANCOVA
A1     y: x x x x x
       x: x x x x x
A2     y: x x x x
       x: x x x x

Voorbeeld techniekkeuze.
Het voorspellen van iemands rekenvaardigheid.
Rekenvaardigheid kan je opvatten als intervalvariabele.

MRA.
Als je rekenvaardigheid verklaart met een aantal intervalvariabelen.
Bijv. met leeftijd, IQ, maar ook met dummies bijv jongen/meisje.

LRA.
Om te voorspellen of pabo-student wel of niet de rekentoets gaat halen.

ANOVA.
Enkelvoudig:
Om na te gaan of jongens en meisje verschil gemiddelde hebben op rekenen.
Tweevoudig:
Je voert behalve jongens/meisjes een tweede factor in bijv. ouders
wel/ niet academische opleiding.

ANCOVA.
Als je wil nagaan of jongens en meisje een verschillend gemiddelde hebben op rekenen en je
corrigeert op verschil in leeftijd.
Theorie MVDA, week 5.
Manova.
Manova onderzoekt of er een samenhang is tussen 1 of 2 onafhankelijke
categorische variabelen en een aantal afhankelijke interval variabelen y.

Multivariate variantie-analyse- Manova.
Manova kijkt of groepen anders scoren op meerdere variabelen y1, y2, y3.
Standaardvorm Manova.
    Y1   Y2 Y3
A1 y1    y2  y3
    y1   y2  y3
A2 y1    y2  y3
    y1   y2  y3

H0: 11= 12 en 21=22 en 31=32 (Groepen scoren hetzelfde op y1, y2 en y3)
pk met p=aantal variabelen (3) en k=aantal groepen (2)
H1: Groepen hebben verschillend gemiddelde op tenminste 1 variabele y.
of: Groepen scoren verschillend op een combinatie van variabelen.

Volgorde Manova -> Anova -> Multiple Comparison.
1. Eerst Multivariate toets of groepen verschillen op y1, y2, y3
   Multivariate toetsen: Pillai, Wilks, Hotelling en Roy
  (vaak zelfde conclusie)
2. Anova om te kijken of groepen verschil op alleen y1, y2 of y3
3. Multiple Comparison om te kijken hoe de groepen op y1, y2, y3
   verschillen.

Logica volgorde: Protected F.
Elke Anova heeft type I fout =0,05. Als je meerdere Anova-toetsen
uitvoert, loopt de totale foutkans op. Daarom 1 Manova met =0,05
voor alle Anova-toetsen. Alleen als die significant, verder met Anova.
Kritiek protected F:
1. Foutkans kan bij meerdere toetsen toch oplopen.
2. Anova houdt geen rekening met samenhang variabelen (DDA wel).

Belangrijke assumpties.
1. Multivariate normaliteit, dwz. alle y normaal verdeel (Manova robuust).
2. Homogeniteit van covariantiematrices, test Box’s M.
3. Onafhankelijke observaties.

Aansluitend op Manova: Descriptieve discriminant-analyse DDA.
Anova bekijkt variabele na variabele of de Groepen verschillen.
DDA beschrijft hoe Groepen verschillen op clusters van
samenhangende variabelen.
Bijv: Psychologen hoog op empatisch en creatief, wiskundigen hoog op gestructureerd en
techniek.

Discriminantfunctievariaten.
Discriminantfunctie combineert variabelen y zodat combinatie er
maximaal in slaagt Groepen van elkaar te onderscheiden.
Bijv. psycholoog scoort hoog op D1 en je ziet dat psycholoog   empatisch en creatief is
en niet structureel en technisch.
Totaal aantal Discriminantfuncties= minimum van k-1 en p
k= aantal groepen en p= aantal variabelen y
Alle discriminantfuncties samen reproduceren de oorspronkelijke dataset.
In onderzoek alleen de significante discriminantfuncties.

Discriminantfunctiegewichten geven de unieke bijdrage van de variabele
om de groepen te onderscheiden (als partcorrelaties).
Verschil Niet/Wel-Gestandaardiseerd hetzelfde als B en β in MRA.
Structuurcoefficienten geven totale bijdrage van de variabele
om de groepen te onderscheiden (= het beste voor analyse).
Als Groepsgemiddelden sterk verschillen op de discriminantfunctie
is die zeer geschikt om die groepen te onderscheiden.
Theorie MVDA week 6.
Standaardvorm Repeated Measures.
                      Y1 Y2 Y3
Groep 1 Persoon 1.    x   x   x
         Persoon 2.   x   x   x
         Persoon 3.   x   x   x
Groep 2 Persoon 4.    x   x   x
         Persoon 5.   x   x   x
         Persoon 6.   x   x   x

Manova- Repeated Measures.
Normaal Manova om te kijken of Groepen verschillen op meerdere variabelen.
Manova-RM om te kijken of p-1 orthogonale contrasten afwijken van 0.
Stap 1. Multivariaat: is tenminste 1 contrast ongelijk aan nul.
Stap 2. Welke contrasten significant ongelijk aan nul.
Stap 3. Onderzoek de significante contrasten zo goed mogelijk.

Redenen voor Repeated Measures.
A. Per persoon een aantal metingen over een bepaalde periode.
B. Per persoon alle behandelingen.
   Voordeel: geen verschil proefpersonen -> Minder error ->           meer power.

Nadelen repeated measures.
Latency (=volgorde) effecten= blijvend effect van test op proefpersoon.
Oplossing: counterbalancing= proefpersonen doen testen in verschillende volgorden.
Carry-over effect= tijdelijk effect van test op proefpersoon.
Oplossing: meer tijd nemen tussen de tests.

Contrast L.
L= c1 * Y1 + c2 * Y2 + c3 * Y3
L is contrast als c1 + c2 + c3= 0
Schatten van contrasten met groepsgemiddelden.

Orthogonale en lineair onafhankelijke contrasten.
Als p variabelen, p-1 orthogonale contrasten.
L1= v1 * Y1 + v2 * Y2
L2= v3 * Y3 + v4 * Y4
Orthogonaal als v1 * v3 + v2 * v4= 0
Als orthogonaal= alle info van extra contrast is uniek, geen overlap
Als lineair onafhankelijk= deel info is uniek (part correlatie > 0).

Planned comparison.
Als Manova-RM significant kan je een aantal van tevoren bedachte
logische contrasten toetsen (= planned comparison).
Als je alle contrasten gaat toetsen, krijg je teveel toetsen
(doe je met Post hoc) en wordt de kans op Type I fout te groot.

Verschillende type contrasten.
Simpel:     Je vergelijkt Y1 met    elke volgende meting (Y2/Y3 etc.).
Repeated:   Je vergelijkt Y2 met    Y1, Y3 met Y2, Y4 met Y3 etc.
Difference: Je vergelijkt Y2 met    Y1, Y3 met Y1/Y2, Y4 met Y1/Y2/Y3 etc.
Helmert:    Je vergelijkt Y1 met    Y2/Y3/Y4, Y2 met Y3/Y4, Y3 met Y4.

Polynomiale contrasten voor tijdreeksen met gelijke intervallen.
L1= -3/4 -1/4    1/4 3/4 voor lineaire trend
L2= 1/2 -1/2 -1/2 1/2 voor kwadratische trend
L3= -1/4   3/4 -3/4 1/4 voor cubic trend
Lineair, kwadratrisch en cubic in figuurtje.


      a. Geen enkele trend                        b. Stijgende lineaire trend                  c. Dalende lineaire trend
 Y                                            Y                                            Y




                                     Tijd                                           Tijd                                        Tijd

      1        2        3        4                 1        2        3          4              1        2        3         4


      d. Alleen kwadratische trend                e. Lineaire+kwadratische trend               f. Lineaire+kwadratische trend

 Y                                            Y                                            Y




                                       Tijd                                         Tijd                                       Tijd

      1        2        3        4                 1        2        3          4              1        2        3         4

      h. Cubic (=stijging-daling-stijging)        i. Lineair+cubic (algemene stijging
                                                     zwakt af en neemt weer toe)

 Y                                            Y




                                       Tijd                                         Tijd

      1        2        3        4                 1        2        3          4




Bij   b:   Als t=positief -> positieve trend.
Bij   c:   Als t=negatief -> negatieve trend.
Bij   e:   Kwadratische trend is negatief.
Bij   f:   Kwadratische trend is positief.
Theorie MVDA, week 7.
Inzichtelijk overzicht van de theorie:
Structural Equation Modelling=SEM.
SEM is een manier om complexe modellen te toetsen zoals Padanalyse

Bij 1: De correlatiematrix geeft gemeten correlaties tussen variabelen.
Met het independence model kan je toetsen of tenminste 1 van die gemeten
correlaties significant afwijkt van 0.

Bij 2: De Modeltoets om te kijken of model de dataset perfect verklaart.
Je kan ook een complex model vergelijken met een iets simpelere versie.
Trimmen om model simpeler te maken, verhogen om model complexer te maken.

Bij 3: Model beschrijft de dataset zelden helemaal perfect.
Daarom aanvullende criteria of model goed beschrijvend is.
Je kan ook elke relatie in het model afzonderlijk toetsen.

Bij 4: SEM geschikt voor allerlei complexe netwerken van relaties.
In dit vak alleen het padmodel.

1. De Correlatie-matrix.
Correlatiematrix geeft de gemeten correlaties tussen de Variabelen.
Residu zres= gemeten correlatie r - teruggeschatte corelatie r
Als zres > 0,1 -> probleem (Model verklaart slecht).
Ruwe residuen gebaseerd op covariantiematrix,
gestandaardiseerde residuen op correlatiematrix.

Independence Model.
H0: Alle correlaties tussen de variabelen= 0
H1: Tenminste 2 variabelen gecorreleerd.
X2df met df= n*(n+1)/2 - n
Als p < 0,05 H0 verwerpen.

2. Toetsen van Model.
H0: Model fit (verklaart gemeten cov. matrix perfect).
H1: Model niet fit.
X2df met df= aantal elementen cov. matrix - aantal modelparameters
Zie voor df: padmodel zonder meetfouten.
p < 0,05 -> H0 verwerpen, Model geen perfecte verklaring van cov. Matrix.

Vergelijken Groot Model met Simpel Model.
H0: Simpel Model goed.
H1: Groot Model beter.
X2VERSCHIL= X2SIMPEL - X2GROOT
dfVERSCHIL= dfSIMPEL - dfGROOT
p < 0,05, H0 verwerpen en Groot is beter.

Alleen als Simpel is genest in Groot.
Genest als alle Variabelen Simpel ook in Groot.
Simpel: X1, X2. Groot: X1, X2, X3, X4: Genest.
Simpel: X1, X2. Groot: X2, X3, X4, X5: Niet-genest.

Trimmen versus verhogen.
Trimmen= pijlen weghalen en verhogen= pijlen toevoegen.
Voorkeur voor het kleinste Model dat genoeg verklaart (=trimmen),
maar het Model moet wel genoeg verklaren (=verhogen).

Assumptie van normaliteit.
Residuen zijn normaal verdeeld en symmetrisch rond nulpunt met zwaartepunt
rond 0. Belangrijke voorwaarde voor SEM.
3. Aanvullende criteria voor toetsen model:
H0 zegt: Model perfect fit en bij grote N wordt deze H0 altijd verworpen,
want Model verklaart de gemeten cov. matrix nooit perfect.
Daarom aanvullende criteria of Model redelijk goed is.
RMSEA<0,05=excellent, 0,05<RMSEA<0,08=goed, 0,08<RMSEA<0,10=redelijk.
NFI/NNFI>0,90 of CFI>0,95 -> Model acceptabel.

Toetsen van Modelparameters.
H0: parameter=0
H1: parameter0
t= Estimate parameter/SE(parameter)
t > 2,0 -> H0 verwerpen en parameter significant in Model.

4. Padmodel zonder meetfouten (X en Y gemeten en niet latent).

             E1        E2

X1
X2           Y1        Y2
X3

Gemeten relaties: n.(n+1)/2 met n=aantal X en Y (=5*6/2=15)
Modelparameters: pijlen + onafhankelijke variabelen= 9 + 3= 12
In Padmodel gebruik je de gestandaardiseerde B’s (=Beta’s)

Padmodel met meetfouten (Variabelen latent en dus indicatoren).
Het meetmodel is de latente variabele met zijn indicatoren= Factor analyse.
Het structurele model geeft relaties tussen variabelen onderling=regressie.

 e      V1                    V4       e

 e      V2        F1   F2     V5       e

 e      V3                    V6       e

                       d

Error E heet bij latente variabele d=disturbance.
Kiezen van de juiste techniek.
Overzicht van de variabelen.
Een kwantitatieve variabele=numeriek geeft hoeveelheden.
Een kwalitatieve variabele=categorisch geeft kenmerken.
Een nominale (=naam geven) variabele is een kwalitatieve variabele.
Variabele heeft wel of niet een kenmerk.
Bijv.: Belg/Ned, Man/Vrouw.
Een ordinale (=rangordenen) variabele rangordent scores van laag naar hoog.
Afstand van 1 tot 2 ≠ afstand van 2 tot 3.
Bijv.: Uitslag na sportwedstrijd.
Een interval schaal gaat van laag naar hoog met vaste onderliggende schaal.
Afstand van 1 tot 2 = afstand van 2 tot 3.
Bijv: hoogte van gewicht.

Multipele Regressie Analyse-MRA.
MRA voorspelt intervalvariabele Y met meerdere intervalvariabelen
of Dummy variabelen X.
Ordinaal met 5-puntsschaal wordt vaak al als interval opgevat.
Dummy= nominaal of ordinaal

Logistische Regressie Analyse- LRA.
Regressieanalyse om te voorspellen of iets wel of niet gebeurt.
Dat noem je een binair=dichotoom (=wel/niet) categorische variabele.
Je schat de kans p.
Als p < 0,5: Je voorspelt dat het niet gebeurt.
Als p > 0,5: Je voorspelt dat het wel gebeurt.

Anova.
Anova onderzoekt of gemiddelde van groepen (onafhankelijk en meetniveau
nominaal of ordinaal) verschillen op afhankelijke intervalvariabele y.

Enkelvoudig Anova.                          Tweevoudig Anova.
De standaardvorm van de data:                   B1    B2
Groep 1: y y y y y                          A1 yyy    yyy
Groep 2: y y y                              A2 yyy    yyy
Groep 3: y y y y                            A3 yyy    yyy

Ancova.
Onderzocht wordt het effect van 2 onafhankelijke variabelen (de groepen=
nominaal en covariaat x=interval) op 1 afhankelijke interval variabele y.

Standaardvorm ANCOVA
A1     y: x x x x x
       x: x x x x x
A2     y: x x x x
       x: x x x x

Manova I.
Manova onderzoekt of 1 of 2 onafhankelijke categorische variabelen
(nominaal of ordinaal) andere gemiddelden hebben op een aantal
afhankelijke interval variabelen y.
Manova kijkt of groepen anders scoren op meerdere variabelen y1, y2, y3.
Standaardvorm Manova.
     Y1   Y2   Y3
A1   y1   y2    y3
     y1   y2    y3
A2   y1   y2    y3
     y1   y2    y3

Aansluitend op Manova: Descriptieve discriminant-analyse DDA.
Anova bekijkt variabele na variabele of de Groepen verschillen.
DDA beschrijft hoe Groepen verschillen op clusters van
samenhangende variabelen.
Bijv: Psychologen hoog op empatisch en creatief, wiskundigen hoog op
gestructureerd en techniek.
Repeated Measures=Manova II.
Manova-II gaat na hoe personen zich ontwikkelen over de tijd.
                      Y1 Y2 Y3
Groep 1 Persoon 1.    x   x   x
         Persoon 2.   x   x   x
Groep 2 Persoon 4.    x   x   x
         Persoon 5.   x   x   x

Padmodel.
Padmodel om een complex netwerk van regressievergelijkingen te toetsen.
        E1      E2

X1
X2      Y1      Y2
X3



Voorbeeld techniekkeuze.
Het voorspellen van iemands rekenvaardigheid.
Rekenvaardigheid kan je opvatten als intervalvariabele.

MRA.
Als je rekenvaardigheid verklaart met een aantal intervalvariabelen.
Bijv. met leeftijd, IQ, maar ook met dummies bijv jongen/meisje.

LRA.
Om te voorspellen of pabo-student wel of niet de rekentoets gaat halen.

ANOVA.
Enkelvoudig:
Om na te gaan of jongens en meisje verschil gemiddelde hebben op rekenen.
Tweevoudig:
Je voert behalve jongens/meisjes een tweede factor in bijv. ouders
wel/ niet academische opleiding.

ANCOVA.
Als je wil nagaan of jongens en meisje een verschillend gemiddelde hebben
op rekenen en je corrigeert op verschil in leeftijd.

MANOVA.
Je test of jongens en meisjes verschillende gemiddelden scoren op een
familie van variabelen bijv. rekenvaardigheid, taalvaardigheid en IQ.

MANOVA-Repeated Measures.
Je kijkt hoe een groepje jongens en meisjes zich op rekenvaardigheid
ontwikkelen over een periode van een aantal jaren.

DDA.
Je kijkt hoe jongens en meisjes verschillen op clusters van variabelen,
bijv. rekenen, taal, muzikaliteit, tekenen etc.

Factoranalyse.
Latente variabele Rekenvaardigheid verklaart een aantal gemeten variabelen
bijv. Hoofdrekenen, Tafels opzeggen, Optellen/aftrekken, Breuken.

Padanalyse.
IQ voorspelt rekenvaardigheid en rekenvaardigheid voorspelt Wiskundecijfer.
Lucy’s beeld van geluk is
dat ze op een mooie lentedag
met haar kleine kinderen
gaat picknicken in de duinen,
en dat haar kinderen,
over de duinen,
achter de vlinders aanrennen.

Als je iets aan dit materiaal hebt gehad,
ben je van harte welkom om een bedrag
van 2, 5, of 10 euro te doneren aan:

De Vlinderstichting,
Bankr.nr: 513.44.25
Wageningen.

zie voor info:
www.vlinderstichting.nl

								
To top