Docstoc

Interval for mu

Document Sample
Interval for mu Powered By Docstoc
					Advanced Statistics.

Theorie Regressie.
Regressie.
yi= Constante β0 + β1 . x1 + β2 . x2 + i
i ~ N(0,2) dwz. y onafhankelijk, normaal verdeeld met constante 
met i= 1 t/m n
x random of ingesteld door de onderzoeker.

                 DF          SS    MS        F
Regression       k           SS    MS=SS/k   F= MSRegression/MSResidual
Residual         r=n-k-1     SS    MS=SS/r
C Total          n-1         TSS

k=aantal verklarende variabelen (2=x1+x2)
n= aantal waarnemingen

F-Modeltoets: Alle β's=0.
H0: β1=β2=0
F= MSRegression/MSResidual
F ~ Fdf1df2 met df1=k en df2=r en KG altijd rechtszijdig, tabel 8.
SPSS: p-waarde aflezen bij C.Model

s²= MSResidual        (s=Modelfout)

             SSResidual
R2 = 1 -                   (=voorspelling van data door Model in steekproef)
                TSS

             MSResidual
R2a = 1 -                  (=voorspelling van data door Model in populatie)
             TSS/(n-1)

0 < R2,R2a < 1         (R2=1 is perfect)
0 < s² < ∞             (s²=0 is perfect)

Coefficients
Model     b      se(b)      t
Constant b0      se(b0)     b0/se(b0)
x1        b1     se(b1)     b1/se(b1)
x2        b2     se(b2)     b2/se(b2)

t-toets.
H0: β1=0 (In computeroutprint: Coefficients)
H0: β1-β2=0
H0: β1+β2-2β3=0

     schatting H0 - 0
t=
     se (schatting H0)

t.~ tr en KG in tabel 2 met r van het volledige model of toetsen met sig.

Interval voor β1, β1-β2 en Ey
Schatting  tr . se(schatting)
Schattingen: β1=b1, β1-β2=b1-b2, Ey=b0 + b1 . x1 + b2 . x2
F-Change voor vergelijken Complete en Reduced Model
H0: β1=β2=0 (df1=2)
H0: β1=β2 en β3=β4 (df1=2)
H0: β1=β2=β3 (df1=2)
H0: β1=0 (df1=1) (normaal t, mag ook met F)
H0: β1=β2 (df1=1) (normaal t, mag ook met F)

      (SSResidual,gereduceerd – SSResidual,volledig)/df1(=dfR0-dfR)
F=
                   s2 (volledige model)

df1= aantal variabelen dat uit model verdwijnt
F ~ Fdf1r en KG altijd rechtszijdig, tabel 8: df1 en df2=r volledige model.
SPSS: p-waarde met F-change.

Het aflezen   van covariances.
    X0 X1     X2
X0 10 20      30
X1 20 40      50
X2 30 50      60

var   b0= 10 -> se(b0)= √10
var   b1= 40
var   b2= 60
cov   (b0,b1)= 20
cov   (b0,b2)= 30
cov   (b1,b2)= 50

Rekenregel voor de variantie.
var (x + y) =       var(x) +      var(y) + 2   . cov(x,y)
var (x - y) =       var(x) +      var(y) - 2   . cov(x,y)
var (ax + by)= a2 . var(x) + b2 . var(y) + 2ab . cov(x,y)

Dummy + Interactie.
Geval 1. Normaal x Dummy
y= Constante + 1 . X + β2 . Dummy + β3 . Dummy*X
β2= verschil in hoogte van lijntje
β3= verschil in richting van lijntje

Overzicht van het toetsen.
A. Met de toetsingsgrootheid en het Kritieke Gebied.
- De tg. ligt in het KG en de H0 wordt verworpen.
- De tg. ligt niet in het KG en de H0 wordt niet verworpen.

B. Met de H0 en het betrouwbaarheidsinterval.
- De H0 ligt in het btbhi. en wordt niet verworpen.
- De H0 ligt niet in het btbhi. en wordt verworpen.
HA  -> toetsen met tweezijdig interval
HA < -> toetsen met bovengrens
HA > -> toetsen met ondergrens

C. Met p-waarde (sig) en de onbetrouwbaarheidsdrempel (=α).
- De p-waarde > α -> H0 niet verwerpen.
- De p-waarde < α -> H0 verwerpen.
p-waarde SPSS tweezijdig -> als HA eenzijdig -> delen door twee.
Bij eenzijdige overschrijdingskans: check richting schatting.
Theorie Anova.
Enkelvoudig Anova.
De standaardvorm van de data in enkelvoudig Anova:
A1: x x x x x
A2: x x x x
A3: x x x x x

De data geschreven in een regressiemodel:
yij= µ + αi + εij
met i=niveau A en j=aantal personen per groep
ε is EAS uit N(0,σ) met EAS= Enkelvoudige Aselecte Steekproef ->
assumpties gelden.
EyA1= µ + α1 (α1=gemiddelde groep 1 – steekproefgemiddelde)
EyA2= µ + α2
EyA3= µ + α3

De data met SPSS-parameters (als groep 3= referentiegroep):
EyA1= Intercept + Dummy1  (als sig, verschil A1 en A3)
EyA2= Intercept + Dummy2  (als sig, verschil A2 en A3)
EyA3= Intercept           (=gemiddelde groep 3)

F-toets.
H0: A1=A2=A3 -> α1=α2=α3=0
H1: Tenminste twee van de gemiddelden verschillen.
F= MSA/MSE
Onder H0 heeft F een F(a-1,N-a)-verdeling.
Onder H1 neigt F naar grote waarden en dus rechteroverschrijdingskans.
P(F > uitkomst)= p-waarde < α en de H0 wordt verworpen.

Source       SS          df          MS         F
C.Model      SST         a-1         SST/a-1    MST/s2
Intercept                1
A            SSA         a-1         SSA/a-1    MSA/s2
Error        SSE         r=N-a       s2=SSE/r
Total                    N
C.Total      TSS         N-1

C.Total= C. Model + SSE
SSA= SST= C.Model
a= aantal klassen
N= totaal aantal waarnemingen

t-toets:
H0: A1= constante
H0: A1 - A2= 0
H0: A1 - 1/2 . A2 - 1/2 . A3= 0

     schatting H0 – 0   (schatting H0 met klassegemiddelden)
t=
     se(schatting H0)

var(a . x1 - b . x2)= a2 . (s2/n1) + b2 . (s2/n2)
s2 uit volledige model, n=aantal waarnemingen per groep
KG met tr in tabel 2, r uit volledige model

Btbhi: schatting  tr . se(schatting)

Toetsen met Fisher´s LSD.
Verschil groepsgemiddelden > t . √[MSE . (1/n1+1/n2)]
Tweevoudig Anova additief.
De standaardvorm van de data in tweevoudig Anova:
    B1   B2
A1 xx    xx
A2 xx    xx

De data geschreven in een regressiemodel:
yij= µ + αi + βj + εij
met i=niveau A en j=niveau B

De verwachtingswaarde van elke cel:
    B1                    B2
A1 Intercept + a1 + b1   Intercept + a1 + b2
A2 Intercept + a2 + b1   Intercept + a2 + b2
De schattingen worden altijd in een computeruitdraai gegeven.

In een standaardtabel kan je toetsen of er verschil is tussen de gemiddelden
A1 en A2 en of er een verschil is tussen gemiddelden B1 en B2.
H0: A1=A2 -> α1=α2=0
H0: B1=B2 -> β1=β2=0
Additief orthogonaal.
Toetsen van hoofdeffecten met de volgende standaardtabel:
Source     SS       df          MS              F
C.Model    SST      a+b-2       SST/a+b-2       MST/s2
Intercept           1
A          SSA      a-1         SSA/a-1         MSA/s2
B          SSB      b-1         SSB/b-1         MSB/s2
                                 2
Error      SSE      r=N-a-b+2   s =SSE/r
Total               N
C.Total    TSS      N-1

SST= SSA + SSB
C.Total= C.Model + SSE

Tweevoudig Anova interactief.
    B1   B2
A1 xx    xx
A2 xxx xxx

De data geschreven in een regressiemodel:
yij= µ + αi + βj + (αβ)ij + εijk
met i=niveau A en j=niveau B en k=aantal per cel

De verwachtingswaarde van elke        cel (=celgemiddelde):
    B1                                B2
A1 Intercept + a1 + b1 + a1b1         Intercept + a1 + b2 + a1b2
A2 intercept + a2 + b1 + a2b1         Intercept + a2 + b2 + a2b2
De schattingen van de parameters worden altijd in een SPSS-uitdraai gegeven.

In   een standaardtabel kan je toetsen of er
1.   verschil is tussen de behandelingen (=celgemiddelden)
2.   of er interactie is
3.   of er verschil is tussen de gemiddelden van A1 en A2
4.   of er verschil is tussen de gemiddelden van B1, B2 en B3.

1.   H0:   A1B1= . . =A2B3 -> Geen verschil tussen de behandelingen.
2.   H0:   Geen interactie -> (αβ)11= . . = (αβ)22= 0
3.   H0:   A1=A2 -> α1=α2=0
4.   H0:   B1=B2= -> β1=β2=0
Source       SS          df          MS                  F
C.Model      SST         c-1         SST/c-1             MST/s2
Intercept                1
A            SSA         a-1         SSA/a-1             MSA/s2
B            SSB         b-1         SSB/b-1             MSB/s2
AxB          SSAB       (a-1)(b-1)   SSAB/(a-1)(b-1)     MSAB/s2
Error        SSE         r=N-c       s2=SSE/r
Total                    N
C.Total      TSS         N-1

C.Model= SSA + SSB + SSAB
C.Total= C.Model + SSE
c= aantal cellen met waarnemingen
a= aantal A-klassen
b= aantal B-klassen

t-toets:
H0: A1B1= constante
H0: A1B1 - A2B1= 0
H0: A1B1 - 1/2 . A1B2 - 1/2 . A1B3= 0

     schatting H0 - 0
t=
     se(schatting H0)

Schatting H0 met celgemiddelden
var H0 met s2/aantal waarnemingen in de cel
KG met tr in tabel 2, r uit volledige model

Btbhi bij t-toets: schatting  tr . se(schatting)

Het schatten van interactie contrasten
(geen interactie= verschil tussen A1 en A2 constant bij alle niveaus van B).
     B1      B2     B3
A1   a       b      c
A2   d       e      f

Interactiecontrasten:
H0: d – a= e – b= f - c
H0: b – a= e - d
H0: c – a= f - d
H0: c – b= f - e

Als orthogonaal geldt:
Orthogonaal als verhoudingen van aantallen waarnemingen per A en B
μA1 - μA2 = α1 - α2
μB1 – μB2 = β1 - β2
f - e - (c - b)= (αβ23 - αβ22) - (αβ13 - αβ12)

De celgemiddelden in een figuurtje.
- Als lijntje pieken en dalen heeft        ->   A-effect.
- Als lijntje hoger ligt                   ->   B-effect.
- Als lijntjes niet parallel               ->   Interactie
Theorie toetsen.

Interval voor .
1. =bekend
_
y  z . (/n)
z -> tabel 2 met f= inf

2. = niet bekend (=s)
_
y  t . (s/n)
t -> tabel 2 met f= n-1


n die een maximale halflengte E van het interval garandeert.
    z² . ²n=
      E²
z in tabel 2 met f= inf


Interval voor x - µy
1. d (=x-y), gepaarde waarnemingen.
_
d  t . (sd/n)
t -> tabel 2 met f= n-1


n die een maximale halflengte E van het interval garandeert.
    z² . ²
n=
      E²
n= n1= n2
z in tabel 2 met f= inf


2. x - µy, twee onafhankelijke steekproeven.
Gelijke varianties 2x =2y =²
 _ _
(x-y)  t . sP . (1/n1 + 1/n2)
t -> tabel 2 met f= n1 + n2 - 2

       n1 - 1                n2 - 1
sP²=             . s2x   +             . s2y
       n1+n2-2               n1+n2-2


n die een maximale halflengte E van het interval garandeert.
       z² . ²
n= 2 .
          E²
n= n1= n2
Testen van µ.

1.  is bekend.
H0: µ=µ0
HA: µ<µ0, µ>µ0, µµ0
    _
    y - µ0
z=            z ~ N(0,1)
      /n

Als HA waar is, neigt z naar grote en/of kleine waarden en daarom R en/of LKG.
KG: tabel 2 met f= inf

n die garandeert dat je verschil  met vindt.
   ²
n=    . [ z() + z(β)]²   [z(β) opzoeken in Tabel 1]
   ²
tweezijdig: /2,  niet delen door 2
= : µ-µ0 bij testen van μ, en verschil µx en µy bij vergelijken 2 gemiddelden.

2.  is onbekend.
H0: µ=µ0
HA: µ<µ0, µ>µ0, µµ0
     _
     y - µ0
t=
       s/n
t  tn-1
Als HA waar is, neigt t naar grote en/of kleine waarden en daarom R en/of LKG.
KG: tabel 2 met f=n-1

Testen µx - µy
1. d=(x-y), gepaarde waarnemingen.
H0: µx=µy
HA: µx<µy, µx>µy, µxµy
      _
      d
t =
    s/n
t  tn-1
Als HA waar is, neigt t naar grote en/of kleine waarden en daarom R en/of LKG.
KG: tabel 2 met f=n-1
n= n1= n2

2. x - µy, twee onafhankelijke steekproeven.
Gelijke varianties 2x =2y =²
H0: µx=µy
HA: µx<µy, µx>µy, µxµy
           _     _
           x - y                              n1 - 1              n2 - 1
t=                                       s2p=         . s2x   +             . s2y
    sp . (1/n1 + 1/n2)                       n1+n2-2             n1+n2-2

t  tn1 + n2 – 2
Als HA waar is, neigt t naar grote en/of kleine waarden en daarom R en/of LKG.
KG: tabel 2 met f= n1 + n2 - 2
Testen van ²
H0: ²=c
H1: ²c, <c, >c

      (n-1) . s²
=
 2

      c=H0
2 ~ 2df
LKG: linkerkant tabel 7 met df= n-1
RKG: rechterkant tabel 7 met df= n-1

Interval:
(n-1) . s²              (n-1) . s²
              < ² <
      2df                   2df

Ondergrens: rechterkant tabel 7
Bovengrens: linkerkant tabel 7

Testen van 2x =2y
H0: 2x    =    2y
H1:  x <, , > 2y
     2

F= s2x/s2y
F ~ Fv1v2
KG: table 8: LKG met 1/Fv2v1        en   RKG met Fv1v2 met v= n-1

Interval:
Ondergrens:     (s2x/s2y) . 1/Fv1v2
Bovengrens:     (s2x/s2y) . Fv2v1

Testen van :                                   Testen van 1 -2:
H0: = 0                                       H0: 1 - 2= 0
HA:  0, <0, >0                           HA: 1 - 2 0, <0, >0

      - 0                                          1 - 2
z=                                              z=
                                                 1-2
KG met tabel 2 en df= inf.                      KG met tabel 2 en df= inf.

Interval:                                       Interval:
  z .                                       1 - 2  z . 1-2
= y/n                                          1= y1/n1 en 2= y2/n2
        . (1-)                                           1 . (1-1)   2 . (1-2)
= [          ]                               1-2= [             +            ]
           n                                                   n1            n2

n die een maximale halflengte E van het interval garandeert.
   z2 . (1-)
n=
       E2
Als =onbekend is -> =0,5
Theorie verdelingsvrije toetsen.
Overzicht Verdelingsvrije toetsen.

1. Als systematisch verschil wordt getest tussen twee onafhankelijke
steekproeven: Wilcoxon voor onafhankelijke steekproeven= Mann-Whitney.
Wilcoxon sluit aan op theorie les 1, x – y met onafhankelijke data.

A   x        x        x       x    x
B   x        x        x       x    x

2. Als een systematisch verschil wordt getoetst tussen twee kenmerken met
gepaarde waarnemingen -> de Symmetrietoets van Wilcoxon= Signed Ranks.
Wilcoxon sluit aan op theorie les 3, d(=x-y).

    1.       2.       3.      4.   5.
A   x        x        x       x    x
B   x        x        x       x    x

3. Als een systematisch verschil wordt getoetst met data uit 3 of 4
onafhankelijke steekproeven -> Kruskal Wallis.
Kruskal Wallis sluit aan op theorie les 4, one-way Anova.

A: x     x        x       x   x
B: x     x        x       x
C: x     x        x       x   x

4. Als je wil toetsen of de scores in een aantal klassen overeenkomen met een
gegeven kansverdeling -> Goodness of fit.
Klasse 1: %= kans p
Klasse 2: %= kans p
5. Als rxk-tabel -> Pearson chi-kwadraat.
Als je wil weten of een aantal steekproeven op dezelfde manier scoren in een aantal
klassen.

Er zijn twee gevallen:
Homogeniteit:                           Associatie:
              A1 A2 A3                                           A1   A2   A3
Steekproef 1                         1 Steekproef   ->   B1           
Steekproef 2                                             B2           
Steekproef 3                                             B3           

Bij Wilcoxon, Kruskal Wallis en mediaan werk je met losse scores die je van laag naar
hoog kan rangordenen.
Bij Fisher, Chikwadraat en de aanpassingstoets werk je met het aantal scores
in een klasse.
1. The Wilcoxon Rank Sum Test= Mann-Whitney.
H0: Kansverdeling F(A)   =   Kansverdeling F(B)
H1: Kansverdeling F(A) <,,> Kansverdeling F(B)
T= som van rangtelnummers van kleinste steekproef (als gelijk kleinste)
KG in tabel 5

2. De Symmetrietoets van Wilcoxon= Signed Ranks.
H0: Kansverdeling F(A)   =   Kansverdeling F(B)
H1: Kansverdeling F(A) <,,> Kansverdeling F(B)
W+: som van de positieve rangtelnummers (=Sum of ranks in de computeruitdraai)
LKW in tabel 6. Gelijke scores doen niet mee. RKW= ½ . n (n+1) - LKW
Onder de H1 hebben grote en/of kleine waarden meer kans en dus een of
tweezijdige overschrijdingskans. Overschrijdingskans aflezen SPSS.

3. Toets van Kruskal Wallis.
H0: Geen verschil -> F(A)= F(B)= F(C)
H1: Wel verschil

     SSB(ranks)
H=
     SSW(ranks)

Onder de H0 neigt de tg. naar een 2k-1 verdeling.
KG rechterkant tabel 7 met df= k-1
k= aantal steekproeven in de proefopzet
Onder de H1 neigt de tg. naar grote waarden.
Toetsen met de overschrijdingskans in de computeruitdraai.

4. Goodness of fit.
H0: de kansverdeling klopt: π1= . . , π2= . .
H1: de kansverdeling klopt niet.

       (n - E)2
= 
 2

        E
n= de gemeten score
E= de score volgens de gegeven kansverdeling

Onder de H0 neigt de tg. naar een 2df verdeling
KG rechterkant tabel 7 met df
df= aantal klassen - 1
Onder de H1 neigt de tg. altijd naar grote waarden.
Toetsen met de overschrijdingskans in de computeruitdraai.
5. rxk-tabel met Chi-kwadraattoets.

5a: toetsen op homogeniteit.
H0: De kansen zijn voor alle behandelingen gelijk.
    π(A in steekproef 1)= π(A in steekproef 2), etc.
H1: H0 geldt niet.

5b: toetsen op associatie.
H0: Geen associatie: π(A1 en B1)= πA1 . πB1
H1: Wel associatie.

       (n - E)2
= 
 2

          E

n= de gemeten score
E= (rijsom . kolomsom) / totaalsom
(E moet minimaal 5 zijn voor goede normale benadering)

Onder de H0 neigt de tg. naar een 2df-verdeling
df= (r-1)(k-1), r=aantal rijen, k=aantal kolommen
Onder de H1 neigt de tg. altijd naar grote waarden en je toetst met de
overschrijdingskans in de computeruitdraai.

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:5
posted:6/29/2012
language:Dutch
pages:11
pptfiles pptfiles
About