SPSS handleiding voor gevorderden

Document Sample
SPSS handleiding voor gevorderden Powered By Docstoc
					                   SPSS voor gevorderden
Meervoudige kruistabel
Voorbeeld: je wil weten hoeveel mensen uit je steekproef vrouw zijn, in welke
middelbare school ze studeren en wat voor type school dit is (vb. Stadschool,
school in plattelandsomgeving, ...):

Via Analyze, Custom Tables, MultiResponse Tables, variabelen overbrengen naar
rij en kolommen, bij optie statistics aanduiden: Tabel percentages en formaat
voor percentages (nl. Met teken van % erbij), Continue en OK.




SPSS voor gevorderden                                                           1
Als output krijg je dan:




Opbouw van een onderzoeksrapport
In elk survey onderzoek geef je informatie over hoeveel respondenten je
vragenlijst invulden. Indien er subjecten uit de analyses werden geweerd dan
moet hun aantal en de reden hiervoor worden vermeld (bvb. 5 vragenlijsten
werden uit het onderzoek geweerd omdat ze meer dan 50% van de vragen niet
beantwoord hadden).

Nadien moeten de respondenten beschreven worden aan de hand van hun
persoonskenmerken. De volgende persoonskenmerken worden in de meeste
vragenlijsten opgenomen : geslacht, leeftijd, woonplaats, nationaliteit, burgerlijke
staat en beroep.

Jullie hebben dit gezien in de vorige les: dit betekent dat je een overzicht zal
opvragen van de procentuele verhoudingen in je persoonsvariabelen (vb.
procentuele verhouding van alle mannen tegenover alle vrouwen in je steekproef)
Je vraagt dus een frequentietabel op in SPSS (Analyze, Descriptive statisctics,
Frequencies, variabele(n) overbrengen naar rechterkolom, aankruisen dat je wel
een frequentietabel wil opvragen, klik op OK).


a) Zijn je data representatief?
Nadat je een beschrijving hebt gegeven van je steekproef a.d.h.v. de
persoonskenmerken onderzoek je of je steekproef representatief is voor je
populatie. Dit doe je d.m.v. de "X2 -goodness-of-fit-toets".

Met de X2 -goodness-of-fit-toets kunnen we nagaan of een waargenomen
frequentieverdeling al of niet significant verschilt van een andere
frequentieverdeling. Deze andere theoretische frequentieverdeling kan
bijvoorbeeld de verdeling zijn in een vorig of vergelijkbaar steekproefonderzoek
zijn. We kunnen echter ook de verdeling in de populatie nemen.

In SPSS kunnen jullie deze toets niet berekenen. Bereken de X 2 -goodness-of-fit-
toets op representativiteit daarom best met pen en papier (dit is goed uitgelegd
in de lesnota's van docente Leen Lagasse).

Louter ter informatie: Er wordt in SPSS wel tweemaal de goodness-of-fit-toets vermeld. In
beide gevallen wordt er nagegaan in hoeverre je data passen bij een gegeven
regressiemodel.
Voorbeeld: je vindt meermaals in onderzoeken een bepaald regressiemodel terug voor de
variabelen geslacht, leeftijd, politieke voorkeur en mobiliteit. Als je dan onderzoek doet
hiernaar kan je nagaan of jouw data ook in dit regressiemodel past.



SPSS voor gevorderden                                                                    2
Deze twee methoden zijn:
1.) Analyze, Regression, Ordinal, bij output duid je aan dat je goodness-of-fit wil
berekenen, Continue en OK. De toets “goodness-of-fit” in SPSS gaat na in hoeverre je
data past op een gegeven regressiemodel. Je kan dus in SPSS een regressiemodel
opgeven en kijken in hoeverre je data daarmee overeenkomen.
2) Een andere mogelijkheid om X2 -goodness-of-fit-toets te bereken is door achtereen
volgens te klikken: Analyze, Regression, Multinomial Logistic, klik op Statistics, duid aan
dat je goodness-of-fit-toets wil bereken en klik op Continue en OK.



b) Formulering onderzoekshypothesen
In elk onderzoeksrapport moet je duidelijk je onderzoekshypothesen vermelden.
Je hebt verschillende mogelijke hypothese:
     Er is een samenhang tussen x en y
     Men kan een patroon ontdekken in de relatie tussen x en y
     Mijn bestudeerde groepen verschillen significant van elkaar
     Marktsegmentatie




De One-Sample T-test
Deze 1 steekproef T-toets test of je rekenkundig gemiddelde van 1 specifieke
variabele verschilt van een opgegeven constante.

Voorbeeld: Een frisdrankenproducent kan een steekproef nemen van enkele
flessen en kijken of de gemiddelde inhoud van deze flessen daadwerkelijk
overeenkomt met het opgegeven getal, namelijk 25 cl.
Soms is het belangrijk dat je opgegeven waarde vb. 25 cl niet te sterk verschilt
van de reële inhoud van je frisdrank (bvb. omwille van de winstmarges).

Je kan een One-sample-T-test bekomen door in de menubalk te kiezen voor de
volgende opdrachten: Analyze, Compare Means, One-Sample T Test, Selecteer
een variabele om te worden getest tegenover een specifieke waarde, geef een
numerieke waarde op en klik op OK.

Voorbeeld:
In een fictief onderzoek hebben we cijfergegevens over het IQ van HABE-
studenten, hun studieresultaat voor een bepaald vak en het aantal uren dat men
effectief studeerde voor dat vak.
We weten dat een gemiddeld IQ van een student die een richting van het lange
type volgt op een Hogeschool (dus licentiaatsniveau) rond de 112 ligt. We kunnen
nu nagaan of dit gemiddelde overeenkomt met onze steekproeftrekking van de
HABE-studenten.




SPSS voor gevorderden                                                                         3
In je outputvenster krijg je het volgende resultaat:




Betekenis: significantie van de t-toets is 0,496 (is groter dan 0,05) dus geen
significant verschil in onze steekproef in vergelijking met de populatie van
Hogeschoolstudenten.
Met andere woorden de fout die wordt gemaakt is relatief klein (te verwaarlozen)
ten opzichte van de waarde uit populatie/de constante.




Independent sample T-test for grouping variables
De onafhankelijke steekproeven T-toets vergelijkt de gemiddelde op een
bestudeerd kenmerk van 2 onafhankelijke steekproeven. Het bestudeerd
kenmerk moet minstens van interval niveau zijn!
Idealiter moeten de subjecten random verdeeld worden over deze 2 groepen,
zodat een verschillend gemiddelde het gevolg is van een bepaalde behandeling,
of gebrek aan behandeling en niet het gevolg van andere factoren (zoals een
verschillende samenstelling van onze 2 steekproeven op de persoonskenmerken).

Deze toets wordt vooral in de medische en psychologische wereld gebruikt
waarbij men een groep “patiënten” random zal toewijzen tot een groep die wel
een specifieke behandeling krijgt en een groep die deze behandeling niet krijgt.

Voorbeeld: Patiënten met een hoge bloeddruk worden random verdeeld over twee
groepen: over de periode van een maand dient men de ene groep een nieuw
medicijn toe en de andere groep krijgt een placebo-pil (een nep-pil zonder enige
werking maar met een identiek uiterlijk); men verwacht dat het nieuwe medicijn
de bloeddruk aanzienlijk zal doen dalen. Na een maand behandeling meet men
het effect van het nieuwe medicijn door de gemiddelde bloeddruk bij de placebo-
groep te vergelijken met de gemiddelde bloeddruk bij de behandelde groep.

Ook in de marketing wordt deze toets toegepast.
Voorbeeld: Je neemt twee woonwijken die qua samenstelling sterk op elkaar
gelijken. De ene woonwijk krijgt de reclamefolder voor een nieuw product niet in
de bus en de andere woonwijk wel. Je kan nadien meten of beide groepen van
elkaar verschillen in hun aankoopvolume voor dit nieuwe product.




SPSS voor gevorderden                                                              4
Vanuit de menu-opdrachten kies je : Analyze, Compare Means, Independent-
Samples T Test, selecteer een varaibele die je groep in twee verdeeld en dan klik
op de optie “definieer groepen”, geef de waarde in om de groepen te definiëren
(eventueel kan je het betrouwbaarheidsinterval veranderen).




Opmerking: voor de groepsvariabelen definieer je de 2 groepen door het opgeven
van een cut point/afbreekpunt of geef 2 waarden op:
    Gebruik specifieke waarden. Geef een waarde op voor groep 1 en een
      waarde voor groep 2. Cases met een andere waarden zullen uit de analyse
      worden geweerd. (Je kan ook waarden met decimalen na de komma
      opgeven.)
    Afbreekpunt. Geef een numerieke waarde op dat de dataset in 2 groepen
      verdeeld. De ene groep zal bestaan uit alle cases kleiner dan de
      opgegeven waarde en de tweede groep wordt gevormd door alle cases
      gelijk aan of groter dan de opgegeven waarde.
    Je kan ook steeds korte teksten opgeven om je steekproef te verdelen.
      Voorbeeld groep 1 “ja” en groep 2 “nee”. Cases met een andere tekst-
      waarde worden uit de analyse geweerd vb. “Yes”.




In je outputvenster van SPSS krijg je het volgende resultaat.




SPSS voor gevorderden                                                           5
Uit bovenstaande tabel kunnen we concluderen dat er geen significant verschil is
tussen beide groepen (0,166 is groter dan 0,05). Onze reclamefolder heeft dus
geen invloed gehad op het aankoopgedrag van onze consumenten.




Paired sample T-test
Deze toets test de nulhypothese dat twee rekenkundig gemiddelde gelijk zijn aan
elkaar. Deze test wordt gebruikt wanneer je twee groepen met elkaar kan
vergelijken. De Paired sample test wordt dan ook vooral toegepast bij pre- en
post metingen.
Voorbeeld: Je observeert personen in hun aankoopgedrag van een koffiemerk.
Eerst verzamel je gegevens over je consumentengroep. Nadien laat je dezelfde
groep consumenten een demonstratiesessie volgen over een nieuw merk van
koffie en je meet de veranderingen in hun aankoopgedrag.
Voorbeeld: Je hebt een groep patiënten met depressieve klachten. Vooraleer je ze
behandelt, neem je een vragenlijst af en meet je hun maat van depressieve
gedachten en gevoelens. Na de behandeling kan je met dezelfde vragenlijst
kijken of de gewenste positieve verandering is opgetreden.




One-way Anova
De one-way Anova toets is een enkelvoudige variantie-analyse die de hypothese
test dat verschillende groepen significant verschillen van elkaar op een
bestudeerd kenmerk (hun rekenkundig gemiddelden zijn verschillend).
In aansluiting bij deze techniek kan je ook nagaan welke groepen van elkaar
verschillen d.m.v. een post hoc test (vb. Bonferroni, Dunnett, Waller-Duncan,
Scheffé).

Een variantie-analyse stelt enkele voorwaarden aan je data vooraleer je deze
toets mag uitvoeren:



SPSS voor gevorderden                                                              6
      De afhankelijke variabele moet minstens van interval niveau zijn. De
       onafhankelijke variabele mag van nominaal niveau zijn maar moet
       numeriek gecodeerd zijn.
      De samenstelling van je steekproef moet aselect voltrokken zijn
      De steekproef moet getrokken zijn uit een populatie die de
       normaalverdeling benaderd.

Deze toets wordt vooral gebruikt als je steekproef is ingedeeld in verschillende
groepen en je wil nagaan of het kenmerk/gedrag dat je wil bestuderen verschilt
in deze groepen.
Voorbeeld: je kent de gegevens over het budget dat studenten krijgen van hun
ouders voor hun vrijetijdsbesteding. Deze gegevens werden verzameld bij vier
groepen studenten: de studenten handelswetenschappen, de studenten
bestuurskunde, de studenten sociale agogiek en de studenten industriële
wetenschappen. Door middel van de variantie-analyse kunnen we kijken of het
verkregen budget bij deze studenten verschilt afhankelijk van de richting die ze
studeren. Budget is dan de intervalvariabele die beïnvloed wordt door de gekozen
studierichting (= onze hypothese).

Variantie-analyse start je door: Analyze, Compare Means, One-Way Anova.




Uit de onderstaande tabel merk je dat er geen significant verschil is tussen onze
groepen. Studenten uit de verschillende studierichtingen krijgen dus evenveel
zakgeld van hun ouders.




SPSS voor gevorderden                                                               7
De bovenstaande variantie-analyse voeren we opnieuw uit en we vragen ons af of
er een verschil is in het geslacht: krijgen meisjes bijvoorbeeld een groter budget
dan jongens?




Er is een significant verschil tussen onze groepen. Om te weten te komen welke
groep meer zakgeld krijgt van zijn ouders vraag je een verkennende analyse aan
met statistieken: Analyze, Descriptive Frequencies, Explore, aanduiden dat je de
beschrijvende statistieken wil berekenen en OK.




In je outputvenster krijg je een onderstaande tabel waaruit je kan afleiden dat
het budget dat mannen ontvangen een rekenkundig gemiddelde heeft van 57,77
en vrouwen een rekenkundig gemiddelde van 68,12. Vrouwelijke studenten
krijgen dus significant meer zakgeld van hun ouders.




SPSS voor gevorderden                                                              8
Opmerking: indien je categorische onafhankelijke variabelen uit meer dan twee
groepen bestaat dan kan je steeds een aanvullende test opvragen die je meer
informatie geeft over de verschillen tussen de groepen onderling. Het kan
bijvoorbeeld zijn dat groep A sterk verschilt van groepen B, C en D maar B, C en
D niet sterk onderling verschillen. Deze test vraag je op door in het dialoogkader
van de variantieanalyse de optie „post hoc‟ aan te klikken. Je krijgt dan dit
dialoogkader waarin je de gewenste toets aanvinkt.




SPSS voor gevorderden                                                                9
Lineaire regressie
Doelstelling: het ontdekken van een patroon in de samenhang tussen x en y
zodat je in de toekomst voorspellingen kan doen over y indien x gegeven is.

Een kleinschalige observatie van 19 managers uit een multi-national resulteerde
in gegevens over de activiteiten die succesvolle managers uitvoeren. Het succes
van een manager werd bepaald door zijn positie in het bedrijf, het aantal
werkjaren en zijn positieve reputatie. Volgens het boek van H. Mintzberg “The
Nature of Managerial Work (1973)” zou het succes van een manager worden
bepaald door de grootte van het netwerk aan sociale interacties die een manager
uitbouwt buiten zijn afdeling. Voorbeelden van dergerlijke interacties zijn
telefoneren, emailen en face-to-face vergaderingen met klanten en leveranciers,
vergaderingen met andere afdelingen en public relations werk.

Om een scatterplot op te vragen: Graphs, Scatter, Simple, variabelen aanduiden,
bij statistics kruis je de optie R changed aan, Continue en OK.




Waarom wordt er bij de lineaire regressie een variantie-analyse gebruikt?
De F-toets geeft je informatie over de standaardschattingsfout. Men zal kijken of
er een verband is tussen de theoretische (regressielijn) en de empirische
(puntenwolk) en hoe groot schattingsfout is. Men gaat dus na of de afstand van
de punten/cases in je puntenwolk niet te sterk afwijken van je regressielijn. Als je
significantie groter is dan 0,05 dan houdt dit in dat je geen zinvolle regressielijn
kan vinden. (Berekende F-waarde is kleiner dan theoretische F-waarde, dus er is
geen significante verklaring van F. We kunnen dus geen regressiemodel opstellen
voor deze 2 variabelen.)

Als je in de volgende tabel kijkt kan je ook constateren dat het niet zinvol is om
een regressielijn voor deze puntenwolk te construeren.



SPSS voor gevorderden                                                                10
De t-toets onderzoekt hoe betrouwbaar je constante is. Ook hier kan je
vaststellen dat de betrouwbaarheid van je constante te klein is.




We voeren een tweede berekening uit met een andere dataset:




SPSS voor gevorderden                                                    11
Bij het bekijken van de F-toets zien we dat deze significant is: we kunnen voor
deze dataset dus een zinvolle regressielijn construeren.

y= a + bx

In dit voorbeeld is de regressievergelijking:

Y = 39.63 + 0.46 x

Voor elke stijging van succes met 1 eenheid zal de interacties stijgen met 0.46
eenheden.

Op basis van de regressievergelijking kan je y berekenen als je enkel de x-
waarde hebt voor een bepaald object. Voorbeeld: je weet van een manager
hoeveel interacties hij gemiddeld heeft: op basis van de regressielijn kan je een
voorspelling doen over het succes van deze manager in een bedrijf.

Haal uit de bovenstaande tabel de regressievergelijking en voorspel hoe succesvol
een manager zal zijn als hij 38 interacties heeft (met andere woorden voorspel de
y-waarde op basis van de regressievergelijking).

Success van de manager       = 39.63 +( 0.46 * 38 )
                             = 57.11


De sterkte van de lineaire samenhang tussen y en x wordt uitgedrukt in r2. Deze
r2 wordt ook wel determinatiecoëfficiënt genoemd en vertelt ons wat de proportie
is van de totale variatie in y die volgens de lineaire regressie door x wordt
verklaard.

Opm: Sum of Squares Regression / Sum of Squares Total = r-kwadraat changed


SPSS voor gevorderden                                                               12
Timeseries of tijdreeksen

De vorige analyses hebben allen (uitgenomen de paired-sample t test) betrekking
op observaties die op één tijdstip of in één bepaalde periode werden opgemeten.
Een tijdreeks beschrijft de ontwikkeling van een bepaald verschijnsel in de tijd.
Voorbeeld: beursnotaties, indexcijfers.

In een tijdsanalyse wordt de tijd als een verklarende variabele beschouwd. Bij het
bekijken van tijdreeksen zal je merken dat deze meestal een grillig verloop
hebben. Het is immers onwaarschijnlijk dat een verschijnsel zich gelijkmatig
ontwikkeld in de tijd. In feite veronderstelt men dat de werkelijke invloeden sterk
met de tijd correleren en dat daarom een tijdreeks voldoet voor de beschrijving
van de ontwikkeling in de tijd van een verschijnsel. Bij een tijdreeksanalyse
trachten we een structuur aan te brengen en de tijdreeks eventueel op te splitsen
in verschillende deelreeksen die elk een eigen regelmaat in de tijd
vertegenwoordigen. Op basis van die structuur zullen we dan voorspellingen doen
omtrent het verschijnsel.
Tijdreeksanalyses vereisen een datastructuur waarbij elke case/rij een set van
observaties bevat op een verschillend tijdstip en de lengte van de tijd is gelijk
voor alle cases (vb. dus niet case 2 een week later dan case 1 en case 3 een
maand later dan case 2).

Een trend in de tijd is een geleidelijke beweging van het verschijnsel in de tijd in
één richting (vb. een stijgende trend).
In je tijdreeks grafiek kan je ook golven vaststellen. Elke golfbeweging die zich in
elke periode op dezelfde wijze herhaalt wordt seizoensbeweging genoemd
(tenminste als deze beweging korter is dan een jaar).

Er zijn vier grafieken voor tijdreeksen die je in SPSS kan opvragen: sequence,
autocorrelations, cross-correlations en spectral. In deze les wordt enkele de
sequentiële grafiek behandeld.


Sequentiële grafische voorstelling van een tijdreeks
Je bekomt een grafische voorstelling van een sequentiële tijdreeks door
achtereenvolgens te klikken: Graphs, Sequence, tijdsvariabele overbrengen die
de tijdsas aanduidt, een numerieke variabele overbrengen naar de variabelenlijst
en OK.
De optie „transform‟ biedt je de mogelijkheid om je data te veranderen in: een
natuurlijk logaritme, een verschil/fluctuatie, een seizoensschommeling. Wanneer
je fluctuatie of seizoensschommeling selecteert moet je een positieve numerieke
waarde opgeven.
Opmerking: bij seizoensschommelingen moet je een “datum”-variabele hebben
gedefinieerd dat een periodieke component bevat (bvb. maanden). Zo‟n variabele
definieer je door de menu-opdracht “Data, Define Dates” in te geven.

In onderstaande dialoogkader vragen we een sequentiële voorstelling op voor de
goudprijs over een periode van 20 jaar. (opmerking: Het is hier onmogelijk
seizoensschommelingen op te vragen omdat de variabele tijd hiervoor korter
moet zijn dan een jaar).




SPSS voor gevorderden                                                             13
Selecteer de optie „format‟ om een te definiëren op welke as de tijdslijn moet
staan, welke type voorstelling je wenst en om een referentielijn weer te geven
voor het gemiddelde van de tijdslijn.




Met de vorige instellingen krijgen we de volgende output:




SPSS voor gevorderden                                                            14
Een tweede voorbeeld zal de seizoenbeweging illustreren.
Een ijsproducent wil de productie plannen voor het komende jaar. Om vast te
stellen hoeveel ijs hij dat jaar moet produceren, baseert hij zich op de afzetcijfers
van de voorbije jaren. Hij gaat er vanuit dat die ontwikkeling zich zal voortzetten.
We beschikken over de volgende gegevens:

                      Jaar     Kwartaal    Afzet (x 1000 liter)
                      1997        1                 78
                      1997        2                142
                      1997        3                172
                      1997        4                 84
                      1998        1                 90
                      1998        2                164
                      1998        3                188
                      1998        4                118
                      1999        1                102
                      1999        2                185
                      1999        3                203
                      1999        4                121
                      2000        1                104
                      2000        2                177
                      2000        3                208
                      2000        4                126
                      2001        1                 90
                      2001        2                200
                      2001        3                263
                      2001        4                139
                      2002        1                147
                      2002        2                262
                      2002        3                276
                      2002        4                177



SPSS voor gevorderden                                                              15
In SPSS moeten we nu een datum variabele definiëren. Via de menu-opdracht
„Data, Define dates‟ krijgen we het volgende venster waarin je aanduidt dat je
kwartaalschommelingen wil bestuderen:




In je dataset van SPSS zal een nieuwe variabele “date_” worden gecreërd op
basis van jaartal en kwartaalgegevens. Je kan nu een sequentiële grafiek
opvragen waar je de seizoensbewegingen in bekijkt.




Het volgende resultaat verschijnt op je scherm:




SPSS voor gevorderden                                                            16
Bij het opvragen van een sequentiële analyse van de afzet van ijs met de
variabele “date_” op de tijdsas en de optie “natuurlijk logaritme” (zonder de
seizoensbeweging te bestuderen), wordt de volgende grafiek in het output
venster getoond:




SPSS voor gevorderden                                                           17
Clusteranalyse

Het doel van clusteranalyse is cases/merken/producten/individuen in te delen in
groepen zodanig dat de cases een grote mate van overeenkomst vertonen met
cases uit dezelfde groep en een lage mate van overeenkomst met cases uit een
andere groep. De clusteranalyse bepaalt de overeenkomst op basis van de
waarde van elke case (merk, product, individu) voor de variabelen (kenmerken,
attributen, gedragingen, ...).
Het grote verschil met factoranalyse is dus dat een clusteranalyse n
individuen/cases zal verdelen in groepen afhankelijk van hun kenmerken op de m
variabelen. Factoranalyse wordt gebruikt om je aantal variabelen te reduceren
(bvb. een vragenlijst van 300 vragen verkorten naar een vragenlijst met 100
vragen) en zal dan ook de m variabelen groeperen over de n individuen.


Je hebt twee belangrijke clusteranalyses in SPSS. Ze kunnen beide worden
gehanteerd om marktsegmentatie te onderzoeken.
De k-means clusteranalyse is sneller dan de hiërachische maar heeft als nadeel
dat je op voorhand een specifiek aantal clusters moet definiëren.


Voorbeeld: Zijn er cluster van TV-programma‟s die eenzelfde publiek aanspreken?
Je kan de verschillende TV-programma‟s verdelen in groepen gebaseerd op de
karakteristieken van de kijkers (marksegmentatie). Of je kan de verschillende
steden van een land verdelen in groepen en kijken of er steden zijn die tot
dezelfde groep behoren. Steden die dan deel uitmaken van éénendezelfde cluster
kan je onderwerpen aan verschillende marketingstrategiën om zo te meten welke
strategie het meeste succes heeft.

Bij de k-means clusteranalyse krijg je een variantieanalyse: men zal trachten
groepen te vormen die daadwerkelijk significant van elkaar verschillen.
Op vlak van de statistieken krijg je bij een hierarchische clusteranalyse
ondermeer grafieken te zien zoals een dendogram.



Voorbeeld: een studie over ecologisch consumeren: we gaan na of we de
onderzochte studentenpopulatie (HABE-studenten) kunnen indelen in een
groepen volgens hun mate van ecologischer consumeren en hun kennis van
biologische en ecologische producten.


Hoe analyseer je een hiërarchische clusteranalyse?
Klik in de menubalk op: Analyze, Classify, Hierarchical Cluster, selecteer een
numerieke variabele als je cases wil clusteren, selecteer ten minste drie
variabelen als je variabelen wil groeperen.




SPSS voor gevorderden                                                            18
Plots vraag je op door de optie „plot‟ aan te klikken. In het onderstaande
dialoogkader kan je dan een dendogram aankruisen of icicle grafieken.




Opmerking: de verschillende analysetechnieken waarvan gebruik wordt gemaakt
bij een hiërarchische clusteranalyse vertonen verschillende gebreken. De meest
betrouwbare analysemethode is de methode van Ward en de UPGMA (average
linkage) (De Pelsmacker - Van Kenhove, uitgeverij Garant, 1999). Standaard
staat de average linkage methode ingesteld (between-groups linkage), in de optie
„method‟ kan je de techniek steeds wijzigen.



Hoe analyseer je een k-means clusteranalyse?
Klik in de menubalk op: Analyze, Classify, K-Means Cluster, selecteer een
numerieke variabele als je cases wil clusteren, selecteer ten minste drie
variabelen als je variabelen wil groeperen.


Zoals je in onderstaand dialoogkader kan zien moet je bij de K-Means analyse het
aantal clusters aanduiden. Werk niet in het wilde weg! Het is goed om eerst een




SPSS voor gevorderden                                                        19
hiërarchische clusteranalyse uit te voeren zodat je informatie hebt over het aantal
gewenste clusters.




Bij de optie „save‟ kan je aanduiden dat er een nieuwe variabele moet worden
aangemaakt die de cases in de verschillende clusters onderverdeelt. Dit is
interessant als je nadien beschrijvende statistieken wil opvragen van de
verschillende clusters.




Tenslotte nog dit: clusteranalyse gebeurt op basis van algoritmes, de wiskundige
uitleg wordt je in deze handleiding bespaart. Wil je je echter verdiepen in
clusteranalyse lees dan het hoofdstuk over clusteranalyse in het boek van De
Pelsmacker en Van Kenhove(1999, uitgeverij Garant).




SPSS voor gevorderden                                                           20

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:53
posted:12/14/2011
language:Dutch
pages:20