problemformulering
Måske du ønsker at teste, om der er en statistisk signifikant lineær sammenhæng mellem to kontinuerte variabler, vægt og højde (og i forlængelse heraf udlede, hvorvidt foreningen er betydelig i befolkningen). Du kan bruge en bivariat Pearson-korrelation til at teste, om der er et statistisk signifikant lineært forhold mellem højde og vægt, og til at bestemme styrken og retningen af foreningen.,
før testen
i prøvedataene bruger vi to variabler: “højde” og “vægt.”Variablen” højde ” er et kontinuerligt mål for højde i tommer og udviser en række værdier fra 55.00 til 84.41 (analyser > Beskrivende statistik > Beskrivende statistik). Variablen” vægt ” er en kontinuerlig måling af vægt i pund og udviser en række værdier fra 101.71 til 350.07.
før vi ser på Pearson-korrelationerne, skal vi se på scatterplots af vores variabler for at få en ide om, hvad vi kan forvente., Især skal vi afgøre, om det er rimeligt at antage, at vores variabler har lineære relationer. Klik på grafer > Legacy dialoger> Scatter / Dot. Klik på simpel Scatter i Scatter / Dot-vinduet, og klik derefter på Definer. Flyt variabel højde til box-Akseboksen, og flyt variabel vægt til Y-Akseboksen. Når du er færdig, skal du klikke på OK.
for at tilføje en lineær pasform som den afbildede skal du dobbeltklikke på plottet i Outputviseren for at åbne Diagrameditoren., Klik på elementer > Tilpas linje i alt. I vinduet Egenskaber skal du sørge for, at Fit-metoden er indstillet til lineær, og klik derefter på Anvend. (Bemærk, at tilføje den lineære regression tendens linje vil også tilføje R-kvadreret værdi i marginen af plottet. Hvis vi tager kvadratroden af dette tal, skal den matche værdien af Pearson-korrelationen, vi opnår.fra scatterplot kan vi se, at når højden stiger, har vægten også en tendens til at stige. Der synes at være nogle lineære forhold.,
kør testen
for at køre den bivariate Pearson-korrelation skal du klikke på Analyser>korrelere> Bivariate. Vælg variablernes højde og vægt, og flyt dem til feltet variabler. Vælg Pearson i området korrelationskoefficienter. I test of Significance-området skal du vælge din ønskede signifikanstest, to-tailed eller one-tailed. Vi vælger en to-tailed signifikanstest i dette eksempel. Marker afkrydsningsfeltet ud for Mark significantr signifikante korrelationer.
Klik på OK for at køre den bivariate Pearson korrelation., Output til analysen vises i Outputviseren.
syntaks
CORRELATIONS /VARIABLES=Weight Height /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.
Output
tabeller
resultaterne viser korrelationerne i en tabel, mærket korrelationer.
En Korrelation på Højde med sig selv (r=1), og antallet af nonmissing observationer højde (n=408).
b korrelation mellem højde og vægt (r=0, 513), baseret på n=354 observationer med parvise ikke-mangfoldige værdier.
c korrelation mellem højde og vægt (r=0.,513), baseret på n=354 observationer med parvise nonmissing værdier.
D korrelation af vægt med sig selv (r=1), og antallet af ikke-modbydelige observationer for vægt (n=376).
de vigtige celler, vi vil se på, er enten B eller C. (celler B og C er identiske, fordi de indeholder information om det samme par variabler.) Celler B og C indeholder korrelationskoefficienten for korrelationen mellem højde og vægt, dens p-værdi og antallet af komplette parvise observationer, som beregningen var baseret på.,
korrelationerne i hoveddiagonalen (celler A og D) er alle lig med 1. Dette skyldes, at en variabel altid er perfekt korreleret med sig selv. Bemærk dog, at prøvestørrelserne er forskellige i celle A (n=408) versus celle D (n=376). Dette er på grund af manglende data-der er flere manglende observationer for variabel vægt end der er for variabel højde.
Hvis du har valgt at markere signifikante korrelationer, markerer SPSS et 0,05 signifikansniveau med en stjerne (*) og et 0,01 signifikansniveau med to stjerner (0,01)., I celle B (gentaget i celle C) kan vi se, at Pearson korrelationskoefficienten for højde og vægt er .513, hvilket er signifikant (p < .001 for en to-tailed test), baseret på 354 komplette observationer (dvs.tilfælde med nonmissing værdier for både højde og vægt).
beslutning og konklusioner
baseret på resultaterne kan vi angive følgende: