Grader af frihed, der anvendes i hypotesetest.
indhold (Klik for at springe til dette afsnit):
- hvad er frihedsgrader?
- DF: to prøver
- frihedsgrader i ANOVA
- Hvorfor falder kritiske værdier, mens DF øges?
Hvad er frihedsgrader?
frihedsgrader i venstre kolonne i T-distributionstabellen.,
grader af frihed for et skøn er antallet af uafhængige stykker information, der gik til beregning af estimatet. Det er ikke helt det samme som antallet af elementer i prøven. For at få df til estimatet skal du trække 1 fra antallet af varer. Lad os sige, at du fandt det gennemsnitlige vægttab for en lav-carb diæt. Du kan bruge 4 personer, der giver 3 frihedsgrader (4 – 1 = 3), eller du kan bruge hundrede mennesker med df = 99.,
I matematik (hvor “n” er antallet af elementer i dit sæt):
Grader af Frihed = n – 1
Hvorfor skal vi trække 1 fra antallet af elementer?
Se videoen for en hurtig forklaring, eller læs videre nedenfor:
en anden måde at se på frihedsgrader er, at det er antallet af værdier, der frit kan variere i et datasæt. Hvad betyder “frit at variere”? Her er et eksempel ved hjælp af middelværdien (gennemsnittet):
Q., Vælg et sæt tal, der har en gennemsnitlig (gennemsnit) på 10.
A. Nogle sæt tal kan du vælge: 9, 10, 11 eller 8, 10, 12 eller 5, 10, 15.
når du har valgt de to første tal i sættet, er det tredje rettet. Med andre ord kan du ikke vælge det tredje element i sættet. De eneste tal, der frit kan variere, er de to første. Du kan vælge 9 + 10 eller 5 + 15, men når du har taget denne beslutning, skal du vælge et bestemt nummer, der giver dig den gennemsnitlige du leder efter. Så frihedsgrader for et sæt af tre tal er to.,
For eksempel: hvis du ønskede at finde et konfidensinterval for en prøve, er frihedsgrader n – 1. “N’ kan også være antallet af klasser eller kategorier. Se: kritisk chi-s .uare værdi for et eksempel.
Tilbage til toppen
frihedsgrader: to prøver
Hvis du har to prøver og vil finde en parameter, som gennemsnittet, har du to “n”s at overveje (prøve 1 og prøve 2). Frihedsgrader i dette tilfælde er:
frihedsgrader (to prøver): (N1 + N2) – 2.,
Tilbage til toppen
frihedsgrader i ANOVA
frihedsgrader bliver lidt mere komplicerede i ANOVA-test. I stedet for en simpel parameter (som at finde et middel) involverer ANOVA-test sammenligning af kendte midler i datasæt. For eksempel sammenligner du på en envejs ANOVA to midler i to celler. Den store middelværdi (gennemsnittet af gennemsnittet) ville være:
middelværdi 1 + middelværdi 2 = grand middelværdi.
Hvad hvis du valgte middelværdi 1 og du vidste den store middelværdi? Du ville ikke have et valg om Mean2, så dine frihedsgrader for en to-Gruppe ANOVA er 1.,
To Gruppe ANOVA df1 = n – 1
For en tre-gruppen ANOVA, kan du variere to midler, så frihedsgrader er 2.
det er faktisk lidt mere kompliceret, fordi der er to frihedsgrader i ANOVA: df1 og DF2. Forklaringen ovenfor er for df1. Df2 i ANOVA er det samlede antal observationer i alle celler – grader af friheder tabt, fordi cellemidlerne er indstillet.,
To Gruppe ANOVA df2 = n – k
“k” i denne formel er antallet af celle betyder eller grupper/forhold.lad os sige, at du havde 200 observationer og fire celle midler. Frihedsgrader i dette tilfælde ville være: Df2 = 200 – 4 = 196.
Tilbage til toppen
Hvorfor falder kritiske værdier, mens DF øges?
tak til Mohammed ge .mu for dette spørgsmål.,
Lad os tage et kig på t-score formel i en hypotesetest:
Når n stiger, t-score går op. Dette skyldes kvadratroden i nævneren: når den bliver større, bliver fraktionen s/n n mindre, og t-scoren (resultatet af en anden brøkdel) bliver større. Da frihedsgraderne er defineret ovenfor som n-1, ville du tro, at den T-kritiske værdi også skulle blive større, men de gør det ikke: de bliver mindre. Dette virker modintuitivt.,
tænk dog på, hvad en t-test faktisk er til. Du bruger T-testen, fordi du ikke kender standardafvigelsen for din befolkning, og derfor kender du ikke formen på din graf. Det kunne have korte, fede haler. Det kunne have lange tynde haler. Du har bare ingen id.. Frihedsgraderne påvirker grafens form i T-distributionen; når df bliver større, bliver området i halerne af distributionen mindre. Når df nærmer sig uendelig, ser t-distributionen ud som en normal fordeling., Når dette sker, kan du være sikker på din standardafvigelse (som er 1 på en normal fordeling).lad os sige, at du tog gentagne prøvevægte fra fire personer, trukket fra en population med en ukendt standardafvigelse. Du måler deres vægte, beregner den gennemsnitlige forskel mellem prøveparene og gentager processen igen og igen. Den lille prøvestørrelse på 4 vil resultere i en t-fordeling med fedthaler. De fede haler fortæller dig, at du er mere tilbøjelig til at have ekstreme værdier i din prøve., Du tester din hypotese på et alfaniveau på 5%, hvilket afskærer de sidste 5% af din distribution. Grafen nedenfor viser t-fordelingen med en 5% afskåret. Dette giver en kritisk værdi på 2,6. (Bemærk: Jeg bruger en hypotetisk t-distribution her som et eksempel–CV ‘ et er ikke nøjagtigt).
Se nu på den normale distribution. Vi har mindre chance for ekstreme værdier med den normale fordeling. Vores 5% alpha niveau skærer ved et CV på 2.
Tilbage til det oprindelige spørgsmål “Hvorfor falder kritiske værdier, mens DF stiger?,”Her er det korte svar:
frihedsgrader er relateret til prøvestørrelse (n-1). Hvis df øges, står det også, at prøvestørrelsen stiger; grafen for T-distributionen vil have tyndere haler, hvilket skubber den kritiske værdi mod gennemsnittet.
Tilbage til Toppen
Reference:
Gerard Dallal. Den lille håndbog om statistisk praksis. Hentet 26. December 2015 herfra.Alistair Ker Kerr, Ho .ard K Hall, Stephen a Ko .ub. (2002). Gør statistik med SPSS. Sage Publikationer. s. 68. Tilgængelig her.
Levine, D., (2014). Selv Du kan lære statistik og Analytics: en let at forstå Guide til statistik og Analytics 3. udgave. Pearson FT Press
——————————————————————————
brug for hjælp til et hjemmearbejde eller testspørgsmål? Med Chegg Study kan du få trinvise løsninger på dine spørgsmål fra en ekspert på området. Din første 30 minutter med en Chegg tutor er gratis!