frihetsgrader används i hypotesprovning.
innehåll (Klicka för att hoppa till det avsnittet):
- Vad är frihetsgrader?
- DF: två prover
- frihetsgrader i ANOVA
- Varför minskar kritiska värden medan DF ökar?
Vad är frihetsgrader?
frihetsgrader i den vänstra kolumnen i t-distributionstabellen.,
frihetsgrader för en uppskattning är antalet oberoende bitar av information som gick in i beräkningen av uppskattningen. Det är inte riktigt samma som antalet objekt i provet. För att få df för uppskattningen måste du subtrahera 1 från antalet objekt. Låt oss säga att du hittade den genomsnittliga viktminskningen för en låg-carb diet. Du kan använda 4 personer, vilket ger 3 grader av frihet (4 – 1 = 3), eller du kan använda hundra personer med DF = 99.,
i matematiska termer (där ”n” är antalet objekt i din uppsättning):
frihetsgrader = n – 1
varför subtraherar vi 1 från antalet objekt?
Titta på videon för en snabb förklaring, eller läs vidare nedan:
ett annat sätt att titta på frihetsgrader är att de är antalet värden som är fria att variera i en datamängd. Vad betyder ”fritt att variera”? Här är ett exempel med medelvärdet (medelvärdet):
Q., Välj en uppsättning siffror som har ett medelvärde (genomsnitt) av 10.
A. vissa uppsättningar av siffror du kan välja: 9, 10, 11 eller 8, 10, 12 eller 5, 10, 15.
När du har valt de två första siffrorna i uppsättningen, är den tredje fast. Med andra ord kan du inte välja det tredje objektet i uppsättningen. De enda siffrorna som är fria att variera är de två första. Du kan välja 9 + 10 eller 5 + 15, men när du har fattat det beslutet måste du välja ett visst nummer som ger dig medelvärdet du letar efter. Så frihetsgrader för en uppsättning av tre nummer är två.,
till exempel: om du ville hitta ett konfidensintervall för ett prov är frihetsgrader n – 1. ”N” kan också vara antalet klasser eller kategorier. Se: kritiskt chi-kvadratiskt värde för ett exempel.
tillbaka till toppen
frihetsgrader: två prover
Om du har två prover och vill hitta en parameter, som medelvärdet, har du två ”n”s att överväga (prov 1 och Prov 2). Frihetsgrader i så fall är:
frihetsgrader (två prover): (N1 + N2) – 2.,
tillbaka till toppen
frihetsgrader i ANOVA
frihetsgrader blir lite mer komplicerade i ANOVA-tester. I stället för en enkel parameter (som att hitta ett medelvärde) innebär ANOVA-tester att man jämför kända medel i datamängder. Till exempel, i en enkelriktad ANOVA jämför du två medel i två celler. Det stora medelvärdet (medelvärdet av medelvärdet) skulle vara:
medelvärde 1 + medelvärde 2 = grand medelvärde.
vad händer om du väljer mean 1 och du visste grand mean? Du skulle inte ha ett val om Mean2, så dina frihetsgrader för en tvågrupp ANOVA är 1.,
två grupp ANOVA df1 = n – 1
för en tregrupp ANOVA kan du variera två medel så frihetsgrader är 2.
Det är faktiskt lite mer komplicerat eftersom det finns två grader av frihet i ANOVA: df1 och df2. Förklaringen ovan är för df1. Df2 i ANOVA är det totala antalet observationer i alla celler – frihetsgrader förlorade eftersom cellmedlen är inställda.,
två grupp ANOVA df2 = n – k
”k” i denna formel är antalet cellmedel eller grupper/villkor.
till exempel, låt oss säga att du hade 200 observationer och fyra cellmedel. Frihetsgrader i detta fall skulle vara: Df2 = 200 – 4 = 196.
tillbaka till toppen
varför minskar kritiska värden medan DF ökar?
Tack vare Mohammed Gezmu för denna fråga.,
Låt oss ta en titt på t-score-formeln i ett hypotestest:
När n ökar går t-poängen upp. Detta beror på kvadratroten i nämnaren: när det blir större blir fraktionen s / √n mindre och t-poängen (resultatet av en annan fraktion) blir större. Eftersom frihetsgraderna definieras ovan som n-1, skulle du tro att det t-kritiska värdet ska bli större också, men de gör det inte: de blir mindre. Detta verkar kontra intuitivt.,
tänk dock på vad ett T-test faktiskt är för. Du använder T-testet eftersom du inte känner till standardavvikelsen för din befolkning och därför vet du inte formen på din graf. Det kan ha korta, feta svansar. Det kan ha långa smala svansar. Du har bara ingen aning. Frihetsgraderna påverkar grafens form i t-fördelningen; när df blir större blir området i distributionens svansar mindre. När DF närmar sig oändligheten kommer t-fördelningen att se ut som en normal fördelning., När detta händer kan du vara säker på din standardavvikelse (vilket är 1 på en normal fördelning).
låt oss säga att du tog upprepade provvikter från fyra personer, ritade från en population med en okänd standardavvikelse. Du mäter deras vikter, beräkna den genomsnittliga skillnaden mellan provpar och upprepa processen om och om igen. Den lilla provstorleken på 4 kommer att resultera i en T-fördelning med feta svansar. De feta svansarna berättar att du är mer benägna att ha extrema värden i ditt prov., Du testar din hypotes på en alfa-nivå på 5%, vilket skär av de sista 5% av din distribution. Grafen nedan visar t-fördelningen med 5% avbröt. Detta ger ett kritiskt värde på 2,6. (OBS! Jag använder en hypotetisk t-distribution här som ett exempel-CV är inte exakt).
nu titta på den normala fördelningen. Vi har mindre risk för extrema värden med normal fördelning. Vår 5% alfa nivå skär av vid ett CV på 2.
tillbaka till den ursprungliga frågan ” varför minskar kritiska värden medan DF ökar?,”Här är det korta svaret:
frihetsgrader är relaterade till provstorlek (n-1). Om df ökar står det också att provstorleken ökar. diagrammet för t-fördelningen kommer att ha skinnier svansar och trycka det kritiska värdet mot medelvärdet.
tillbaka till toppen
referens:
Gerard Dallal. Den lilla handboken om statistisk praxis. Hämtad december 26 2015 härifrån.
Krister W Kerr, Howard K Hall, Stephen En Kozub. (2002). Gör statistik med SPSS. Sage Publikationer. s.68. Finns här.
Levine, D., (2014). Även du kan lära dig statistik och Analytics: en lättförståelig Guide till statistik och Analytics 3rd Edition. Pearson FT Press
——————————————————————————
behöver du hjälp med en läxa eller testfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert på området. Din första 30 minuter med en Chegg handledare är gratis!