Stupně svobody: co to jsou?

Sdílet na

stupně volnosti se používají při testování hypotéz.
Obsah (kliknutím přeskočíte do této sekce):

  1. jaké jsou stupně volnosti?
  2. DF: Dva vzorky
  3. stupně volnosti v ANOVA
  4. proč se kritické hodnoty snižují při zvýšení DF?

jaké jsou stupně volnosti?

stupně volnosti v levém sloupci tabulky distribuce T.,

stupně volnosti odhadu je počet nezávislých informací, které šly do výpočtu odhadu. Není to úplně stejné jako počet položek ve vzorku. Chcete-li získat DF pro odhad, musíte odečíst 1 od počtu položek. Řekněme, že jste našli střední ztrátu hmotnosti pro dietu s nízkým obsahem sacharidů. Dalo by se použít 4 lidé, dávat 3 stupně volnosti (4 – 1 = 3), nebo byste mohli použít sto lidí s df = 99.,

V matematických pojmech (kde „n“ je počet položek v sadě):

Stupně Volnosti = n – 1

Proč jsme odečíst 1 od počtu položek?
Podívejte se na video pro rychlé vysvětlení, nebo si přečtěte níže:

přijměte prosím statistiky, marketingové soubory cookie pro sledování tohoto videa.

dalším způsobem, jak se podívat na stupně volnosti, je to, že se jedná o počet hodnot, které se v datové sadě mohou volně lišit. Co znamená“ volná změna“? Zde je příklad použití střední (průměrné):
Q., Vyberte sadu čísel, která mají průměr (průměr) 10.
a. některé sady čísel můžete vybrat: 9, 10, 11 nebo 8, 10, 12 nebo 5, 10, 15.
jakmile vyberete první dvě čísla v sadě, třetí je pevná. Jinými slovy, nemůžete vybrat třetí položku v sadě. Jediná čísla, která se mohou volně lišit, jsou první dvě. Můžete si vybrat 9 + 10 nebo 5 + 15, ale jakmile učiníte toto rozhodnutí, musíte si vybrat konkrétní číslo, které vám dá střední hodnotu, kterou hledáte. Takže stupně volnosti pro sadu tří čísel jsou dvě.,

například: pokud jste chtěli najít interval spolehlivosti vzorku, stupně volnosti jsou n-1. „N“ může být také počet tříd nebo kategorií. Viz: například kritická hodnota chi-square.
Zpět na začátek

stupně volnosti: Dva vzorky

Pokud máte dva vzorky a chcete najít parametr, jako je průměr, musíte zvážit dvě „n“(vzorek 1 a vzorek 2). Stupně volnosti v tomto případě jsou:

stupně volnosti (Dva vzorky): (N1 + N2) – 2.,

Zpět na začátek

Stupňů Volnosti v ANOVA

Stupně volnosti se stává trochu složitější, v ANOVA testů. Namísto jednoduchého parametru (jako je nalezení střední hodnoty) zahrnují testy ANOVA porovnání známých prostředků v sadách dat. Například v jednosměrné Anově porovnáváte dva prostředky ve dvou buňkách. Velký průměr (průměr průměr průměrů) by byl:
Střední 1 + střední 2 = velký průměr.
co když si vyberete mean 1 a znáte grand mean? Na Mean2 byste neměli na výběr, takže vaše míra volnosti pro DVOUSKUPINOVOU ANOVU je 1.,

Dvě Skupiny ANOVA df1 = n – 1

Na tři skupiny ANOVA, ty se mohou lišit znamená, tak stupňů volnosti je 2.

je to vlastně trochu složitější, protože v Anově jsou dva stupně volnosti: df1 a df2. Vysvětlení výše je pro df1. Df2 v Anově je celkový počet pozorování ve všech buňkách – stupně svobod ztracené, protože jsou nastaveny buněčné prostředky.,


dvě skupiny ANOVA df2 = n – k

„K“ v tomto vzorci je počet buněčných prostředků nebo skupin / podmínek.
například, řekněme, že jste měli 200 pozorování a čtyři buněčné prostředky. Stupně volnosti by v tomto případě byly: Df2 = 200-4 = 196.
Zpět na začátek

proč se kritické hodnoty snižují při zvýšení DF?

díky Mohammedovi Gezmu za tuto otázku.,

podívejme se na vzorec T-skóre v testu hypotézy:

když se n zvyšuje, t-skóre stoupá. Je to kvůli druhé odmocnině ve jmenovateli: jak se zvětší, zlomek s/√n se zmenší a t-skóre (výsledek jiného zlomku) se zvětší. Jako stupně volnosti jsou definovány výše jako n-1, by si myslíte, že t-kritická hodnota by měla získat větší moc, ale oni nemají: jsou menší. To se zdá být kontraintuitivní.,


Nicméně, myslím, že o tom, co t-test je vlastně pro. Používáte t-test, protože neznáte směrodatnou odchylku vaší populace, a proto neznáte tvar grafu. Může mít krátké, tlusté ocasy. Mohlo by to mít dlouhé hubené ocasy. Prostě nemáš tušení. Stupně volnosti ovlivňují tvar grafu v t-distribuci; jak se df zvětšuje, plocha v ocasech distribuce se zmenšuje. Jak se df blíží nekonečnu, bude t-distribuce vypadat jako normální distribuce., Když k tomu dojde, můžete si být jisti svou směrodatnou odchylkou (což je 1 na normální distribuci).

řekněme, že jste odebrali opakované vzorkovací závaží od čtyř lidí, čerpané z populace s neznámou směrodatnou odchylkou. Změříte jejich váhy, vypočtete průměrný rozdíl mezi páry vzorků a opakujte proces znovu a znovu. Malá velikost vzorku 4 bude mít za následek distribuci t s tukovými ocasy. Tlusté ocasy vám říkají, že máte větší pravděpodobnost, že ve vzorku budete mít extrémní hodnoty., Testujete svou hypotézu na alfa úrovni 5%, která odřízne posledních 5% vaší distribuce. Níže uvedený graf ukazuje rozdělení t s odříznutím 5%. To dává kritickou hodnotu 2.6. (Poznámka: jako příklad zde používám hypotetickou t-distribuci-životopis není přesný).


nyní se podívejte na normální distribuci. Máme menší šanci na extrémní hodnoty s normálním rozdělením. Naše 5% hladina alfa se odřízne v životopisu 2.

zpět na původní otázku “ Proč se kritické hodnoty snižují, zatímco DF se zvyšuje?,“Zde je krátká odpověď:

stupně volnosti souvisí s velikostí vzorku (n-1). Pokud se DF zvětší, znamená to také, že velikost vzorku se zvyšuje; graf t-distribuce bude mít skinnier ocasy, tlačí kritickou hodnotu směrem k průměru.

zpět nahoru

Reference:
Gerard Dallal. Malá příručka statistické praxe. Načteno 26. Prosince 2015 odtud.
Alistair W Kerr, Howard K Hall, Stephen A Kozub. (2002). Dělat statistiky s SPSS. Sage Publikace. s. 68. K dispozici zde.
Levine, D., (2014). Dokonce se můžete naučit statistiky a analytiku: snadno srozumitelný průvodce statistikami a analytikou 3rd Edition. Pearson Ft Press

——————————————————————————

potřebujete pomoc s domácími úkoly nebo testovací otázkou? S Chegg studie, můžete získat krok za krokem řešení vašich otázek od odborníka v oboru. Vaše první 30 minut s Chegg tutor je zdarma!

Leave a Comment