Statistiky Definice > Heteroskedasticita
slovo „heteroskedasticita“ pochází z řečtiny, a to doslova znamená, že data s jinou (hetero) rozptyl (skedasis). Jednoduše řečeno, heteroscedasticita je jakákoli sada dat, která není homoscedastická. Technicky se jedná o data s nerovnoměrnou variabilitou (rozptylem) napříč sadou sekundových prediktorových proměnných.,
Heteroscedastic údajů má tendenci následovat tvar kužele na bodový graf.
proč nám záleží na tom, zda jsou data heteroscedastická? Většinu času ve statistikách je nám to jedno. Ale pokud používáte jakýkoliv druh regresní analýzy s údaji, které ukazuje, heteroskedasticita může zničit vaše výsledky (přinejmenším, bude vám neobjektivní koeficienty). Proto budete chtít zkontrolovat, zda vaše data nemají tuto podmínku., Jedním ze způsobů, jak zkontrolovat, je vytvořit bodový graf (což je vždy dobrý nápad, když stejně používáte regresi). Pokud má váš graf hrubý tvar kužele (jako ten výše), pravděpodobně se zabýváte heteroscedasticitou. Stále můžete spustit regresní analýzu, ale nebudete mít slušné výsledky.
v regresi je chyba, jak daleko se bod odchyluje od regresní čáry. V ideálním případě by vaše data měla být homoscedastická (tj. rozptyl chyb by měl být konstantní). Mimo příklady ve třídě se tato situace zřídka děje v reálném životě. Většina dat je od přírody heteroscedastická., Vezměte například předpovídání hmotnosti žen z jejich výšky. Ve světě Stepford Wives, kde je každý perfektní velikost šatů 6, to by bylo snadné: krátké ženy váží méně než vysoké ženy. Ale v reálném světě je prakticky nemožné předpovědět váhu z výšky. Mladší ženy (v dospívání) mají tendenci vážit méně, zatímco postmenopauzální ženy často přibírají na váze. Ale ženy všech tvarů a velikostí existují ve všech věkových kategoriích. To vytváří kuželovitý graf pro variabilitu.,
Vykreslování variace výšky/hmotnosti žen by mělo za následek nálevku, která začíná malá a rozprostírá se, když se pohybujete vpravo od grafu. Nicméně, kužel může být v obou směrech (zleva doprava, nebo zprava doleva):
- kužel se rozprostírá doprava: malé hodnoty X dávají malý rozptyl, zatímco větší hodnoty X dávají větší rozptyl s ohledem na Y.
- kuželové rozpětí vlevo: malé hodnoty x dávají velký rozptyl, zatímco větší hodnoty x dávají menší rozptyl vzhledem k y.,
Heteroscedasticita lze nalézt také v denních pozorováních finančních trhů, předpovídání sportovních výsledků v průběhu sezóny a mnoha dalších volatilních situacích, které produkují vysokofrekvenční data vykreslená v průběhu času.
jak detekovat Heteroscedasticitu
zbytkový graf může naznačovat (ale neprokázat) heteroscedasticitu. Zbytkové pozemky jsou vytvářeny:
- výpočtem čtvercových reziduí.
- Vykreslování čtvercových zbytků proti vysvětlující proměnné (ta, o které si myslíte, že souvisí s chybami).,
- vytvořte samostatný graf pro každou vysvětlující proměnnou, o které si myslíte, že přispívá k chybám.
nemusíte to dělat ručně; většina statistického softwaru (tj.
lze také spustit několik testů:
- Park Test.
- bílý Test.
důsledky Heteroscedasticity
těžká heteroscedastická data vám mohou poskytnout řadu problémů:
- OLS vám nedá odhad s nejmenším rozptylem(tj.,
- testy významnosti budou probíhat buď příliš vysoko nebo příliš nízko.
- standardní chyby budou zkreslené, spolu s jejich odpovídajícími statistikami testů a intervaly spolehlivosti.
jak se vypořádat s Heteroscedastickými daty
pokud jsou vaše data heteroscedastická,bylo by nevhodné spustit regresi na datech tak, jak je. Existuje několik věcí, které můžete vyzkoušet, pokud potřebujete spustit regresi:
- dát data, která vytváří velký rozptyl menší váhu.
- Transformujte proměnnou Y tak, abyste dosáhli homoscedasticity., Například použijte graf normality Box-Cox k transformaci dat.
Stephanie Glen. „Heteroscedasticita: jednoduchá definice a příklady“ z StatisticsHowTo.com: základní statistiky pro nás ostatní! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/
——————————————————————————
Potřebujete pomoci s úkoly nebo zkoušky otázka? S Chegg studie, můžete získat krok za krokem řešení vašich otázek od odborníka v oboru. Vaše první 30 minut s Chegg tutor je zdarma!