Heteroscedasticiteit: eenvoudige definitie en voorbeelden
statistische definities > Heteroscedasticiteit
het woord “heteroscedasticiteit” komt uit het Grieks, en betekent letterlijk data met een andere (hetero) dispersie (skedasis). In eenvoudige termen, heteroscedasticity is elke set van gegevens die niet homoscedastic. Meer technisch, het verwijst naar gegevens met ongelijke variabiliteit (scatter) over een set van tweede, predictor variabelen.,
Heteroscedastische gegevens volgen meestal een kegelvorm op een spreidingsgrafiek.
Waarom kan het ons schelen of gegevens al dan niet heteroscedastisch zijn? De meeste van de tijd in de statistiek, het maakt ons niet uit. Maar als je enige vorm van regressieanalyse uitvoert, kunnen gegevens die heteroscedasticiteit laten zien je resultaten ruïneren (op zijn minst geeft het je bevooroordeelde coëfficiënten). Daarom, U zult willen controleren om ervoor te zorgen dat uw gegevens niet deze voorwaarde., Een manier om te controleren is om een scatter grafiek te maken (dat is altijd een goed idee wanneer u regressie toch uitvoert). Als je Grafiek een ruwe kegelvorm heeft (zoals hierboven), heb je waarschijnlijk te maken met heteroscedasticiteit. Je kunt nog steeds regressieanalyse uitvoeren, maar je krijgt geen fatsoenlijke resultaten.
in regressie is een fout de mate waarin een punt afwijkt van de regressielijn. Idealiter moeten uw gegevens homoscedastisch zijn (d.w.z. de variantie van de fouten moet constant zijn). Buiten klaslokaal voorbeelden, deze situatie gebeurt zelden in het echte leven. De meeste gegevens zijn heteroscedastisch van aard., Neem bijvoorbeeld het voorspellen van het gewicht van vrouwen op basis van hun lengte. In een Stepford Vrouwen wereld, waar iedereen is een perfecte jurk maat 6, Dit zou gemakkelijk zijn: korte vrouwen wegen minder dan Lange Vrouwen. Maar in de echte wereld is het praktisch onmogelijk om gewicht te voorspellen vanaf lengte. Jongere vrouwen (in hun tienerjaren) hebben de neiging om minder te wegen, terwijl post-menopauzale vrouwen vaak in gewicht toenemen. Maar vrouwen van alle soorten en maten bestaan over alle leeftijden. Dit creëert een kegelvormige grafiek voor variabiliteit.,
het plotten van variatie van de lengte/gewicht van vrouwen zou resulteren in een trechter die klein begint en zich verspreidt als je naar rechts van de grafiek beweegt. Echter, de kegel kan worden, in welke richting (van links naar rechts, of van rechts naar links):
- Kegel verspreidt naar rechts: kleine waarden van X geven een kleine scatter terwijl grotere waarden van X geven een grotere bestrooi met betrekking tot Y.
- Kegel zich uit naar links: kleine waarden van X geven een grote scatter terwijl grotere waarden van X geven een kleinere bestrooi met betrekking tot Y.,
Heteroscedasticiteit kan ook worden gevonden in dagelijkse waarnemingen van de financiële markten, waarbij sportresultaten over een seizoen worden voorspeld, en vele andere volatiele situaties die hoogfrequente gegevens opleveren die in de loop van de tijd worden uitgezet.
hoe Heteroscedasticiteit te detecteren
een resterende plot kan heteroscedasticiteit suggereren (maar niet bewijzen). Restpercelen worden gecreëerd door:
- Het berekenen van de vierkante reststoffen.
- het plotten van de kwadraatresidu ‘ s tegen een verklarende variabele (een waarvan je denkt dat het gerelateerd is aan de fouten).,
- Maak een aparte plot voor elke verklarende variabele waarvan je denkt dat deze bijdraagt aan de fouten.
u hoeft dit niet handmatig te doen; de meeste statistische software (bijv. SPSS, Maple) hebben commando ‘ s om residuele plots aan te maken.
verschillende tests kunnen ook worden uitgevoerd:
- Park Test.
- witte Test.
Consequences of Heteroscedasticity
ernstige heteroscedastic data kunnen u een verscheidenheid aan problemen geven:
- OLS zal u niet de schatter met de kleinste variantie geven (d.w.z. uw schatters zullen niet nuttig zijn).,
- significantie testen zullen te hoog of te laag worden uitgevoerd.
- standaardfouten worden vertekend, samen met de bijbehorende teststatistieken en betrouwbaarheidsintervallen.
hoe om te gaan met Heteroscedastische gegevens
als uw gegevens heteroscedastisch zijn, is het niet raadzaam om regressie op de gegevens uit te voeren zoals ze zijn. Er zijn een paar dingen die je kunt proberen als je regressie moet uitvoeren:
- geef gegevens die een grote scatter minder gewicht produceren.
- Transformeer de Y-variabele om homoscedasticiteit te bereiken., Gebruik bijvoorbeeld de Box-Cox normaliteit plot om de gegevens te transformeren.
Stephanie Glen. “Heteroscedasticiteit: eenvoudige definitie en voorbeelden” van StatisticsHowTo.com: elementaire statistieken voor de rest van ons! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/
——————————————————————————eeft u hulp nodig met een huiswerk-of testvraag? Met Chegg Study krijgt u stap-voor-stap oplossingen voor uw vragen van een expert in het veld. Je eerste 30 minuten met een Chegg tutor is gratis!