Statistik-Definitionen > Heteroscedasticity
Das Wort „heteroscedasticity“ kommt aus dem griechischen, und buchstäblich bedeutet, dass Daten mit einem anderen (hetero -) dispersion (skedasis). In einfachen Worten, Heteroskedastizität ist jeder Datensatz, der nicht homoskedastisch ist. Technisch gesehen bezieht es sich auf Daten mit ungleicher Variabilität (Streuung) über einen Satz von zweiten Prädiktorvariablen.,
Heteroskedastische Daten folgen tendenziell einer Kegelform in einem Streudiagramm.
Warum kümmern wir uns darum, ob Daten heteroskedastisch sind oder nicht? Die meiste Zeit in der Statistik ist es uns egal. Wenn Sie jedoch eine Art Regressionsanalyse durchführen, können Daten, die Heteroskedastizität zeigen, Ihre Ergebnisse ruinieren (zumindest erhalten Sie voreingenommene Koeffizienten). Daher sollten Sie überprüfen, ob Ihre Daten diese Bedingung nicht haben., Eine Möglichkeit zu überprüfen ist, ein Streudiagramm zu erstellen (was immer eine gute Idee ist, wenn Sie sowieso eine Regression ausführen). Wenn Ihr Diagramm eine grobe Kegelform hat (wie oben), haben Sie es wahrscheinlich mit Heteroskedastizität zu tun. Sie können weiterhin eine Regressionsanalyse durchführen, erhalten jedoch keine anständigen Ergebnisse.
In der Regression ist ein Fehler, wie weit ein Punkt von der Regressionslinie abweicht. Idealerweise sollten Ihre Daten homscedastic sein (dh die Varianz der Fehler sollte konstant sein). Außerhalb von Unterrichtsbeispielen kommt diese Situation im wirklichen Leben selten vor. Die meisten Daten sind von Natur aus heteroskedastisch., Nehmen wir zum Beispiel die Vorhersage des Gewichts von Frauen aus ihrer Höhe. In einer Stepford-Frauenwelt, in der jeder eine perfekte Kleidergröße hat 6, Das wäre einfach: Kurze Frauen wiegen weniger als große Frauen. Aber in der realen Welt ist es praktisch unmöglich, das Gewicht aus der Höhe vorherzusagen. Jüngere Frauen (im Teenageralter) neigen dazu, weniger zu wiegen, während Frauen nach der Menopause oft an Gewicht zunehmen. Aber Frauen aller Formen und Größen existieren über alle Altersgruppen. Dadurch wird ein kegelförmiger Graph für die Variabilität erstellt.,
Das Zeichnen einer Variation der Größe/des Gewichts von Frauen würde zu einem Trichter führen, der klein beginnt und sich ausbreitet, wenn Sie sich rechts neben dem Diagramm bewegen. Der Kegel kann jedoch in beide Richtungen (von links nach rechts oder von rechts nach links) gerichtet sein:
- Kegel breitet sich nach rechts aus: Kleine Werte von X ergeben eine kleine Streuung, während größere Werte von X eine größere Streuung in Bezug auf Y.
- Kegel breitet sich nach links aus: Kleine Werte von X ergeben eine große Streuung streuen, während größere Werte von X eine kleinere Streuung in Bezug auf Y ergeben.,
Heteroskedastizität findet sich auch in täglichen Beobachtungen der Finanzmärkte, der Vorhersage von Sportergebnissen über eine Saison und vielen anderen volatilen Situationen, die im Laufe der Zeit Hochfrequenzdaten erzeugen.
Wie man Heteroskedastizität erkennt
Ein Restdiagramm kann Heteroskedastizität vorschlagen (aber nicht beweisen). Restdiagramme werden erstellt durch:
- Berechnung der quadratischen Residuen.
- Zeichnen der quadratischen Residuen gegen eine erklärende Variable (eine, die Ihrer Meinung nach mit den Fehlern zusammenhängt).,
- Erstellen Sie für jede erklärende Variable, von der Sie glauben, dass sie zu den Fehlern beiträgt, ein separates Diagramm.
Sie müssen dies nicht manuell tun; Die meisten statistischen Programme (z. B. SPSS, Maple) verfügen über Befehle zum Erstellen von Restdiagrammen.
Es können auch mehrere Tests durchgeführt werden:
- Park Test.
- Weiß Test.
Folgen der Heteroskedastizität
Schwere heteroskedastische Daten können zu einer Vielzahl von Problemen führen:
- OLS gibt Ihnen nicht den Schätzer mit der kleinsten Varianz (dh Ihre Schätzer sind nicht nützlich).,
- Signifikanztests werden entweder zu hoch oder zu niedrig ausgeführt.
- Standardfehler werden zusammen mit den entsprechenden Teststatistiken und Konfidenzintervallen verzerrt.
Umgang mit heteroskedastischen Daten
Wenn Ihre Daten heteroskedastisch sind, ist es nicht ratsam, die Daten so wie sie sind Regression auszuführen. Es gibt ein paar Dinge, die Sie versuchen können, wenn Sie Regression ausführen müssen:
- Geben Sie Daten an, die eine große Streuung weniger Gewicht erzeugen.
- Transformieren Sie die Y-Variable, um eine Homoskedastizität zu erreichen., Verwenden Sie beispielsweise das Box-Cox-Normalitätsdiagramm, um die Daten zu transformieren.
Stephanie Glen. „Heteroskedastizität: Einfache Definition und Beispiele“ Von StatisticsHowTo.com: Elementare Statistiken für den Rest von uns! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/
——————————————————————————
Benötigen Sie Hilfe bei Hausaufgaben oder Testfragen? Mit Chegg Study erhalten Sie Schritt-für-Schritt-Lösungen für Ihre Fragen von einem Experten auf diesem Gebiet. Ihre ersten 30 Minuten mit einem Chegg Tutor ist kostenlos!