Hétéroscédasticité: Définition Simple et exemples

Partager sur

définitions statistiques>hétéroscédasticité

le mot « hétéroscédasticité” vient du grec, et signifie littéralement des données avec une dispersion différente (hétéro) (skedasis). En termes simples, l’hétéroscédasticité est tout ensemble de données qui n’est pas homoscédastique. Plus techniquement, il s’agit de données à variabilité inégale (dispersion) sur un ensemble de secondes variables prédictives.,

Les données Hétéroscédastiques ont tendance à suivre une forme de cône sur un graphe de dispersion.

pourquoi nous soucions-nous de savoir si les données sont hétéroscédastiques ou non? La plupart du temps dans les statistiques, on s’en fout. Mais si vous exécutez n’importe quel type d’analyse de régression, avoir des données qui montrent l’hétéroscédasticité peut ruiner vos résultats (à tout le moins, cela vous donnera des coefficients biaisés). Par conséquent, vous devrez vérifier pour vous assurer que vos données n’ont pas cette condition., Une façon de vérifier est de créer un graphique de dispersion (ce qui est toujours une bonne idée lorsque vous exécutez une régression de toute façon). Si votre graphique a une forme de cône rugueuse (comme celui ci-dessus), vous avez probablement affaire à l’hétéroscédasticité. Vous pouvez toujours exécuter une analyse de régression, mais vous n’obtiendrez pas de résultats décents.

en régression, une erreur est la distance à laquelle un point s’écarte de la droite de régression. Idéalement, vos données doivent être homoscédastiques (c’est-à-dire que la variance des erreurs doit être constante). En dehors des exemples de classe, cette situation se produit rarement dans la vie réelle. La plupart des données sont hétéroscédastiques par nature., Prenons, par exemple, prédire le poids des femmes à partir de leur taille. Dans un monde Stepford Wives, où tout le monde est une taille de robe parfaite 6, ce serait facile: les femmes courtes pèsent moins que les femmes grandes. Mais dans le monde réel, il est pratiquement impossible de prédire le poids à partir de la taille. Les femmes plus jeunes (dans leur adolescence) ont tendance à peser moins, tandis que les femmes post-ménopausées prennent souvent du poids. Mais les femmes de toutes formes et tailles existent à tous les âges. Cela crée un graphique en forme de cône pour la variabilité.,

tracer la variation de la taille / du poids des femmes se traduirait par un entonnoir qui commence petit et s’étale lorsque vous vous déplacez vers la droite du graphique. Cependant, le cône peut être dans les deux sens (de gauche à droite, ou de droite à gauche):


  • Le cône s’étale vers la droite: les petites valeurs de X donnent une petite dispersion tandis que les plus grandes valeurs de X donnent une dispersion le cône s’étale vers la gauche: les petites valeurs de x donnent une grande dispersion tandis que les plus grandes valeurs de x donnent une dispersion plus petite par rapport à y.,

L’hétéroscédasticité se retrouve également dans les observations quotidiennes des marchés financiers, la prédiction des résultats sportifs sur une saison, et de nombreuses autres situations volatiles qui produisent des données à haute fréquence tracées au fil du temps.

Comment détecter L’hétéroscédasticité

un tracé résiduel peut suggérer (mais pas prouver) l’hétéroscédasticité. Les tracés résiduels sont créés par:

  1. calcul des résidus carrés.
  2. tracer les résidus au carré par rapport à une variable explicative (celle que vous pensez être liée aux erreurs).,
  3. faites un tracé distinct pour chaque variable explicative que vous pensez contribuer aux erreurs.

vous n’avez pas à le faire manuellement; la plupart des logiciels statistiques (SPSS, Maple) ont des commandes pour créer des tracés résiduels.

Plusieurs tests peuvent également être exécuté:

  1. Parc de Test.
  2. Blanc de Test.

conséquences de L’hétéroscédasticité

des données hétéroscédastiques sévères peuvent vous poser divers problèmes:

  • OLS ne vous donnera pas l’estimateur avec la plus petite variance (c’est-à-dire que vos estimateurs ne seront pas utiles).,
  • Les tests de Signification seront trop élevés ou trop faibles.
  • Les erreurs types seront biaisées, ainsi que les statistiques de test correspondantes et les intervalles de confiance.

Comment traiter les données Hétéroscédastiques

Si vos données sont hétéroscédastiques, il serait déconseillé d’exécuter une régression sur les données telles quelles. Il y a quelques choses que vous pouvez essayer si vous avez besoin d’exécuter une régression:

  1. donnez des données qui produisent une grande dispersion moins de poids.
  2. transformer la variable Y pour obtenir l’homoscédasticité., Par exemple, utilisez le diagramme de normalité Box-Cox pour transformer les données.
citez ceci comme:
Stephanie Glen. « Hétéroscédasticité: Définition Simple et exemples » de StatisticsHowTo.com: statistiques élémentaires pour le reste d’entre nous! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/

——————————————————————————

Besoin d’aide avec les devoirs à faire ou une question du test? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites!

Leave a Comment