R: Simplu Definiție și Exemple

Share on

Statistici Definiții > R

cuvântul „r” vine din greacă, și destul de literalmente înseamnă date cu un diferit (hetero) dispersie (skedasis). În termeni simpli, heteroscedasticitatea este orice set de date care nu sunt homoscedastice. Mai tehnic, se referă la date cu variabilitate inegală (scatter) într-un set de variabile predictoare secundare.,

datele Heteroscedastice tind să urmeze o formă conică pe un grafic scatter.de ce ne pasă dacă datele sunt heteroscedastice sau nu? De cele mai multe ori în statistici, nu ne pasă. Dar dacă executați orice fel de analiză de regresie, având date care arată heteroscedasticitate vă pot distruge rezultatele (cel puțin, vă va oferi coeficienți părtinitori). Prin urmare, veți dori să verificați pentru a vă asigura că datele dvs. nu au această condiție., O modalitate de a verifica este de a face un grafic scatter (care este întotdeauna o idee bună atunci când executați regresie oricum). Dacă graficul dvs. are o formă conică brută (precum cea de mai sus), probabil că aveți de-a face cu heteroscedasticitatea. Puteți rula în continuare analiza de regresie, dar nu veți obține rezultate decente.

în regresie, o eroare este cât de departe un punct se abate de la linia de regresie. În mod ideal, datele dvs. ar trebui să fie homoscedastice (adică variația erorilor ar trebui să fie constantă). În afara exemplelor din clasă, această situație se întâmplă rar în viața reală. Majoritatea datelor sunt heteroscedastice prin natură., Luați, de exemplu, prezicerea greutății femeilor de la înălțimea lor. Într-o lume Stepford Wives, unde toată lumea este o dimensiune perfectă a rochiei 6, Acest lucru ar fi ușor: femeile scurte cântăresc mai puțin decât femeile înalte. Dar în lumea reală, este practic imposibil să se prevadă greutatea de la înălțime. Femeile mai tinere (în adolescență) tind să cântărească mai puțin, în timp ce femeile aflate în postmenopauză câștigă adesea în greutate. Dar femeile de toate formele și dimensiunile există peste toate vârstele. Aceasta creează un grafic în formă de con pentru variabilitate.,

plotarea variației înălțimii / greutății femeilor ar avea ca rezultat o pâlnie care începe de la mic și se răspândește în timp ce vă deplasați în DREAPTA graficului. Cu toate acestea, conul poate fi în orice direcție (de la stânga la dreapta sau de la dreapta la stânga):


  • Con întinde de-a dreptul: valori mici ale lui X dă o mică se împrăștie în timp ce valori mai mari de X da o mai mare împrăștiere cu privire la Y.
  • Con se întinde la stânga: valori mici ale lui X da o mare împrăștiere în timp ce valori mai mari de X da o mai mică împrăștiere cu privire la Y.,Heteroscedasticitatea poate fi găsită și în observațiile zilnice ale piețelor financiare, prezicând rezultatele sportive pe parcursul unui sezon și multe alte situații volatile care produc date de înaltă frecvență reprezentate în timp.

    cum se detectează Heteroscedasticitatea

    un complot rezidual poate sugera (dar nu dovedi) heteroscedasticitatea. Parcelele reziduale sunt create de:

    1. calcularea reziduurilor pătrate.
    2. trasarea reziduurilor pătrate împotriva unei variabile explicative (una care credeți că este legată de erori).,
    3. faceți un complot separat pentru fiecare variabilă explicativă despre care credeți că contribuie la erori.

    nu trebuie să faceți acest lucru manual; majoritatea software-urilor statistice (adică SPSS, Maple) au comenzi pentru a crea parcele reziduale.

    Mai multe teste pot fi, de asemenea, executați:

    1. Park Test.
    2. testul Alb.

    Consecințele Heteroscedasticitatea

    Severă intermediul ferestrelor glisante date pot oferi o varietate de probleme:

    • OLS nu va da estimator cu cea mai mică varianță (de ex estimatori nu va fi util).,
    • testele de semnificație vor rula fie prea mari, fie prea mici.
    • erorile Standard vor fi părtinitoare, împreună cu statisticile de testare corespunzătoare și intervalele de încredere.

    cum să faceți față datelor Heteroscedastice

    dacă datele dvs. sunt heteroscedastice, nu ar fi recomandabil să rulați regresia pe date așa cum este. Există câteva lucruri pe care le puteți încerca dacă trebuie să rulați regresia:

    1. dați date care produc o greutate mai mică.
    2. transformă variabila Y pentru a atinge homoscedasticitatea., De exemplu, utilizați caseta-Cox normalitate complot pentru a transforma datele.
    citează acest lucru ca:
    Stephanie Glen. „Heteroscedasticitatea: definiție simplă și exemple” din StatisticsHowTo.com: statistici elementare pentru restul dintre noi! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/

    ——————————————————————————

    Nevoie de ajutor cu temele sau întrebare de testare? Cu studiul Chegg, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!

Leave a Comment