le Statistiche di Definizioni > Heteroscedasticity
La parola “heteroscedasticity” deriva dal greco, letteralmente significa i dati con un altro (etero) dispersione (skedasis). In termini semplici, l’eteroscedasticità è qualsiasi insieme di dati che non è omoscedastico. Più tecnicamente, si riferisce a dati con variabilità disuguale (scatter) attraverso un insieme di seconde variabili predittive.,
I dati eteroscedastici tendono a seguire una forma a cono su un grafico a dispersione.
Perché ci preoccupiamo se i dati sono eteroscedastici o meno? Il più delle volte nelle statistiche, non ci interessa. Ma se stai eseguendo qualsiasi tipo di analisi di regressione, avere dati che mostrano l’eteroscedasticità può rovinare i tuoi risultati (per lo meno, ti darà coefficienti di parte). Pertanto, ti consigliamo di verificare che i tuoi dati non abbiano questa condizione., Un modo per controllare è creare un grafico a dispersione (che è sempre una buona idea quando si esegue comunque la regressione). Se il tuo grafico ha una forma a cono ruvida (come quella sopra), probabilmente hai a che fare con l’eteroscedasticità. Puoi ancora eseguire l’analisi di regressione, ma non otterrai risultati decenti.
In regressione, un errore è quanto lontano un punto si discosta dalla linea di regressione. Idealmente, i tuoi dati dovrebbero essere omoscedastici (cioè la varianza degli errori dovrebbe essere costante). Al di fuori degli esempi in classe, questa situazione accade raramente nella vita reale. La maggior parte dei dati è eteroscedastica per natura., Prendi, ad esempio, la previsione del peso delle donne dalla loro altezza. In un mondo mogli Stepford, dove ognuno è un formato perfetto vestito 6, questo sarebbe facile: donne corte pesano meno di donne alte. Ma nel mondo reale, è praticamente impossibile prevedere il peso dall’altezza. Le donne più giovani (nella loro adolescenza) tendono a pesare meno, mentre le donne in post-menopausa spesso aumentano di peso. Ma le donne di tutte le forme e dimensioni esistono in tutte le età. Questo crea un grafico a forma di cono per la variabilità.,
Tracciando variazione di altezza / peso delle donne si tradurrebbe in un imbuto che inizia piccolo e si diffonde come ci si sposta a destra del grafico. Tuttavia, il cono può essere in entrambe le direzioni (da sinistra a destra o da destra a sinistra):
- Cono si allarga a destra: piccoli valori di X dare un piccolo scatter, mentre i più grandi valori di X dare una maggiore dispersione rispetto a y.
- Cono si allarga a sinistra: piccoli valori di X dare un grande spargimento mentre i più grandi valori di X dare una minore dispersione rispetto a Y.,
L’eteroscedasticità può anche essere trovata nelle osservazioni quotidiane dei mercati finanziari, prevedendo i risultati sportivi in una stagione e molte altre situazioni volatili che producono dati ad alta frequenza tracciati nel tempo.
Come rilevare l’eteroscedasticità
Un grafico residuo può suggerire (ma non dimostrare) l’eteroscedasticità. I grafici residui vengono creati da:
- Calcolando i residui quadrati.
- Tracciando i residui quadrati contro una variabile esplicativa(quella che pensi sia correlata agli errori).,
- Crea una trama separata per ogni variabile esplicativa che ritieni stia contribuendo agli errori.
Non è necessario farlo manualmente; la maggior parte dei software statistici (ad esempio SPSS, Maple) ha comandi per creare grafici residui.
È possibile eseguire anche diversi test:
- Park Test.
- Prova bianca.
Conseguenze dell’eteroscedasticità
I dati eteroscedastici gravi possono darti una serie di problemi:
- OLS non ti darà lo stimatore con la più piccola varianza (cioè i tuoi stimatori non saranno utili).,
- I test di significatività verranno eseguiti troppo alti o troppo bassi.
- Gli errori standard saranno distorti, insieme alle loro statistiche di test corrispondenti e agli intervalli di confidenza.
Come gestire i dati eteroscedastici
Se i tuoi dati sono eteroscedastici, non sarebbe consigliabile eseguire la regressione sui dati così come sono. Ci sono un paio di cose che puoi provare se hai bisogno di eseguire la regressione:
- Fornire dati che producano un grande scatter meno peso.
- Trasforma la variabile Y per ottenere omoscedasticità., Ad esempio, utilizzare il grafico di normalità Box-Cox per trasformare i dati.
Stephanie Glen. “Eteroscedasticità: definizione semplice ed esempi” Da StatisticsHowTo.com: Statistiche elementari per il resto di noi! https://www.statisticshowto.com/heteroscedasticity-simple-definition-examples/
——————————————————————————
Hai bisogno di aiuto con un compito a casa o una domanda di prova? Con Chegg Studio, è possibile ottenere soluzioni passo-passo alle vostre domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!