Che cos’è la regressione lineare multipla (MLR)?
La regressione lineare multipla (MLR), nota anche semplicemente come regressione multipla, è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l’esito di una variabile di risposta. L’obiettivo della regressione lineare multipla (MLR) è quello di modellare la relazione lineare tra le variabili esplicative (indipendenti) e la variabile di risposta (dipendente).,
In sostanza, la regressione multipla è l’estensione della regressione ordinaria dei minimi quadrati (OLS) perché coinvolge più di una variabile esplicativa.
Formula e Calcolo di Regressione Lineare Multipla
Takeaway Chiave
- di regressione lineare Multipla (MLR), noto anche semplicemente come regressione multipla è una tecnica statistica che utilizza diverse variabili esplicative per prevedere l’esito di una variabile di risposta.,
- La regressione multipla è un’estensione della regressione lineare (OLS) che utilizza solo una variabile esplicativa.
- MLR è ampiamente utilizzato in econometria e inferenza finanziaria.
Cosa può dirti la regressione lineare multipla (MLR)
La regressione lineare semplice è una funzione che consente a un analista o a uno statistico di fare previsioni su una variabile in base alle informazioni note su un’altra variabile. La regressione lineare può essere utilizzata solo quando si hanno due variabili continue: una variabile indipendente e una variabile dipendente., La variabile indipendente è il parametro utilizzato per calcolare la variabile dipendente o il risultato. Un modello di regressione multipla si estende a diverse variabili esplicative.,g presupposti:
- C’è una relazione lineare tra le variabili dipendenti e variabili indipendenti
- Le variabili indipendenti non sono troppo altamente correlate con l’altro
- yi osservazioni sono selezionati in modo indipendente e in modo casuale dalla popolazione
- i Residui devono essere distribuiti normalmente con media 0 e varianza σ
Il coefficiente di determinazione (R-squared) è una statistica metrica che viene utilizzato per misurare la variazione del risultato può essere spiegato dalla variazione di variabili indipendenti., R2 aumenta sempre con l’aggiunta di più predittori al modello MLR, anche se i predittori potrebbero non essere correlati alla variabile di risultato.
R2 di per sé non può quindi essere usato per identificare quali predittori dovrebbero essere inclusi in un modello e quali dovrebbero essere esclusi. R2 può essere solo tra 0 e 1, dove 0 indica che il risultato non può essere previsto da nessuna delle variabili indipendenti e 1 indica che il risultato può essere previsto senza errori dalle variabili indipendenti.,
Quando si interpretano i risultati della regressione multipla, i coefficienti beta sono validi mantenendo costanti tutte le altre variabili (“all else equal”). L’output di una regressione multipla può essere visualizzato orizzontalmente come equazione o verticalmente in forma di tabella.
Esempio di come utilizzare la regressione lineare multipla (MLR)
Ad esempio, un analista potrebbe voler sapere in che modo il movimento del mercato influisce sul prezzo di ExxonMobil (XOM)., In questo caso, la loro equazione lineare avrà il valore dell’indice S&P 500 come variabile indipendente, o predittore, e il prezzo di XOM come variabile dipendente.
In realtà, ci sono più fattori che prevedono l’esito di un evento. Il movimento dei prezzi di ExxonMobil, ad esempio, dipende più che dalle prestazioni del mercato complessivo. Altri predittori come il prezzo del petrolio, i tassi di interesse e il movimento dei prezzi dei futures sul petrolio possono influenzare il prezzo di XOM e i prezzi delle azioni di altre compagnie petrolifere., Per comprendere una relazione in cui sono presenti più di due variabili, viene utilizzata la regressione lineare multipla.
La regressione lineare multipla (MLR) viene utilizzata per determinare una relazione matematica tra un numero di variabili casuali. In altri termini, MLR esamina come più variabili indipendenti sono correlate a una variabile dipendente. Una volta che ciascuno dei fattori indipendenti è stato determinato per prevedere la variabile dipendente, le informazioni sulle variabili multiple possono essere utilizzate per creare una previsione accurata sul livello di effetto che hanno sulla variabile di risultato., Il modello crea una relazione sotto forma di una linea retta (lineare) che approssima al meglio tutti i singoli punti dati.,erest prezzi
I minimi quadrati stima, B0, B1, B2…Bp, di solito sono calcolate dal software statistico., Come molte variabili possono essere incluse nel modello di regressione in cui ogni variabile indipendente è differenziata con un numero-1,2, 3, 4…p. Il modello di regressione multipla consente a un analista di prevedere un risultato in base alle informazioni fornite su più variabili esplicative.
Tuttavia, il modello non è sempre perfettamente accurato poiché ogni punto dati può differire leggermente dal risultato previsto dal modello. Il valore residuo, E, che è la differenza tra il risultato effettivo e il risultato previsto, è incluso nel modello per tenere conto di tali lievi variazioni.,
supponiamo di eseguire il nostro XOM prezzo modello di regressione attraverso una statistica software di calcolo, che restituisce questo output:
Un analista di interpretare l’output per dire, se le altre variabili sono mantenuti costanti, il prezzo di XOM aumenterà del 7,8% se il prezzo del petrolio sui mercati aumenta dell ‘ 1%. Il modello mostra anche che il prezzo di XOM diminuirà di 1.,5% a seguito di un aumento dell ‘ 1% dei tassi di interesse. R2 indica che l ‘ 86,5% delle variazioni del prezzo delle azioni di Exxon Mobil può essere spiegato da variazioni del tasso di interesse, del prezzo del petrolio, dei futures sul petrolio e dell’indice S&P 500.
La differenza tra regressione lineare e multipla
La regressione dei quadrati lineari ordinari (OLS) confronta la risposta di una variabile dipendente data una modifica in alcune variabili esplicative. Tuttavia, è raro che una variabile dipendente sia spiegata da una sola variabile., In questo caso, un analista utilizza la regressione multipla, che tenta di spiegare una variabile dipendente utilizzando più di una variabile indipendente. Regressioni multiple possono essere lineari e non lineari.
Le regressioni multiple si basano sul presupposto che esiste una relazione lineare tra entrambe le variabili dipendenti e indipendenti. Inoltre non assume alcuna correlazione importante tra le variabili indipendenti.,