Wat Is meervoudige lineaire regressie (MLR)?
Multiple linear regression (MLR) is een statistische techniek die gebruik maakt van verschillende verklarende variabelen om de uitkomst van een responsvariabele te voorspellen. Het doel van multiple linear regression (MLR) is het modelleren van de lineaire relatie tussen de verklarende (onafhankelijke) variabelen en de respons (afhankelijke) variabele.,
in wezen is meervoudige regressie de uitbreiding van gewone kleinste-kwadraten regressie (OLS) omdat er meer dan één verklarende variabele bij betrokken is.
formule en berekening van meervoudige lineaire regressie
Key Takeaways
- Multiple linear regression (MLR) is een statistische techniek die gebruik maakt van verschillende verklarende variabelen om de uitkomst van een responsvariabele te voorspellen.,
- meervoudige regressie is een uitbreiding van lineaire (OLS) regressie die slechts één verklarende variabele gebruikt.
- MLR wordt uitgebreid gebruikt in Econometrie en financiële gevolgtrekking.
wat Multiple Linear Regression (MLR) u kan vertellen
eenvoudige lineaire regressie is een functie die een analist of statisticus in staat stelt om voorspellingen te doen over een variabele op basis van de informatie die bekend is over een andere variabele. Lineaire regressie kan alleen worden gebruikt als men twee continue variabelen heeft-een onafhankelijke variabele en een afhankelijke variabele., De onafhankelijke variabele is de parameter die wordt gebruikt om de afhankelijke variabele of uitkomst te berekenen. Een multiple regression model strekt zich uit tot verschillende verklarende variabelen.,g veronderstellingen:
- Er is een lineaire relatie tussen de afhankelijke variabelen en de onafhankelijke variabelen
- De onafhankelijke variabelen niet te sterk gecorreleerd met elkaar
- yi waarnemingen worden geselecteerd, onafhankelijk en willekeurig uit de populatie
- de Residuen moeten normaal verdeeld met een gemiddelde van 0 en variantie σ
De determinatiecoëfficiënt (R-kwadraat) is een statistisch gegeven dat wordt gebruikt om te meten hoeveel van de variatie in de uitkomst kan worden verklaard door de variatie in de onafhankelijke variabelen., R2 neemt altijd toe naarmate meer voorspellers aan het MLR-model worden toegevoegd, ook al zijn de voorspellers mogelijk niet gerelateerd aan de resultaatvariabele.
R2 op zichzelf kan dus niet worden gebruikt om te bepalen welke voorspellers in een model moeten worden opgenomen en welke moeten worden uitgesloten. R2 kan alleen tussen 0 en 1 liggen, waarbij 0 aangeeft dat de uitkomst niet kan worden voorspeld door een van de onafhankelijke variabelen en 1 aangeeft dat de uitkomst kan worden voorspeld zonder fouten van de onafhankelijke variabelen.,
bij het interpreteren van de resultaten van meervoudige regressie zijn bètacoëfficiënten geldig terwijl alle andere variabelen constant zijn (“alle andere gelijk”). De uitvoer van een meervoudige regressie kan horizontaal worden weergegeven als een vergelijking, of verticaal in tabelvorm.
voorbeeld van het gebruik van Multiple Linear Regression (MLR)
als voorbeeld wil een analist misschien weten hoe de marktbeweging de prijs van ExxonMobil (XOM) beïnvloedt., In dit geval zal hun lineaire vergelijking de waarde hebben van de s&P 500 index als de onafhankelijke variabele, of voorspeller, en de prijs van XOM als de afhankelijke variabele.
in werkelijkheid zijn er meerdere factoren die de uitkomst van een gebeurtenis voorspellen. De prijsontwikkeling van ExxonMobil bijvoorbeeld hangt af van meer dan alleen de prestaties van de totale markt. Andere voorspellers zoals de prijs van olie, rentetarieven en de prijsbeweging van oliefutures kunnen de prijs van XOM en aandelenkoersen van andere oliemaatschappijen beïnvloeden., Om een relatie te begrijpen waarin meer dan twee variabelen aanwezig zijn, wordt meerdere lineaire regressie gebruikt.
meervoudige lineaire regressie (MLR) wordt gebruikt om een wiskundige relatie tussen een aantal willekeurige variabelen te bepalen. In andere termen, MLR onderzoekt hoe meerdere onafhankelijke variabelen zijn gerelateerd aan een afhankelijke variabele. Zodra elk van de onafhankelijke factoren is bepaald om de afhankelijke variabele te voorspellen, kan de informatie over de veelvoudige variabelen worden gebruikt om een nauwkeurige voorspelling op het niveau van effect te creëren dat zij op de resultaatvariabele hebben., Het model creëert een relatie in de vorm van een rechte (lineair) die het beste alle individuele datapunten benadert.,dimmer in wisselkoersen
De kleinste kwadraten schattingen, B0, B1, B2…Bp, worden meestal berekend op basis van statistische software., Zo veel variabelen kunnen worden opgenomen in het regressiemodel waarin elke onafhankelijke variabele wordt onderscheiden met een getal—1,2, 3, 4…p. Het multiple regression model staat een analist toe om een uitkomst te voorspellen op basis van informatie over meerdere verklarende variabelen.
toch is het model niet altijd perfect nauwkeurig omdat elk gegevenspunt enigszins kan afwijken van de uitkomst die door het model wordt voorspeld. De restwaarde E, die het verschil is tussen de werkelijke uitkomst en de voorspelde uitkomst, is opgenomen in het model om rekening te houden met dergelijke kleine variaties.,
aangenomen dat we onze XOM prijs regressie-model door middel van een statistische berekening met software, die geeft deze output:
Een analist zou interpreteren deze uitgang te betekenen als andere variabelen worden constant gehouden, de prijs van XOM zal stijgen met 7,8% als de prijs van olie in de markten neemt toe met 1%. Het model laat ook zien dat de prijs van XOM met 1 zal dalen.,5% Na een renteverhoging van 1%. R2 geeft aan dat 86,5% van de schommelingen in de aandelenkoers van Exxon Mobil kunnen worden verklaard door veranderingen in de rente, olieprijs, oliefutures en s&P 500 index.
het verschil tussen lineaire en meervoudige regressie
gewone lineaire kwadraten (OLS) regressie vergelijkt de respons van een afhankelijke variabele gegeven een verandering in sommige verklarende variabelen. Het is echter zeldzaam dat een afhankelijke variabele wordt verklaard door slechts één variabele., In dit geval gebruikt een analist meerdere regressie, die probeert een afhankelijke variabele te verklaren met behulp van meer dan één onafhankelijke variabele. Meerdere regressies kunnen lineair en niet-lineair zijn.
meerdere regressies zijn gebaseerd op de aanname dat er een lineair verband is tussen zowel de afhankelijke als de onafhankelijke variabelen. Het veronderstelt ook geen belangrijke correlatie tussen de onafhankelijke variabelen.,