Vad är Multiple Linear Regression (MLR)?
multipel linjär regression (MLR), även känd helt enkelt som multipel regression, är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel. Målet med multipel linjär regression (MLR) är att modellera det linjära förhållandet mellan de förklarande (oberoende) variablerna och responsen (beroende) variabeln.,
i huvudsak är multipel regression förlängningen av vanliga minsta kvadrater (OLS) regression eftersom det innebär mer än en förklarande variabel.
formel och beräkning av multipel linjär Regression
viktiga Takeaways
- multipel linjär regression (MLR), även känd helt enkelt som multipel regression, är en statistisk teknik som använder flera förklarande variabler för att förutsäga resultatet av en svarsvariabel.,
- Multiple regression är en förlängning av linjär (OLS) regression som använder bara en förklarande variabel.
- MLR används i stor utsträckning i ekonometri och finansiell inferens.
vad multipel linjär Regression (MLR) kan berätta
enkel linjär regression är en funktion som gör det möjligt för en analytiker eller statistiker att göra förutsägelser om en variabel baserat på den information som är känd om en annan variabel. Linjär regression kan endast användas när man har två kontinuerliga variabler—en oberoende variabel och en beroende variabel., Den oberoende variabeln är den parameter som används för att beräkna den beroende variabeln eller resultatet. En multipel regressionsmodell sträcker sig till flera förklarande variabler.,g antaganden:
- Det finns ett linjärt samband mellan de beroende variablerna och de oberoende variablerna
- de oberoende variablerna är inte alltför starkt korrelerade med varandra
- Yi observationer väljs oberoende och slumpmässigt från befolkningen
- residualer bör normalt fördelas med ett medelvärde på 0 och varians σ
bestämningskoefficienten (R-kvadrat) är en statistisk metrisk som är en används för att mäta hur mycket av variationen i resultatet kan förklaras av variationen i de oberoende variablerna., R2 ökar alltid när fler prediktorer läggs till i MLR-modellen, även om prediktorerna kanske inte är relaterade till resultatvariabeln.
R2 i sig kan därför inte användas för att identifiera vilka prediktorer som ska ingå i en modell och som bör uteslutas. R2 kan bara vara mellan 0 och 1, där 0 indikerar att resultatet inte kan förutsägas av någon av de oberoende variablerna och 1 indikerar att resultatet kan förutsägas utan fel från de oberoende variablerna.,
vid tolkning av resultaten av multipel regression är beta-koefficienter giltiga medan alla andra variabler hålls konstanta (”allt annat lika”). Utgången från en multipel regression kan visas horisontellt som en ekvation, eller vertikalt i tabellform.
exempel på hur man använder Multiple Linear Regression (MLR)
som ett exempel kan en analytiker vilja veta hur marknadsrörelsen påverkar priset på ExxonMobil (XOM)., I det här fallet kommer deras linjära ekvation att ha värdet av s&p 500-indexet som den oberoende variabeln eller prediktorn och priset på XOM som den beroende variabeln.
i verkligheten finns det flera faktorer som förutsäger resultatet av en händelse. Prisrörelsen för ExxonMobil beror till exempel på mer än bara resultatet av den totala marknaden. Andra prediktorer som priset på olja, räntor och prisrörelsen för oljeterminer kan påverka priset på XOM och aktiekurser för andra oljebolag., För att förstå ett förhållande där mer än två variabler är närvarande används multipel linjär regression.
multipel linjär regression (MLR) används för att bestämma ett matematiskt förhållande mellan ett antal slumpmässiga variabler. I andra termer undersöker MLR hur flera oberoende variabler är relaterade till en beroende variabel. När var och en av de oberoende faktorerna har bestämts för att förutsäga den beroende variabeln, kan informationen om de flera variablerna användas för att skapa en korrekt förutsägelse om vilken effekt de har på resultatvariabeln., Modellen skapar ett förhållande i form av en rak linje (linjär) som bäst approximerar alla enskilda datapunkter.,erest priser
de minsta kvadratuppskattningarna, B0, B1, B2…BP, beräknas vanligtvis av statistisk programvara., Så många variabler kan inkluderas i regressionsmodellen där varje oberoende variabel är differentierad med ett tal—1,2, 3, 4…p. den multipla regressionsmodellen gör det möjligt för en analytiker att förutsäga ett resultat baserat på information som tillhandahålls på flera förklarande variabler.
fortfarande är modellen inte alltid helt korrekt eftersom varje datapunkt kan skilja sig något från resultatet som förutses av modellen. Restvärdet E, som är skillnaden mellan det faktiska resultatet och det förväntade resultatet, ingår i modellen för att ta hänsyn till sådana små variationer.,
förutsatt att vi kör vår Xom prisregression modell genom en statistik beräkning programvara, som returnerar denna utgång:
en analytiker skulle tolka denna produktion till att betyda om andra variabler hålls konstanta, kommer priset på Xom att öka med 7,8% om priset på olja på marknaderna ökar med 1%. Modellen visar också att priset på XOM kommer att minska med 1.,5% Efter en 1% ökning av räntorna. R2 indikerar att 86,5% av variationerna i aktiekursen för Exxon Mobil kan förklaras av förändringar i räntan, oljepriset, oljeterminer och s&p 500 index.
skillnaden mellan linjär och multipel Regression
vanlig linjär rutor (OLS) regression jämför svaret på en beroende variabel givet en förändring i vissa förklarande variabler. Det är dock sällsynt att en beroende variabel förklaras av endast en variabel., I detta fall använder en analytiker flera regression, som försöker förklara en beroende variabel med mer än en oberoende variabel. Flera regressioner kan vara linjära och olinjära.
flera regressioner baseras på antagandet att det finns ett linjärt samband mellan både de beroende och oberoende variablerna. Det förutsätter också ingen större korrelation mellan de oberoende variablerna.,