Hvad er Multiple Linear Regression (MLR)?
Multiple linear regression (MLR), også kendt som multiple regression, er en statistisk teknik, der bruger flere forklarende variabler til at forudsige resultatet af en responsvariabel. Målet med multiple linear regression (MLR) er at modellere det lineære forhold mellem de forklarende (uafhængige) variabler og respons (afhængig) variabel.,
i det væsentlige er multiple regression udvidelsen af almindelig least-s .uares (OLS) regression, fordi det involverer mere end en forklarende variabel.
Formel og Beregning af Multiple Lineær Regression
Key Takeaways
- Multipel lineær regression (MLR), også kendt blot som multipel regression er en statistisk teknik, der bruger flere forklarende variabler til at forudsige udfaldet af en responsvariabel.,
- Multiple regression er en udvidelse af lineær (OLS) regression, der kun bruger en forklarende variabel.
- MLR anvendes i udstrakt grad i økonometri og finansiel inferens.
Hvad Multipel Lineær Regression (MLR) Kan Fortælle Dig,
Simpel lineær regression er en funktion, der tillader at en analytiker eller en statistiker til at gøre forudsigelser om en variabel baseret på de oplysninger, som er kendt om en anden variabel. Lineær regression kan kun bruges, når man har to kontinuerlige variabler—en uafhængig variabel og en afhængig variabel., Den uafhængige variabel er den parameter, der bruges til at beregne den afhængige variabel eller resultatet. En multipel regressionsmodel strækker sig til flere forklarende variabler.,g antagelser:
- Der er en lineær sammenhæng mellem den afhængige variabel og de uafhængige variable
- De uafhængige variabler er ikke for stærkt korreleret med hinanden
- yi observationer er valgt uafhængigt og tilfældigt fra befolkningen
- Residualer skal være normalfordelt med en middelværdi på 0 og varians σ
determinationskoefficienten (R-squared) er en statistisk variabel, der anvendes til at måle, hvor meget af variationen i resultaterne kan forklares af variationen i de uafhængige variable., R2 stiger altid, efterhånden som flere forudsigere føjes til MLR-modellen, selvom forudsigelserne muligvis ikke er relateret til resultatvariablen.
R2 kan i sig selv ikke bruges til at identificere, hvilke forudsigere der skal inkluderes i en model, og hvilke der bør udelukkes. R2 kan kun være mellem 0 og 1, hvor 0 angiver, at resultatet ikke kan forudsiges med nogen af de uafhængige variable, og 1 angiver, at resultatet kan forudsiges uden fejl fra de uafhængige variable.,
Ved fortolkning af resultaterne af multipel regression er beta-koefficienter gyldige, mens alle andre variabler holdes konstante (“alt andet lige”). Udgangen fra en multipel regression kan vises vandret som en ligning eller lodret i tabelform.
eksempel på, hvordan man bruger Multiple Linear Regression (MLR)
som et eksempel vil en analytiker måske vide, hvordan markedets bevægelse påvirker prisen på e..onmobil (.om)., I dette tilfælde vil deres lineære ligning have værdien af S&p 500-indekset som den uafhængige variabel eller prediktor og prisen på .om som den afhængige variabel.
i virkeligheden er der flere faktorer, der forudsiger resultatet af en begivenhed. Prisbevægelsen for e..onmobil afhænger for eksempel af mere end blot præstationen på det samlede marked. Andre forudsigere som prisen på olie, renter og prisbevægelsen for oliefutures kan påvirke prisen på otherom og aktiekurser for andre olieselskaber., For at forstå et forhold, hvor mere end to variabler er til stede, anvendes flere lineære regression.
Multiple linear regression (MLR) bruges til at bestemme et matematisk forhold mellem en række tilfældige variabler. Med andre ord undersøger MLR, hvordan flere uafhængige variabler er relateret til en afhængig variabel. Når hver af de uafhængige faktorer er blevet bestemt til at forudsige den afhængige variabel, kan informationen om de flere variabler bruges til at skabe en nøjagtig forudsigelse af det effektniveau, de har på resultatvariablen., Modellen skaber et forhold i form af en lige linje (lineær), der bedst tilnærmes alle de enkelte datapunkter.,dhvile priser
Det mindste kvadraters estimater, B0, B1, B2,…Bp, er normalt beregnet af statistisk software., Så mange variabler kan indgå i regressionsmodellen, hvor hver uafhængig variabel er differentieret med et tal—1,2, 3, 4…p. multiple regression model tillader en analytiker at forudsige et resultat baseret på oplysninger om flere forklarende variabler.
modellen er stadig ikke altid helt nøjagtig, da hvert datapunkt kan afvige lidt fra det resultat, der er forudsagt af modellen. Restværdien, E, som er forskellen mellem det faktiske resultat og det forudsagte resultat, indgår i modellen for at tage højde for sådanne små variationer.,
hvis vi kører vores XOM pris regression model gennem en statistik beregnings-software, der returnerer denne udgang:
En analytiker ville fortolke denne udgang til at betyde, hvis andre variabler holdes konstante, at prisen på XOM vil stige med 7,8% hvis prisen på olie i de markeder, der stiger med 1%. Modellen viser også, at prisen på 1OM vil falde med 1.,5% Efter en stigning i renten på 1%. R2 angiver, at 86,5% af udsving i aktiekursen på Exxon Mobil, kan forklares ved ændringer i rente, oliepris, olie-futures, og S&P 500-indekset.
forskellen mellem lineær og multipel Regression
almindelige lineære kvadrater (OLS) regression sammenligner responsen af en afhængig variabel givet en ændring i nogle forklarende variabler. Det er dog sjældent, at en afhængig variabel kun forklares med en variabel., I dette tilfælde bruger en analytiker flere regression, som forsøger at forklare en afhængig variabel ved hjælp af mere end en uafhængig variabel. Flere regressioner kan være lineære og ikke-lineære.
flere regressioner er baseret på antagelsen om, at der er et lineært forhold mellem både de afhængige og uafhængige variabler. Den antager heller ingen større sammenhæng mellem de uafhængige variabler.,