Was Ist Multiple Lineare Regression (MLR)?
Multiple lineare Regression (MLR), auch einfach als Multiple Regression bezeichnet, ist eine statistische Technik, die mehrere erklärende Variablen verwendet, um das Ergebnis einer Antwortvariablen vorherzusagen. Das Ziel der multiplen linearen Regression (MLR) ist es, die lineare Beziehung zwischen den erklärenden (unabhängigen) Variablen und der Antwortvariablen (abhängigen) zu modellieren.,
Im Wesentlichen ist Multiple Regression die Erweiterung der normalen OLS-Regression (Least Squares), da sie mehr als eine erklärende Variable umfasst.
Formel und Berechnung der multiplen linearen Regression
Key Takeaways
- Multiple Linear Regression (MLR), auch einfach als Multiple Regression bekannt, ist eine statistische Technik, die mehrere erklärende Variablen verwendet, um das Ergebnis einer Antwortvariablen vorherzusagen.,
- Multiple Regression ist eine Erweiterung der linearen (OLS) Regression, die nur eine erklärende Variable verwendet.
- MLR wird ausgiebig in der Ökonometrie und Finanzinferenz verwendet.
Was Multiple lineare Regression (MLR) Ihnen sagen kann
Einfache lineare Regression ist eine Funktion, die es einem Analysten oder Statistiker ermöglicht, Vorhersagen über eine Variable basierend auf den Informationen zu treffen, die über eine andere Variable bekannt sind. Lineare Regression kann nur verwendet werden, wenn man zwei kontinuierliche Variablen hat—eine unabhängige Variable und eine abhängige Variable., Die unabhängige Variable ist der Parameter, der zur Berechnung der abhängigen Variablen oder des Ergebnisses verwendet wird. Ein multiples Regressionsmodell erstreckt sich auf mehrere erklärende Variablen.,g Annahmen:
- Es besteht eine lineare Beziehung zwischen den abhängigen Variablen und den unabhängigen Variablen
- Die unabhängigen Variablen sind nicht zu stark miteinander korreliert
- yi Beobachtungen werden unabhängig und zufällig aus der Grundgesamtheit ausgewählt
- Residuen sollten normalerweise mit einem Mittelwert von 0 verteilt sein und Varianz σ
Der Bestimmungskoeffizient (R-Quadrat) ist eine statistische Metrik, die verwendet wird, um to measure how much of the variation in outcome can be explained by the variation in the independent variables., R2 nimmt immer zu, wenn dem MLR-Modell mehr Prädiktoren hinzugefügt werden, obwohl die Prädiktoren möglicherweise nicht mit der Ergebnisvariablen zusammenhängen.
R2 selbst kann daher nicht verwendet werden, um zu identifizieren, welche Prädiktoren in ein Modell aufgenommen und welche ausgeschlossen werden sollen. R2 kann nur zwischen 0 und 1 liegen, wobei 0 angibt, dass das Ergebnis von keiner der unabhängigen Variablen vorhergesagt werden kann, und 1 angibt, dass das Ergebnis ohne Fehler von den unabhängigen Variablen vorhergesagt werden kann.,
Bei der Interpretation der Ergebnisse mehrerer Regressionen sind Beta-Koeffizienten gültig, während alle anderen Variablen konstant gehalten werden („alles andere gleich“). Die Ausgabe einer Mehrfachregression kann horizontal als Gleichung oder vertikal in Tabellenform angezeigt werden.
Beispiel für die Verwendung der multiplen linearen Regression (MLR)
Als Beispiel möchte ein Analyst möglicherweise wissen, wie sich die Marktbewegung auf den Preis von ExxonMobil (XOM) auswirkt., In diesem Fall hat ihre lineare Gleichung den Wert des S&P 500 Index als unabhängige Variable oder Prädiktor und den Preis von XOM als abhängige Variable.
In Wirklichkeit gibt es mehrere Faktoren, die das Ergebnis eines Ereignisses vorhersagen. Die Preisentwicklung von ExxonMobil beispielsweise hängt nicht nur von der Performance des Gesamtmarktes ab. Andere Prädiktoren wie der Ölpreis, die Zinssätze und die Preisbewegung von Öl-Futures können den Preis von XOM und die Aktienkurse anderer Ölunternehmen beeinflussen., Um eine Beziehung zu verstehen, in der mehr als zwei Variablen vorhanden sind, wird eine multiple lineare Regression verwendet.
Multiple lineare regression (MLR) wird verwendet, um zu bestimmen, eine mathematische Beziehung zwischen einer Reihe von Zufalls-Variablen. Mit anderen Worten, MLR untersucht, wie mehrere unabhängige Variablen mit einer abhängigen Variablen zusammenhängen. Sobald jeder der unabhängigen Faktoren bestimmt wurde, um die abhängige Variable vorherzusagen, können die Informationen zu den mehreren Variablen verwendet werden, um eine genaue Vorhersage des Wirkungsgrades zu erstellen, den sie auf die Ergebnisvariable haben., Das Modell erstellt eine Beziehung in Form einer geraden Linie (linear), die sich am besten an alle einzelnen Datenpunkte anpasst.,zinssätze
Die Schätzungen der kleinsten Quadrate, B0, B1, B2…Bp, werden normalerweise mit statistischer Software berechnet., So viele Variablen können in das Regressionsmodell einbezogen werden, in dem jede unabhängige Variable mit einer Zahl differenziert wird—1,2, 3, 4…p. Das Multiple Regressionsmodell ermöglicht es einem Analytiker, ein Ergebnis basierend auf Informationen über mehrere erklärende Variablen vorherzusagen.
Dennoch ist das Modell nicht immer genau, da jeder Datenpunkt geringfügig von dem vom Modell vorhergesagten Ergebnis abweichen kann. Der Restwert E, der die Differenz zwischen dem tatsächlichen Ergebnis und dem vorhergesagten Ergebnis darstellt, wird in das Modell einbezogen, um solche geringfügigen Abweichungen zu berücksichtigen.,
Angenommen, wir führen unser XOM-Preisregressionsmodell über eine Statistikberechnungssoftware aus, die diese Ausgabe zurückgibt:
Ein Analyst würde diese Ausgabe so interpretieren, dass, wenn andere Variablen konstant gehalten werden, der Preis von XOM um 7,8% steigen wird, wenn der Ölpreis auf den Märkten um 1% steigt. Das Modell zeigt auch, dass der Preis von XOM um 1 sinken wird.,5% nach einem Anstieg der Zinssätze um 1%. R2 gibt an, dass 86,5% der Schwankungen des Aktienkurses von Exxon Mobil durch Änderungen des Zinssatzes, des Ölpreises, der Öl-Futures und des S&P 500 Index erklärt werden können.
Der Unterschied zwischen linearer und multipler Regression
Reguläre lineare Quadrate (OLS) Regression vergleicht die Antwort einer abhängigen Variablen bei einer Änderung einiger erklärender Variablen. Es ist jedoch selten, dass eine abhängige Variable nur durch eine Variable erklärt wird., In diesem Fall verwendet ein Analyst eine Multiple Regression, die versucht, eine abhängige Variable mit mehr als einer unabhängigen Variablen zu erklären. Mehrere Regressionen können linear und nichtlinear sein.
Mehrere Regressionen basieren auf der Annahme, dass eine lineare Beziehung zwischen den abhängigen und unabhängigen Variablen besteht. Es wird auch keine größere Korrelation zwischen den unabhängigen Variablen angenommen.,