co je vícenásobná lineární regrese (MLR)?
Vícenásobné lineární regrese (MLR), také známý jednoduše jako vícenásobné regrese je statistická technika, která používá několik vysvětlujících proměnných předpovědět výsledek proměnná odezvy. Cílem vícenásobné lineární regrese (MLR) je modelovat lineární vztah mezi vysvětlujícími (nezávislými) proměnnými a proměnnou odezvy (závislou).,
v podstatě je vícenásobná regrese rozšířením běžné regrese nejmenších čtverců (OLS), protože zahrnuje více než jednu vysvětlující proměnnou.
Vzorec a Výpočet Mnohonásobné Lineární Regrese
Klíčové Takeaways
- Vícenásobné lineární regrese (MLR), také známý jednoduše jako vícenásobné regrese je statistická technika, která používá několik vysvětlujících proměnných předpovědět výsledek proměnná odezvy.,
- vícenásobná regrese je rozšíření lineární (OLS) regrese, která používá pouze jednu vysvětlující proměnnou.
- MLR se hojně používá v ekonometrii a finanční inferenci.
Co Vícenásobné Lineární Regrese (MLR) Může Říct
Jednoduché lineární regrese je funkce, která umožňuje analytik nebo statistik, aby se předpovědi o jedné proměnné na základě informací, které je známo, že o další proměnné. Lineární regrese může být použita pouze v případě, že má dvě spojité proměnné—nezávislou proměnnou a závislou proměnnou., Nezávislá proměnná je parametr, který se používá k výpočtu závislé proměnné nebo výsledku. Vícenásobný regresní model se rozšiřuje na několik vysvětlujících proměnných.,g předpokladů:
- Existuje lineární vztah mezi závislé proměnné a nezávislé proměnné
- nezávislé proměnné nejsou příliš vysoce korelovány s ostatními
- pozorování yi jsou vybrány nezávisle a náhodně z populace
- Odchylky by měly být normálně rozděleny se střední hodnotou 0 a rozptylem σ
koeficient determinace (R-squared) je statistický ukazatel, který se používá k měření, jak moc rozdíly ve výsledku může být vysvětleno rozdíly v nezávislých proměnných., R2 se vždy zvyšuje, protože do modelu MLR se přidává více prediktorů, i když prediktory nemusí souviset s výsledkovou proměnnou.
R2 sama o sobě nemůže být použita k identifikaci, které prediktory by měly být zahrnuty do modelu a které by měly být vyloučeny. R2 může být mezi 0 a 1, kde 0 znamená, že výsledek nelze předpovědět, u žádné z nezávislých proměnných a 1 označuje, že výsledek lze předvídat, bez chyby z nezávislých proměnných.,
při interpretaci výsledků vícenásobné regrese jsou beta koeficienty platné při zachování všech ostatních proměnných konstantní („vše ostatní stejné“). Výstup z vícenásobné regrese může být zobrazen vodorovně jako rovnice nebo svisle ve formě tabulky.
Příklad, Jak Používat Vícenásobné Lineární Regrese (MLR)
Jako příklad, analytik může chtít vědět, jak pohyb na trhu ovlivňuje cenu ExxonMobil (XOM)., V tomto případě bude mít jejich lineární rovnice hodnotu indexu S&p 500 jako nezávislou proměnnou nebo prediktorem a cenu XOM jako závislou proměnnou.
ve skutečnosti existuje několik faktorů, které předpovídají výsledek události. Například cenový pohyb ExxonMobil závisí na více než jen na výkonu celkového trhu. Další prediktory, jako je cena ropy, úrokové sazby a pohyb cen ropných futures, mohou ovlivnit cenu Xom a ceny akcií jiných ropných společností., Pro pochopení vztahu, ve kterém je přítomno více než dvě proměnné, se používá vícenásobná lineární regrese.
vícenásobná lineární regrese (MLR) se používá k určení matematického vztahu mezi řadou náhodných proměnných. V jiných termínech MLR zkoumá, jak více nezávislých proměnných souvisí s jednou závislou proměnnou. Jakmile každý z nezávislých faktorů byla stanovena předvídat závislá proměnná, informace o více proměnných mohou být použity k vytvoření přesná předpověď na úrovni vliv mají na výsledku proměnné., Model vytváří vztah ve formě přímky (lineární), která nejlépe přibližuje všechny jednotlivé datové body.,erest sazby
nejmenších čtverců odhadů B0, B1, B2,…Bp, jsou obvykle počítány pomocí statistického softwaru., Tolik proměnných může být zahrnuto do regresního modelu, ve kterém je každá nezávislá proměnná diferencována číslem—1,2, 3, 4…p. vícenásobný regresní model umožňuje analytikovi předpovědět výsledek na základě informací poskytnutých na více vysvětlujících proměnných.
přesto není model vždy dokonale přesný, protože každý datový bod se může mírně lišit od výsledku předpovídaného modelem. Zbytková hodnota, E, což je rozdíl mezi skutečným výsledkem a předpokládaným výsledkem, je zahrnuta v modelu, který odpovídá za takové mírné odchylky.,
za Předpokladu, že jsme se spustit náš XOM cena regresním modelu pomocí statistiky, výpočetní software, který vrací tento výstup:
analytik by se interpretovat tento výstup znamená, pokud ostatní proměnné jsou konstantní, cena XOM zvýší o 7,8% pokud cena ropy na trzích se zvyšuje o 1%. Model také ukazuje, že cena XOM se sníží o 1.,5% po 1% zvýšení úrokových sazeb. R2 naznačuje, že 86,5% změn ceny akcií Exxon Mobil lze vysvětlit změnami úrokové sazby, ceny ropy, futures na ropu a s&p 500 index.
Rozdíl Mezi Lineární a Vícenásobné Regrese
Obyčejný lineární čtverců (OLS) regresní porovnává odpovědi závislé proměnné vzhledem ke změně v některé vysvětlující proměnné. Je však vzácné, že závislá proměnná je vysvětlena pouze jednou proměnnou., V tomto případě analytik používá vícenásobnou regresi, která se pokouší vysvětlit závislou proměnnou pomocí více než jedné nezávislé proměnné. Vícenásobné regrese mohou být lineární a nelineární.
Vícenásobné regrese jsou založeny na předpokladu, že existuje lineární vztah mezi závislé a nezávislé proměnné. Rovněž nepředpokládá žádnou významnou korelaci mezi nezávislými proměnnými.,