Különbség a korrigált R-négyzet és R-négyzet között

ebben a bemutatóban lefedjük az R-négyzet és a korrigált r-négyzet közötti különbséget. Ez magában foglalja a részletes elméleti és gyakorlati magyarázatot e két statisztikai mutatót R.

R-négyzet (R2)
méri az arány a variáció a függő változó magyarázható az összes független változók a modellben. Feltételezi, hogy a modell minden független változója segít megmagyarázni a függő változó változását., A valóságban egyes független változók (prediktorok) nem segítenek megmagyarázni a függő (cél) változót. Más szavakkal, egyes változók nem járulnak hozzá a célváltozók előrejelzéséhez.
matematikailag az R-négyzetet úgy számítják ki, hogy a maradék négyzetek (SSres) összegét elosztják a négyzetek (sstot) teljes összegével, majd kivonják az 1-ből. Ebben az esetben az SStot a teljes variációt méri. Az SSreg-intézkedések magyarázták a variációt, az SSres-ek pedig megmagyarázhatatlan eltéréseket mértek.,
as SSres + SSreg = SStot, R2 = Explained variation/Total Variation

R-squared Equation

R-Squared is nevezik együttható meghatározása. 0-100% között van. A 100% – os R-négyzet értéke azt jelenti, hogy a modell megmagyarázza a célváltozó összes változását. A 0% – os érték pedig a modell nulla prediktív erejét méri. Magasabb r-négyzetes érték, jobb a modell.
Korrigált R-négyzet
méri a variáció arányát, amelyet csak azok a független változók magyaráznak, amelyek valóban segítenek a függő változó magyarázatában., Ez bünteti Önt hozzá független változó, amely nem segít előre a függő változó.
Korrigált R-négyzet kiszámítható matematikailag összege négyzetek. Az egyetlen különbség az R-négyzet és a korrigált R-négyzet egyenlet között a szabadság foka.

Korrigált R-Négyzet Egyenlet

a fenti egyenlet, dft, a szabadságfok n– 1, a becsült népesség eltérést, a függő változó pedig a dfe ez a szabadságfok n – p – 1. a becslés alapjául szolgáló népesség hiba variancia.,
A korrigált R-négyzet értéke az R-négyzet értéke, a független változók száma (prediktorok), a teljes minta mérete alapján számítható ki.

Korrigált R-négyzet egyenlet 2

különbség az R-négyzet és a korrigált R-négyzet között

  1. minden alkalommal, amikor független változót ad hozzá egy modellhez, az R-négyzet növekszik, még akkor is, ha a független változó jelentéktelen. Soha nem csökken. Míg a korrigált R-négyzet csak akkor növekszik, ha a független változó jelentős, és befolyásolja a függő változót.,
  2. az alábbi táblázatban a korrigált r-négyzet maximális, ha két változót tartalmaztunk. A harmadik változó hozzáadásakor csökken. Míg az r-négyzet növekszik, amikor a harmadik változót vettük fel. Ez azt jelenti, hogy a harmadik változó jelentéktelen a modellhez.

    R-négyzet vs.Korrigált R-négyzet

  3. Korrigált r-négyzet negatív lehet, ha az r-négyzet közel van nullához.
  4. a korrigált r-négyzet értéke mindig kisebb vagy egyenlő az r-négyzet értékkel.
melyik a jobb?,

Korrigált R-négyzet kell használni, hogy hasonlítsa össze a modellek különböző számú független változók. Korrigált R-négyzet kell használni, miközben kiválasztja a fontos prediktorok (független változók) a regressziós modell.

R : Számítsa ki az R-négyzetet és korrigált R-négyzetet
tegyük fel, hogy tényleges és előre jelzett függő változó értékei vannak. Az alábbi szkriptben létrehoztunk egy mintát ezekről az értékekről. Ebben a példában az y a megfigyelt függő változóra, az yhat pedig az előre jelzett függő változóra utal.,
végeredmény: R-négyzet = 0,6410828
tegyük fel, hogy ebben az esetben három független változója van.

n = 10
p = 3
adj.r.négyzet = 1 – (1 – R. négyzet) * ((n – 1)/(n-P-1))
nyomtatás(adj.R.négyzet)

ebben az esetben a korrigált r-négyzet értéke 0.4616242 feltételezve, hogy 3 prediktorunk és 10 megfigyelésünk van.

Python: Számítsa ki a korrigált R-négyzetet és R-négyzetet

SAS: Korrigált R-Négyzetszámítás

Leave a Comment