Verschil tussen aangepast R-kwadraat en R-kwadraat

In deze tutorial zullen we het verschil tussen R-kwadraat en aangepast r-kwadraat behandelen. Het bevat gedetailleerde theoretische en praktische uitleg van deze twee statistische metrics in R.

R-kwadraat (R2)
Het meet het aandeel van de variatie in uw afhankelijke variabele verklaard door al uw onafhankelijke variabelen in het model. Het veronderstelt dat elke onafhankelijke variabele in het model helpt om variatie in de afhankelijke variabele te verklaren., In werkelijkheid helpen sommige onafhankelijke variabelen (voorspellers) niet om afhankelijke (doel) variabele te verklaren. Met andere woorden, sommige variabelen dragen niet bij aan het voorspellen van doelvariabele.Mathematisch wordt R-kwadraat berekend door de som van de kwadraten van reststoffen (SSRE ‘ s) te delen door de totale som van de kwadraten (SStot) en deze vervolgens af te trekken van 1. In dit geval meet SStot de totale variatie. SSreg-maatregelen verklaarden variatie en SSRE ‘ s meten onverklaarbare variatie.,
Als SSres + SSreg = SStot, R2 = Explained variation / Total Variation

r-kwadraatvergelijking

R-kwadraat wordt ook wel determinatiecoëfficiënt genoemd. Het ligt tussen 0% en 100%. Een R-kwadraatwaarde van 100% betekent dat het model alle variatie van de doelvariabele verklaart. En een waarde van 0% meet nul voorspellend vermogen van het model. Hogere R-kwadraat waarde, beter het model.
gecorrigeerde R-kwadraat
Het meet het aandeel van de variatie verklaard door alleen die onafhankelijke variabelen die echt helpen bij het verklaren van de afhankelijke variabele., Het bestraft u voor het toevoegen van onafhankelijke variabele die niet helpen bij het voorspellen van de afhankelijke variabele.
gecorrigeerde R-kwadraat kan wiskundig worden berekend in termen van kwadratensom. Het enige verschil tussen R-kwadraat en aangepaste R-kwadraatvergelijking is de mate van vrijheid.

aangepaste R-Kwadraatvergelijking

In de bovenstaande vergelijking is dft de vrijheidsgraden n– 1 van de schatting van de populatievariantie van de afhankelijke variabele, en dfe is de vrijheidsgraden n – p – 1 van de schatting van de onderliggende populatiefoutvariantie.,de aangepaste R-kwadraatwaarde kan worden berekend op basis van de waarde van r-kwadraat, het aantal onafhankelijke variabelen (voorspellers), de totale steekproefgrootte.

aangepaste R-Kwadraatvergelijking 2

verschil tussen R-kwadraat en aangepast R-kwadraat

  1. elke keer dat u een onafhankelijke variabele aan een model toevoegt, neemt de R-kwadraat toe, zelfs als de onafhankelijke variabele onbeduidend is. Het neemt nooit af. Terwijl gecorrigeerde R-kwadraat alleen toeneemt wanneer onafhankelijke variabele significant is en afhankelijke variabele beïnvloedt.,
  2. In onderstaande tabel is aangepast R-kwadraat maximaal wanneer we twee variabelen hebben opgenomen. Het neemt af wanneer derde variabele wordt toegevoegd. Terwijl r-kwadraat toeneemt wanneer we de derde variabele opnemen. Het betekent dat de derde variabele onbelangrijk is voor het model.

    r-kwadraat vs aangepast R-kwadraat

  3. aangepast r-kwadraat kan negatief zijn wanneer r-kwadraat dicht bij nul ligt.
  4. aangepaste R-kwadraatwaarde is altijd kleiner dan of gelijk aan r-kwadraatwaarde.
Wat is beter?,

aangepast R-vierkant moet worden gebruikt om modellen met verschillende aantallen onafhankelijke variabelen te vergelijken. Het aangepaste R-kwadraat moet worden gebruikt bij het selecteren van belangrijke voorspellers (onafhankelijke variabelen) voor het regressiemodel.

R : Bereken R-kwadraat en aangepast R-kwadraat
stel dat je actuele en voorspelde afhankelijke variabele waarden hebt. In het script hieronder hebben we een voorbeeld van deze waarden gemaakt. In dit voorbeeld verwijst y naar de waargenomen afhankelijke variabele en yhat naar de voorspelde afhankelijke variabele.,
eindresultaat: R-kwadraat = 0.6410828
laten we aannemen dat je drie onafhankelijke variabelen hebt in dit geval.

n = 10
p = 3
adj.r.kwadraat = 1 – (1 – R. KWADRAAT) * ((n – 1)/(n-p-1))
print(adj.R.kwadraat)

in dit geval is de aangepaste R-kwadraatwaarde 0,4616242, uitgaande van 3 voorspellers en 10 waarnemingen.

Python: Bereken aangepast R-kwadraat en R-kwadraat

SAS: aangepaste R-Kwadraatberekening

Leave a Comment