Diferença entre R-quadrado ajustado e R-quadrado

neste tutorial, vamos cobrir a diferença entre R-quadrado e R-quadrado ajustado. Ele inclui detalhada teórico e prático explicação desses dois dados estatísticos em R.

R-quadrado (R2)
Ele mede a proporção da variação na sua variável dependente explicada por todas as variáveis independentes no modelo. Ele assume que cada variável independente no modelo ajuda a explicar a variação na variável dependente., Na realidade, algumas variáveis independentes (predictores) não ajudam a explicar a variável dependente (alvo). Por outras palavras, algumas variáveis não contribuem para a previsão da variável-alvo.
matematicamente, R-quadrado é calculado dividindo a soma dos quadrados dos resíduos (SSres) pela soma total dos quadrados (SStot) e, em seguida, subtrai-lo de 1. Neste caso, a SStot mede a variação total. As medidas SSreg explicaram a variação e as medidas SSres explicam a variação inexplicada.,
Como SSres + SSreg = SStot, R2 = Explicado / variação Total Variação

R-quadrado Equação

R-Quadrado é também chamado de coeficiente de determinação. Situa-se entre 0% e 100%. Um valor R-quadrado de 100% significa que o modelo explica toda a variação da variável alvo. E um valor de 0% mede a potência preditiva zero do modelo. Maior valor R ao quadrado, melhor o modelo.
R-quadrado ajustado
ele mede a proporção de variação explicada por apenas aquelas variáveis independentes que realmente ajudam a explicar a variável dependente., Penaliza-o por adicionar uma variável independente que não ajuda a prever a variável dependente.
R-quadrado ajustado pode ser calculado matematicamente em termos de soma de quadrados. A única diferença entre o quadrado R e a equação R-quadrado ajustada é o grau de liberdade.

Ajustado de R-Quadrado Equação

Na equação acima, dft é o número de graus de liberdade n– 1 da estimativa da variância da população a variável dependente, e o dfe é o número de graus de liberdade n – p – 1 da estimativa da população subjacente erro de variância.,
Valor R-quadrado ajustado pode ser calculado com base no valor r-quadrado, Número de variáveis independentes (predictores), tamanho total da amostra.

Ajustado de R-Quadrado a Equação 2

Diferença entre o R-quadrado e Ajustado de R-quadrado

  1. Cada vez que você adicionar uma variável independente do modelo, o R-quadrado aumenta, mesmo se a variável independente é insignificante. Nunca diminui. Enquanto que o R-quadrado ajustado só aumenta quando variável independente é significativa e afeta variável dependente.,
  2. na tabela abaixo, R-quadrado ajustado é máximo quando incluímos duas variáveis. Diminui quando a terceira variável é adicionada. Enquanto que o R-quadrado aumenta quando incluímos a terceira variável. Significa que a terceira variável é insignificante para o modelo.

    R-Quadrado vs. Ajustado de R-Quadrado

  3. Ajustado de r-quadrado pode ser negativo quando de r-quadrado é perto de zero.o valor R-quadrado ajustado é sempre inferior ou igual ao valor R-quadrado.Qual é melhor?,

R-square ajustado deve ser usado para comparar modelos com diferentes números de variáveis independentes. Deve utilizar-se o R-square ajustado ao seleccionar indicadores importantes (variáveis independentes) para o modelo de regressão.

R : calcular R-quadrado e R-quadrado ajustado
suponha que tem valores variáveis dependentes reais e previstos. No script abaixo, criamos uma amostra desses valores. Neste exemplo, y refere-se à variável dependente observada e yhat refere-se à variável dependente prevista.,
resultado Final: R-quadrado = 0,6410828
vamos assumir que você tem três variáveis independentes neste caso.

n = 10
p = 3
adj.r.quadrado = 1 – (1 – R. quadrado) * ((n – 1)/(n-p-1))
print(adj.r.ao quadrado)

neste caso, ajustado valor de r-quadrado é 0.4616242 supondo que temos 3 preditores e 10 observações.

Python: Calculate R-Squared and R-Squared

SAS: Adjusted R-Squared Calculation

Leave a Comment