R-quadrado (R2)
Ele mede a proporção da variação na sua variável dependente explicada por todas as variáveis independentes no modelo. Ele assume que cada variável independente no modelo ajuda a explicar a variação na variável dependente., Na realidade, algumas variáveis independentes (predictores) não ajudam a explicar a variável dependente (alvo). Por outras palavras, algumas variáveis não contribuem para a previsão da variável-alvo.
matematicamente, R-quadrado é calculado dividindo a soma dos quadrados dos resíduos (SSres) pela soma total dos quadrados (SStot) e, em seguida, subtrai-lo de 1. Neste caso, a SStot mede a variação total. As medidas SSreg explicaram a variação e as medidas SSres explicam a variação inexplicada.,
Como SSres + SSreg = SStot, R2 = Explicado / variação Total Variação
R-quadrado Equação
R-Quadrado é também chamado de coeficiente de determinação. Situa-se entre 0% e 100%. Um valor R-quadrado de 100% significa que o modelo explica toda a variação da variável alvo. E um valor de 0% mede a potência preditiva zero do modelo. Maior valor R ao quadrado, melhor o modelo.
R-quadrado ajustado
ele mede a proporção de variação explicada por apenas aquelas variáveis independentes que realmente ajudam a explicar a variável dependente., Penaliza-o por adicionar uma variável independente que não ajuda a prever a variável dependente.
R-quadrado ajustado pode ser calculado matematicamente em termos de soma de quadrados. A única diferença entre o quadrado R e a equação R-quadrado ajustada é o grau de liberdade.
Ajustado de R-Quadrado Equação
Na equação acima, dft é o número de graus de liberdade n– 1 da estimativa da variância da população a variável dependente, e o dfe é o número de graus de liberdade n – p – 1 da estimativa da população subjacente erro de variância.,
Valor R-quadrado ajustado pode ser calculado com base no valor r-quadrado, Número de variáveis independentes (predictores), tamanho total da amostra.
Ajustado de R-Quadrado a Equação 2
Diferença entre o R-quadrado e Ajustado de R-quadrado
- Cada vez que você adicionar uma variável independente do modelo, o R-quadrado aumenta, mesmo se a variável independente é insignificante. Nunca diminui. Enquanto que o R-quadrado ajustado só aumenta quando variável independente é significativa e afeta variável dependente.,
- Ajustado de r-quadrado pode ser negativo quando de r-quadrado é perto de zero.o valor R-quadrado ajustado é sempre inferior ou igual ao valor R-quadrado.Qual é melhor?,
na tabela abaixo, R-quadrado ajustado é máximo quando incluímos duas variáveis. Diminui quando a terceira variável é adicionada. Enquanto que o R-quadrado aumenta quando incluímos a terceira variável. Significa que a terceira variável é insignificante para o modelo.
R-Quadrado vs. Ajustado de R-Quadrado
R-square ajustado deve ser usado para comparar modelos com diferentes números de variáveis independentes. Deve utilizar-se o R-square ajustado ao seleccionar indicadores importantes (variáveis independentes) para o modelo de regressão.
R : calcular R-quadrado e R-quadrado ajustado
suponha que tem valores variáveis dependentes reais e previstos. No script abaixo, criamos uma amostra desses valores. Neste exemplo, y refere-se à variável dependente observada e yhat refere-se à variável dependente prevista.,
resultado Final: R-quadrado = 0,6410828
vamos assumir que você tem três variáveis independentes neste caso.
n = 10
p = 3
adj.r.quadrado = 1 – (1 – R. quadrado) * ((n – 1)/(n-p-1))
print(adj.r.ao quadrado)
neste caso, ajustado valor de r-quadrado é 0.4616242 supondo que temos 3 preditores e 10 observações.