No artigo anterior deduzimos matematicamente o coeficiente de determinação r², além de demonstrarmos suas propriedades.
Como foi demonstrado, o coeficiente r² é um valor entre 0 e 1 que representa o grau de ajustamento de uma Função de Regressão em relação aos dados, sendo interpretado como a razão percentual dos desvios dos valores observados que são explicados pela regressão.
E como visto:
O Coeficiente de Correlação Amostral r, matematicamente, nada mais é do que a raiz do coeficiente de determinação r², ou seja:
Para deduzir a forma funcional mais utilizadas partiremos de:
Tal que:
Partindo dessa identidade matemática, vamos tratar sobre a sua interpretação e as suas propriedades.
Quanto a interpretação, o coeficiente r representa o grau de associação de duas variáveis, tal que um valor de r > 0 simboliza que há uma relação positiva entre duas variáveis, um valor r < 0 simboliza que há uma relação negativa entre as duas variáveis e um valor r = 0 simboliza não há relação entre as duas variáveis.
Quanto as suas propriedades matemáticas, dado que r é a raiz de r², é natural que esteja dentro do círculo unitário, ou seja:
Para melhor exemplificar, segue um grupo de gráficos do livro Econometria Básica do Gujarati:
Como visto, o valor de r representa a correlação entre duas variáveis.
Segue alguns fatos importantes sobre o valor de r.
Primeiro, trata-se de um valor dotado de simetria, ou seja, o coeficiente de correlação entre Y e X é igual o coeficiente de correlação entre X e Y, algebricamente:
Segundo, ele só é útil para descrever relações lineares. Conforme fica claro no gráfico visto a pouco, ele é inútil para relações não lineares como Y = X².
Terceiro, se X e Y são independentes então r = 0, mas a réplica não se confirma pois um valor de r = 0 não significa necessariamente que X e Y são estatisticamente independentes.
Quarto, o nome amostral não é a toa, o coeficiente r é um estimador de um parâmetro ρ, conhecido como Coeficiente de Correlação Populacional, que tem as mesmas propriedades observadas do r, ou seja -1 < ρ < 1.
Em suma, nesse artigo, aprendemos a relevância do estimador r, como calcular e como interpretar. aprendemos que o -1 < r < 1 onde r aponta a direção (+ ou -) e o grau de correlação (0 a 1) entre duas variáveis, no caso, Y e X.
No próximo artigo, apresentaremos o Modelo de Regressão Linear Clássico Normal e começaremos a entrar no campo da inferência estátistica.
GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
Comentários
Postar um comentário