O Coeficiente de Correlação Amostral r


    No artigo anterior deduzimos matematicamente o coeficiente de determinação r², além de demonstrarmos suas propriedades.

    Como foi demonstrado, o coeficiente r² é um valor entre 0 e 1 que representa o grau de ajustamento de uma Função de Regressão em relação aos dados, sendo interpretado como a razão percentual dos desvios dos valores observados que são explicados pela regressão.

    E como visto:

    O Coeficiente de Correlação Amostral r, matematicamente, nada mais é do que a raiz do coeficiente de determinação r², ou seja:

     Para deduzir a forma funcional mais utilizadas partiremos de:

    Tal que:

    Partindo dessa identidade matemática, vamos tratar sobre a sua interpretação e as suas propriedades.

    Quanto a interpretação, o coeficiente r representa o grau de associação de duas variáveis, tal que um valor de r > 0 simboliza que há uma relação positiva entre duas variáveis, um valor r < 0 simboliza que há uma relação negativa entre as duas variáveis e um valor r = 0 simboliza não há relação entre as duas variáveis.

    Quanto as suas propriedades matemáticas, dado que r é a raiz de r², é natural que esteja dentro do círculo unitário, ou seja:


    Para melhor exemplificar, segue um grupo de gráficos do livro Econometria Básica do Gujarati:

 

    Como visto, o valor de r representa a correlação entre duas variáveis.

    Segue alguns fatos importantes sobre o valor de r.

    Primeiro, trata-se de um valor dotado de simetria, ou seja, o coeficiente de correlação entre Y e X é igual o coeficiente de correlação entre X e Y, algebricamente:

 

    Segundo, ele só é útil para descrever relações lineares. Conforme fica claro no gráfico visto a pouco, ele é inútil para relações não lineares como Y = X².

    Terceiro, se X e Y são independentes então r = 0, mas a réplica não se confirma pois um valor de r = 0 não significa necessariamente que X e Y são estatisticamente independentes.

    Quarto, o nome amostral não é a toa, o coeficiente r é um estimador de um parâmetro ρ, conhecido como Coeficiente de Correlação Populacional, que tem as mesmas propriedades observadas do r, ou seja -1 < ρ < 1.

 

    Em suma, nesse artigo, aprendemos a relevância do estimador r, como calcular e como interpretar. aprendemos que o -1 < r < 1 onde r aponta a direção (+ ou -) e o grau de correlação (0 a 1) entre duas variáveis, no caso, Y e X.

 

    No próximo artigo, apresentaremos o Modelo de Regressão Linear Clássico Normal e começaremos a entrar no campo da inferência estátistica.

Bibliografia:

GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.

Comentários