O Modelo de Regressão Linear Clássico Normal

 

    Nos últimos artigos definimos o que é o chamado Modelo de Regressão Linear Simples Clássico, apresentando suas principais características, assim como as características dos seus estimadores.

    Aprendemos também a utilizar o método dos Mínimos Quadrados Ordinários (MQO) para estimar os parâmetros da Função de Regressão Populacional.

    O próximo passo é analisar o quanto esses parâmetros estimados se aproximam dos reais valores dos parâmetros, e para isso será utilizado uma extensão do modelo trabalhado até agora, essa extensão é o Modelo de Regressão Linear Clássico Normal.

    O termo normal, como será visto nesse artigo, diz respeito as propriedades distributivas do termo de erro do modelo.

    Esse método também será importante pois a partir dele poderemos entender o método da Máxima Verossimilhança, uma abordagem alternativa ao Método dos Mínimos Quadrados Ordinários.

    Antes de progredir, vamos relembrar alguns aspectos do Modelo de Regressão Linear Clássico que foram desenvolvidos nos últimos artigos:


     Onde os estimadores seguem as determinadas distribuições:

    Caso não lembre de onde vem esses valores, releia o artigo em que deduzimos esses resultados.

     O Modelo de Regressão Linear Clássico Normal é uma extensão desse modelo trabalhado, que irá partir de uma lacuna da análise até então.

     Como visto,  os estimadores de MQO são dito como estimadores lineares, ou seja, eles guardam uma razão linear em relação aos valores de Y.

    Isso fica claro quando analisamos uma das formas funcionais trabalhadas para o beta 2, onde colocamos que seu valor é dado por:


    Naturalmente:


     Repare para um ponto importante, o estimador beta 2 está em função de k, dos betas, das variáveis explicativas e do termo de erro.

    Acontece que, por suposição todas as variáveis, exceto o termo de erro são não aleatórias, o que torna o estimador beta 2 essencialmente dependente do termo de erro, de tal maneira que não podemos compreender e analisar a sua distribuição, sem conhecer as características da distribuição do termo de erro.

    Em poucas palavras, a distribuição dos estimadores de beta dependerá das hipóteses que concebermos sobre a distribuição do termo de erro.

    No modelo que será trabalhado, iremos supor que o termo de erro segue uma distribuição normal com média 0 e variância constante, ou seja:


     Se considerarmos uma terceira hipótese, a da ausência de correlação entre os valores do termo de erro, dada por:


     Passamos a ter:


     Onde o NID significa Normal e Igualmente Distribuído.

     Certo, o termo de termo tem uma distribuição supostamente normal, mas por que trabalhamos com isso?

    O primeiro grande motivo é derivado do importante resultado obtido pelo Teorema Central do Limite. Como vimos, o termo de erro e representa todas as variáveis que foram omitidas do modelo de regressão, tal que fazer suposições sobre sua distribuição é fazer suposições sobre a distribuição dessas variáveis. Segundo o Teorema Central do Limite, quando essas variáveis omitidas tem uma distribuição semelhante e são independentes entre si, então elas tendem a se comportar como uma variável normal em seu nível agregado.

    Ou seja, supondo que o termo de erro tenha uma distribuição normal passamos a supor que todas as variáveis omitidas, em nível agregado, se comportam como uma variável normal.

    Outro ponto importante é que se os estimadores de beta são funções do termo de erro, então o termo de erro precisa ser normalmente distribuído para que esses estimadores também sejam.

    Além disso, isso trará uma facilidade na hora de aplicar os testes estatísticos que serão trabalhados no futuro, principalmente para amostras pequenas (n<100).

 

    Um ponto importante é que estamos trabalhando com uma suposição, partindo de uma imposição, ou seja, não é porque fazemos essa suposição que ela reflete a realidade. Nem sempre o termo de erro terá uma distribuição normal, em alguns casos isso pode não acontecer, casos esses que serão analisados no futuro.

 

    Por ora, basta supor que o termo de erro tem uma distribuição normal.

     No próximo artigo, iremos falar sobre o Método da Máxima Verossimilhança.


Bibliografia:

GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.

 

Comentários