O Intervalo de Confiança para os estimadores de Beta

     No artigo anterior, apresentamos o conceito geral de intervalo de confiança. Demonstramos que se trata de um estimador intervalar dado por:

 

    Nesse artigo vamos aplicar esse método para criar intervalos de confiança para os estimadores de beta dos Mínimos Quadrados Ordinários.

    A grande questão gira em torno do valor de delta, pois o intervalo de confiança é essencialmente dado por:

 

    Para um resultado mais geral, iremos utilizar o índice i que serve tanto para beta 1 quanto para o beta 2.

    O grande objetivo consiste em encontrar um intervalo de confiança que representamos como:

    Para isso, vamos trabalhar com o valor de delta.

    Antes de tudo, vamos trabalhar com a ideia de padronização de variáveis. O conceito de padronização de variáveis é estudado quando se estuda distribuições de probabilidade, tal que é importante que você tenha noção prévia para melhor entendimento.

    Mas em suma, uma padronização de variáveis consiste em substituir as variáveis por uma variável padronizada, geralmente a variável Z. Essa variável é bem mais fácil de se trabalhar e fazer inferência/testes de hipótese.

    A variável padronizada que utilizaremos para os estimadores de beta será dada por:

    Uma característica importante dessa variável diz respeito a facilidade de calcular o valor de sua probabilidade.

    Retomando, uma vez que:

 

    Passamos a ter que:

 

     Passamos a ter um problema: o fato de que a variância do erro é inacessível, somente podendo ser estimada. Para isso iremos utilizar uma outra variável padronizada, a variável t que tem como característica utilizar o estimador da variância ao invés do seu valor real, ou seja:

    Uma diferença importante entre a variável t e a variável z é o fato de que a variável t não segue uma distribuição normal padrão, mas sim uma distribuição t de student, que depende não da média e variância, mas dos graus de liberdade (dado pelo tamanho de amostra subtraído do número de variáveis, para um caso com só duas variáveis temos N - 2) e do nível de significância (alfa).

    A partir desses dois valores podemos obter os valores de t através da sua tabela de distribuição (ou software).

    Essa nova estrutura nos traz uma nova função de intervalo de confiança dada por:

    Onde t é nossa estatística de teste e os t(a/2) e -t(a/2) são os limites superiores e inferiores. 

    Podemos reescrever como:

    Reescrevendo a desigualdade:

    Essa relação é importante, pois como você pode observar, os valores extremos nada mais são do que o beta estimado de MQO subtraído (limite inferior) e somado (limite superior) a um termo de erro dado pela multiplicação da variância do estimador multiplicado por uma estatística t que varia conforme o nível de significância fixado pelo pesquisador.

    Podemos reescrever de maneira simplificada:

 

    Ou:

    Observe duas coisas importantes:

    Primeiro, a amplitude do intervalo depende do nível de significância alfa, quanto maior ele for, maior será o intervalo, e vice-versa. 

    Segundo, a amplitude do intervalo depende da variância do estimador, que por natureza representa a precisão do estimador, quanto mais preciso for o estimador (menor variância) menor será o intervalo e vice-versa.

 

    Para demonstrar como funciona na prática, vamos trabalhar com o exemplo tratado nas últimas publicações, dado por:

    Como visto, esse conjunto de dados retorna o seguinte modelo:

    Entre parênteses se encontra o desvio padrão dos estimadores de beta do modelo.

    Como visto, o intervalo de confiança depende do valor fixado de t de student. Para demonstrar, vamos criar intervalos para níveis de significância igual a 1%, 5% e 10%.

    O intervalo de ambos é dado por:

    Para a = 1%, como dividimos por 2 temos a = 0,5%.

    Pela tabela de t de student temos que:

    Passamos a ter então os seguinte intervalos:

    Agora com a = 5%, dividindo por 2 temos a = 2,5%:

    Pela tabela de t de student temos que:

     Passamos a ter os seguinte intervalos:

    Observe que o intervalo é bem mais restrito, pois não somente os intervalos superiores são menores, como o intervalos inferiores são maiores.

    Testando para a = 10%, dividindo por 2 temos a = 5%.

    Pela tabela de t de student temos que:

    Passamos a ter os seguintes intervalos:

    Observe que o intervalo se torna ainda mais apertado.

    Conforme aumenta o nível de significância, o intervalo se torna mais apertado. Por que isso ocorre? Pelo fato de que a confiança do intervalo é dada por 1 - nível de significância, de tal maneira que conforme o nível de significância aumenta, maior a chance de errar, de tal maneira que o intervalo vai ficando menor. A lógica é que quando um intervalo é menor maior a chance do real valor de beta estar fora desse intervalo.

    Ilustrando ad infinitum com o valor de t temos a representação geométrica dada por:


    Como você observa, conforme t aumenta, o intervalo se torna mais amplo, tendo mais chance de conter o valor real de beta.

    Importante relembrar que como estamos trabalhando com valores não aleatórios então não podemos interpretar que há 1 - nível de significância chances de beta estar entre os dois valores.

    A interpretação correta é que em 100 casos teremos que 1 - nível de significância terão o verdadeiro valore de beta.

    Para ilustrar e resumir tudo, segue a seguinte tabela resumo: 

    Fica clara a lógica da da relação entre nível de significância e intervalo de confiança.


    Nesse artigo, vimos como criar a interpretar intervalos de confiança para os estimadores de beta do modelo de regressão linear clássico com duas variáveis. No próximo artigo, iremos estudar como construir intervalos de confiança para a variância do modelo.


    Gostou do conteúdo? Deixe seu comentário!

    Não gostou? Deixe também, queremos melhorar!

Bibliografia:

GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
BUSSAB,  Wilton; MORETTIN, Pedro.  Estátistica básica. 5ª Edição. São Paulo. Editora Sariva, 2004.

Comentários