No artigo anterior, apresentamos o conceito geral de intervalo de confiança. Demonstramos que se trata de um estimador intervalar dado por:
Nesse artigo vamos aplicar esse método para criar intervalos de confiança para os estimadores de beta dos Mínimos Quadrados Ordinários.
A grande questão gira em torno do valor de delta, pois o intervalo de confiança é essencialmente dado por:
Para um resultado mais geral, iremos utilizar o índice i que serve tanto para beta 1 quanto para o beta 2.
O grande objetivo consiste em encontrar um intervalo de confiança que representamos como:
Para isso, vamos trabalhar com o valor de delta.
Antes de tudo, vamos trabalhar com a ideia de padronização de variáveis. O conceito de padronização de variáveis é estudado quando se estuda distribuições de probabilidade, tal que é importante que você tenha noção prévia para melhor entendimento.
Mas em suma, uma padronização de variáveis consiste em substituir as variáveis por uma variável padronizada, geralmente a variável Z. Essa variável é bem mais fácil de se trabalhar e fazer inferência/testes de hipótese.
A variável padronizada que utilizaremos para os estimadores de beta será dada por:
Uma característica importante dessa variável diz respeito a facilidade de calcular o valor de sua probabilidade.
Retomando, uma vez que:
Passamos a ter que:
Passamos a ter um problema: o fato de que a variância do erro é inacessível, somente podendo ser estimada. Para isso iremos utilizar uma outra variável padronizada, a variável t que tem como característica utilizar o estimador da variância ao invés do seu valor real, ou seja:
Uma diferença importante entre a variável t e a variável z é o fato de que a variável t não segue uma distribuição normal padrão, mas sim uma distribuição t de student, que depende não da média e variância, mas dos graus de liberdade (dado pelo tamanho de amostra subtraído do número de variáveis, para um caso com só duas variáveis temos N - 2) e do nível de significância (alfa).
A partir desses dois valores podemos obter os valores de t através da sua tabela de distribuição (ou software).
Essa nova estrutura nos traz uma nova função de intervalo de confiança dada por:
Onde t é nossa estatística de teste e os t(a/2) e -t(a/2) são os limites superiores e inferiores.
Podemos reescrever como:
Reescrevendo a desigualdade:
Essa relação é importante, pois como você pode observar, os valores extremos nada mais são do que o beta estimado de MQO subtraído (limite inferior) e somado (limite superior) a um termo de erro dado pela multiplicação da variância do estimador multiplicado por uma estatística t que varia conforme o nível de significância fixado pelo pesquisador.
Podemos reescrever de maneira simplificada:
Ou:
Observe duas coisas importantes:
Primeiro, a amplitude do intervalo depende do nível de significância alfa, quanto maior ele for, maior será o intervalo, e vice-versa.
Segundo, a amplitude do intervalo depende da variância do estimador, que por natureza representa a precisão do estimador, quanto mais preciso for o estimador (menor variância) menor será o intervalo e vice-versa.
Para demonstrar como funciona na prática, vamos trabalhar com o exemplo tratado nas últimas publicações, dado por:
Como visto, esse conjunto de dados retorna o seguinte modelo:
Entre parênteses se encontra o desvio padrão dos estimadores de beta do modelo.
Como visto, o intervalo de confiança depende do valor fixado de t de student. Para demonstrar, vamos criar intervalos para níveis de significância igual a 1%, 5% e 10%.
O intervalo de ambos é dado por:
Para a = 1%, como dividimos por 2 temos a = 0,5%.
Pela tabela de t de student temos que:
Passamos a ter então os seguinte intervalos:
Agora com a = 5%, dividindo por 2 temos a = 2,5%:
Pela tabela de t de student temos que:
Passamos a ter os seguinte intervalos:
Observe que o intervalo é bem mais restrito, pois não somente os intervalos superiores são menores, como o intervalos inferiores são maiores.
Testando para a = 10%, dividindo por 2 temos a = 5%.
Pela tabela de t de student temos que:
Passamos a ter os seguintes intervalos:
Observe que o intervalo se torna ainda mais apertado.
Conforme aumenta o nível de significância, o intervalo se torna mais apertado. Por que isso ocorre? Pelo fato de que a confiança do intervalo é dada por 1 - nível de significância, de tal maneira que conforme o nível de significância aumenta, maior a chance de errar, de tal maneira que o intervalo vai ficando menor. A lógica é que quando um intervalo é menor maior a chance do real valor de beta estar fora desse intervalo.
Ilustrando ad infinitum com o valor de t temos a representação geométrica dada por:
Como você observa, conforme t aumenta, o intervalo se torna mais amplo, tendo mais chance de conter o valor real de beta.
Importante relembrar que como estamos trabalhando com valores não aleatórios então não podemos interpretar que há 1 - nível de significância chances de beta estar entre os dois valores.
A interpretação correta é que em 100 casos teremos que 1 - nível de significância terão o verdadeiro valore de beta.
Para ilustrar e resumir tudo, segue a seguinte tabela resumo:
Fica clara a lógica da da relação entre nível de significância e intervalo de confiança.
Nesse artigo, vimos como criar a interpretar intervalos de confiança para os estimadores de beta do modelo de regressão linear clássico com duas variáveis. No próximo artigo, iremos estudar como construir intervalos de confiança para a variância do modelo.
Gostou do conteúdo? Deixe seu comentário!
Não gostou? Deixe também, queremos melhorar!
GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
Comentários
Postar um comentário