Testes de Hipótese sobre os coeficientes de beta

     No artigo anterior, vimos como funciona a lógica dos testes de Hipótese, e como foi visto, trata-se de um método para testar hipóteses referentes ao valor de uma variável.

    Nesse artigo iremos aprender como aplicar o método de teste de hipótese para fazer estimações sobre o valor dos parâmetros de beta. Iremos aprender a construir a hipótese (seja unicaudal ou bicaudal), testa-la, segundo a abordagem de intervalo de confiança e pela abordagem do teste de significância.

    Como visto, geralmente o teste de hipótese segue algo semelhante ao seguinte roteiro:

 1. Determinar a hipótese nula e a hipótese alternativa.
 2. Fixar um valor de alfa (Erro tipo I).
 
3. Escolher a estatística de teste.
 
4. Determinar o intervalo de rejeição com base no valor do erro tipo I e da estatística de teste.
 5. Calcular a estatística de teste.
 6. Verificar se a estatística de teste está dentro do intervalo de rejeição. Caso a estatística de teste esteja dentro do intervalo de rejeição, rejeite a hipótese nula, caso contrário, não rejeite a hipótese nula.

    Seguiremos algo próximo a esse modelo para testar hipóteses. 

    Retomando o exemplo dado por:

 

     Suponha que o pesquisador queira testar um grupo de hipóteses: (1) uma hipótese de que o valor do beta 2 seja inferior a 0, o que significaria que a quantidade de pães vendidos é afetada negativamente pelo preço do pão; (2) uma hipótese de que o valor de beta 2 é superior a 0, o que significa que a quantidade de pães vendidos é afetada positivamente pelo preço do pão; (3) uma hipótese de que beta 2 = 0, o que significa que a quantidade de pães vendidos não é afetada pelo preço do pão; (4) uma hipótese de que beta 2 = -350, o que significa que 1 real a mais no preço do pão reduz em 350 a quantidade de pães vendidos.

    Suponha que cada uma dessas hipóteses é defendida por um determinado representante no conselho de administração da rede de padarias. Como podemos testa-las para ver qual faz sentido e qual não faz?

    Vamos testar uma a uma, primeiro pelo método do intervalo de confiança, segundo pelo método do teste de significância.

    Seguindo o roteiro definido, o primeiro passo é escolher a hipótese que será testada. Vamos testar inicialmente a hipótese 1, de que beta 2 < 0.

    Essa hipótese essencialmente é dada por:


     Pela abordagem do intervalo de confiança, como foi visto, precisamos definir um intervalo de rejeição e um intervalo de aceitação. Mas antes disso, precisamos fixar um nível de erro (alfa). Vamos inicialmente trabalhar com um alfa de 10%. Dado um a = 10% temos que estabelecer um intervalo de confiança. Por ser um teste unicaudal usaremos t(a = 10%, g.l = 10) para estabelecer o nosso intervalo.

     Esse intervalo é dado por:

     Partindo agora de que t(a = 10%, g.l = 10) = 1,372.

    Observe que até o limite superior do intervalo de confiança do intervalo de confiança é inferior a 0, o que implica que não faz sentido rejeitar a hipótese nula de que beta 2 < 0. 

    Esse teste é unicaudal, e geralmente para esse tipo de teste é mais recomendado a abordagem do teste de significância, ainda que seja possível testar a hipótese pela abordagem de intervalo.

    Para a abordagem do teste de significância, precisaremos determinar uma variável de teste, que chamaremos de t, que é dada por:

 

    Precisamos definir um t crítico que nada mais é do que o valor de t(a = 10%, g.l = 10), que no caso é 1,372.

     Para o caso em questão, esse teste será o nosso critério. Caso t > 1,372, iremos rejeitar a hipótese, caso contrário, não iremos rejeitar. Sendo assim, a região de rejeição é:

    Calculando o valor de t:

 

    Como t < 1,372 então não rejeitaremos a hipótese nula de que beta 2 < 0

    Como interpretar esses resultados? A interpretação correta é de que dado um intervalo de confiança de 90%, não rejeitamos a hipótese de que beta 2 < 0

    Em termos de estatística se utiliza o termo estatisticamente significante quando a hipótese nula de um teste é rejeitada (t está na região crítica, no caso t > 1,372), e não estatisticamente significante quando a hipótese nula não é rejeitada (t não está na região crítica, no caso t < 1,372).

    Portanto, podemos dizer que o teste não é estatisticamente significante pois a hipótese nula não foi rejeitada. Cuidado para não dizer que aceitou a hipótese nula, pois esse linguajar implica que de fato beta 2 < 0, quando não se é possível afirmar isso, dado a possibilidade de erros.

    A ideia é de que haja 10% de chance de que estamos errando e dizendo que beta 2 < 0 quando na realidade beta 2 > 0, ou seja, dado o nosso teste, tem 10% de chance de estarmos errados quando falamos que o a quantidade de pães vendidos varia negativamente com o preço, quando na realidade a relação seria positiva.

    Caso se fixe um valor de alfa = 5%, teríamos t(a = 5%, g.l = 10) = 1,812, o que criaria um novo intervalo de rejeição dado por:

    Seguimos não rejeitando a hipótese nula.

    Para um valor de alfa = 1% teríamos t(a = 1%, g.l = 10) = 2,764, teríamos a região de rejeição dada por:

 

    Mantemos a não rejeição a H0.

    Observe que quanto maior o valor de alfa, mais apertado o intervalo de rejeição. Isso vem do fato de que quanto mais dispostos a errar (a maior), maior a região crítica.

    Podemos dizer então que o teste é não significante para o nível de 1%, 5% e 10%

    O segundo teste de hipótese que trabalhamos é o teste dado por:

    A lógica é essencialmente a mesma, apenas mudando a característica da hipótese nula, que diz agora que beta 2 é não negativo. Vamos analisar usando a abordagem do intervalo de confiança.

    Se no caso onde a H0: Beta 2 < 0, trabalhamos com:

    No caso de H0: Beta 2 > 0 o intervalo é o mesmo.

    Como você observa, até o limite superior do intervalo de confiança é inferior a 0, o que faz com que faça sentido rejeitar a hipótese nula, com 90% de confiança.

    O mesmo se aplicaria a 95% e 99%, pois em nenhum dos casos o intervalo de confiança tem valores positivos.

    Agora, pela ótica do teste de significância, temos que definir um valor t e comparar com um valor t crítico.

    O valor de t é o mesmo:

 

     Dada a simetria da distribuição t, o valor de t crítico é o mesmo dos casos anteriores, apenas mudando-se o sinal, ou seja, para t(a = 10%, g.l = 10) = -1,372, t(a = 5%, g.l = 10) = -1,812 e t(a = 1%, g.l = 10) = -2,764.

    O novo critério é dado pela comparação entre t e t critico, caso t < -t critico rejeitamos a hipótese nula, caso contrário, não rejeitamos.

    Para a = 10%, temos t crítico = -1,372 e a região de rejeição é dada por:

    Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 10%.

    Para a = 5% temos t crítico dado por -1,812 e a região de rejeição dada por: 


    Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 5%.

    Para a = 1% temos t crítico dado por -2,764 e a região de rejeição dada por:

    Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 1%.

    Podemos dizer então que o teste é não significante para o nível de 1%, 5% e 10%.

    Como interpretar esse resultado? Simples, se nós rejeitamos a hipótese da não-negatividade do beta 2, então temos evidências fortes para crer que a relação entre a quantidade de pães vendidos e o preços dos pães é negativa, o que condiz com a lei da demanda.

    Vamos agora testar uma terceira hipótese, referente a negatividade de beta 2, que é dada por:

 

     Agora, ao contrário dos testes anteriores, trata-se de um teste bicaudal e isso traz importantes consequências no modo de executar os testes.

     Pela abordagem do intervalo de confiança, que como visto, para a = 10% é dado por:

 

     Rejeitamos a hipótese nula dado que o valor 0 está fora do intervalo de confiança, o mesmo vale para a = 5% e a = 1%.

    Utilizando o critério do teste de significância, agora que estamos trabalhando com um teste bicaudal, temos que utilizar um conceito diferente de região de aceitação e região crítica.

    A partir de agora usaremos o conceito de intervalo de aceitação como o intervalo de referência, e por natureza, a região de rejeição é todo valor fora desse intervalo.

    O intervalo de aceitação é função de t mas dessa vez em função do valor a/2, dado o fato que dessa vez a rejeição pode acontecer tanto pelo valor de t ser inferior ao limite inferior quanto superior ao limite superior.

    Tal que, dessa maneira que o intervalo passa as ser dado por: 

 

     Para exemplificar, vamos construir um intervalo de aceitação para a = 10%. Nesse caso precisaremos utilizar o valor t(a = 5%, g.l = 10) dado que a/2 = 5%.

    Esse intervalo é dado por:


     E o intervalo de rejeição:

 

     O critério que utilizaremos para rejeitar ou não a hipótese nula é a estatística de teste t estar ou não dentro da região de aceitação. Como visto:

 

     Como se observa, -3,48 não está dentro do intervalo de aceitação, o que aponta que é coerente rejeitar a hipótese nula de que Beta 2 = 0 ao nível de confiança de 90%.

    Para a = 5%, temos os seguintes intervalos de aceitação e rejeição:

    Como t não está dentro do intervalo de aceitação, mantemos a postura de rejeitar a hipótese nula.

    Para a = 1% temos os seguintes intervalos de aceitação e rejeição:


    Mantemos a postura de rejeitar a hipótese nula para a = 1%.

    Em suma, rejeitamos a hipótese nula para a = 1%, a = 5% e a = 10%.

    Como interpretar isso? Chamo atenção para o fato de que esse teste em especial é bem importante. Testar se um determinado beta é igual a 0 é essencialmente testar se ele tem alguma relevância dentro do modelo. Isso vem do fato de que se Beta for igual a zero então a variável explicativa em questão não tem influência real sobre o valor da variável dependente. No caso em questão, esse teste pode nós responder se o preço do pão realmente influencia a quantidade de pães vendidos. Como a hipótese nula foi rejeitada, então dizemos que o preço do pão é significativo para determinar a quantidade de pães vendidos.

    O último teste em questão era o teste dado por:


    A lógica desse teste é muito parecida com a do teste anterior.

    Se seguiremos a abordagem do intervalo de confiança, vemos que para todos os níveis de significância o valor -350 está dentro do intervalo de confiança, o que nos dá um argumento forte de que não devemos rejeitar a hipótese nula.

    Utilizando a abordagem do teste de significância, precisamos definir uma nova variável t dada por:

 

     Relembrando, para a = 10% temos:

 

 

    Como t se encontra dentro do intervalo de aceitação então não rejeitamos a hipótese nula.

    Para a = 5%:

 

    Continuamos não rejeitando a hipótese nula.

    Para a = 1% temos:

 

    Mantemos a postura de não rejeitar a hipótese nula.

    Ou seja, existe fortes evidências de que não devemos rejeitar a hipótese de que R$1,00 a mais de pão reduz em 350 a quantidade de pães consumidos.

    Resumindo o que foi visto até agora, temos a seguinte tabela resumo de como fazer um teste de hipótese para o valor de beta:


     No caso da hipóteses aqui formuladas:

 

     Importante observar os "***", trata-se de uma linguagem utilizada comumente em trabalhos acadêmicos, significa essencialmente que é significativo ao nível de a = 10%. "**" significa que o teste é significativo ao nível de a = 5% e "*" significa que o teste é significativo a nível de 1%. A ausência implica que o teste é não significativo.

    Partindo do estudo que aqui fazemos, o conselho de administração da padaria poderia  tomar decisões melhores, tendo em mente que os dados trazem alguns insights relevantes sobre a demanda.

    Também é possível testar hipóteses sobre Beta 1, o que só é válido quando o valor da constante tem algum significado especial dentro do modelo trabalhado, o que não aparenta ser o caso.

    No próximo artigo, iremos trabalhar com testes de hipóteses referentes a variância.

    Gostou do conteúdo? Deixe seu comentário!

    Não gostou? Deixe também, queremos melhorar!

Bibliografia:

GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
BUSSAB,  Wilton; MORETTIN, Pedro.  Estátistica básica. 5ª Edição. São Paulo. Editora Saraiva, 2004.

 

Comentários