No artigo anterior, vimos como funciona a lógica dos testes de Hipótese, e como foi visto, trata-se de um método para testar hipóteses referentes ao valor de uma variável.
Nesse artigo iremos aprender como aplicar o método de teste de hipótese para fazer estimações sobre o valor dos parâmetros de beta. Iremos aprender a construir a hipótese (seja unicaudal ou bicaudal), testa-la, segundo a abordagem de intervalo de confiança e pela abordagem do teste de significância.
Como visto, geralmente o teste de hipótese segue algo semelhante ao seguinte roteiro:
1. Determinar a hipótese nula e a hipótese alternativa.
2. Fixar um valor de alfa (Erro tipo I).
3. Escolher a estatística de teste.
4. Determinar o intervalo de rejeição com base no valor do erro tipo I e da estatística de teste.
5. Calcular a estatística de teste.
6.
Verificar se a estatística de teste está dentro do intervalo de
rejeição. Caso a estatística de teste esteja dentro do intervalo de
rejeição, rejeite a hipótese nula, caso contrário, não rejeite a
hipótese nula.
Seguiremos algo próximo a esse modelo para testar hipóteses.
Retomando o exemplo dado por:
Suponha que o pesquisador queira testar um grupo de hipóteses: (1) uma hipótese de que o valor do beta 2 seja inferior a 0, o que significaria que a quantidade de pães vendidos é afetada negativamente pelo preço do pão; (2) uma hipótese de que o valor de beta 2 é superior a 0, o que significa que a quantidade de pães vendidos é afetada positivamente pelo preço do pão; (3) uma hipótese de que beta 2 = 0, o que significa que a quantidade de pães vendidos não é afetada pelo preço do pão; (4) uma hipótese de que beta 2 = -350, o que significa que 1 real a mais no preço do pão reduz em 350 a quantidade de pães vendidos.
Suponha que cada uma dessas hipóteses é defendida por um determinado representante no conselho de administração da rede de padarias. Como podemos testa-las para ver qual faz sentido e qual não faz?
Vamos testar uma a uma, primeiro pelo método do intervalo de confiança, segundo pelo método do teste de significância.
Seguindo o roteiro definido, o primeiro passo é escolher a hipótese que será testada. Vamos testar inicialmente a hipótese 1, de que beta 2 < 0.
Essa hipótese essencialmente é dada por:
Pela abordagem do intervalo de confiança, como foi visto, precisamos definir um intervalo de rejeição e um intervalo de aceitação. Mas antes disso, precisamos fixar um nível de erro (alfa). Vamos inicialmente trabalhar com um alfa de 10%. Dado um a = 10% temos que estabelecer um intervalo de confiança. Por ser um teste unicaudal usaremos t(a = 10%, g.l = 10) para estabelecer o nosso intervalo.
Esse intervalo é dado por:
Partindo agora de que t(a = 10%, g.l = 10) = 1,372.
Observe que até o limite superior do intervalo de confiança do intervalo de confiança é inferior a 0, o que implica que não faz sentido rejeitar a hipótese nula de que beta 2 < 0.
Esse teste é unicaudal, e geralmente para esse tipo de teste é mais recomendado a abordagem do teste de significância, ainda que seja possível testar a hipótese pela abordagem de intervalo.
Para a abordagem do teste de significância, precisaremos determinar uma variável de teste, que chamaremos de t, que é dada por:
Precisamos definir um t crítico que nada mais é do que o valor de t(a = 10%, g.l = 10), que no caso é 1,372.
Para o caso em questão, esse teste será o nosso critério. Caso t > 1,372, iremos rejeitar a hipótese, caso contrário, não iremos rejeitar. Sendo assim, a região de rejeição é:
Calculando o valor de t:
Como t < 1,372 então não rejeitaremos a hipótese nula de que beta 2 < 0.
Como interpretar esses resultados? A interpretação correta é de que dado um intervalo de confiança de 90%, não rejeitamos a hipótese de que beta 2 < 0.
Em termos de estatística se utiliza o termo estatisticamente significante quando a hipótese nula de um teste é rejeitada (t está na região crítica, no caso t > 1,372), e não estatisticamente significante quando a hipótese nula não é rejeitada (t não está na região crítica, no caso t < 1,372).
Portanto, podemos dizer que o teste não é estatisticamente significante pois a hipótese nula não foi rejeitada. Cuidado para não dizer que aceitou a hipótese nula, pois esse linguajar implica que de fato beta 2 < 0, quando não se é possível afirmar isso, dado a possibilidade de erros.
A ideia é de que haja 10% de chance de que estamos errando e dizendo que beta 2 < 0 quando na realidade beta 2 > 0, ou seja, dado o nosso teste, tem 10% de chance de estarmos errados quando falamos que o a quantidade de pães vendidos varia negativamente com o preço, quando na realidade a relação seria positiva.
Caso se fixe um valor de alfa = 5%, teríamos t(a = 5%, g.l = 10) = 1,812, o que criaria um novo intervalo de rejeição dado por:
Seguimos não rejeitando a hipótese nula.
Para um valor de alfa = 1% teríamos t(a = 1%, g.l = 10) = 2,764, teríamos a região de rejeição dada por:
Mantemos a não rejeição a H0.
Observe que quanto maior o valor de alfa, mais apertado o intervalo de rejeição. Isso vem do fato de que quanto mais dispostos a errar (a maior), maior a região crítica.
Podemos dizer então que o teste é não significante para o nível de 1%, 5% e 10%
O segundo teste de hipótese que trabalhamos é o teste dado por:
A lógica é essencialmente a mesma, apenas mudando a característica da hipótese nula, que diz agora que beta 2 é não negativo. Vamos analisar usando a abordagem do intervalo de confiança.
Se no caso onde a H0: Beta 2 < 0, trabalhamos com:
No caso de H0: Beta 2 > 0 o intervalo é o mesmo.
Como você observa, até o limite superior do intervalo de confiança é inferior a 0, o que faz com que faça sentido rejeitar a hipótese nula, com 90% de confiança.
O mesmo se aplicaria a 95% e 99%, pois em nenhum dos casos o intervalo de confiança tem valores positivos.
Agora, pela ótica do teste de significância, temos que definir um valor t e comparar com um valor t crítico.
O valor de t é o mesmo:
Dada a simetria da distribuição t, o valor de t crítico é o mesmo dos casos anteriores, apenas mudando-se o sinal, ou seja, para t(a = 10%, g.l = 10) = -1,372, t(a = 5%, g.l = 10) = -1,812 e t(a = 1%, g.l = 10) = -2,764.
O novo critério é dado pela comparação entre t e t critico, caso t < -t critico rejeitamos a hipótese nula, caso contrário, não rejeitamos.
Para a = 10%, temos t crítico = -1,372 e a região de rejeição é dada por:
Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 10%.
Para a = 5% temos t crítico dado por -1,812 e a região de rejeição dada por:
Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 5%.
Para a = 1% temos t crítico dado por -2,764 e a região de rejeição dada por:
Como t = -3,48 está dentro desse intervalo, então rejeitamos H0 para a = 1%.
Podemos dizer então que o teste é não significante para o nível de 1%, 5% e 10%.
Como interpretar esse resultado? Simples, se nós rejeitamos a hipótese da não-negatividade do beta 2, então temos evidências fortes para crer que a relação entre a quantidade de pães vendidos e o preços dos pães é negativa, o que condiz com a lei da demanda.
Vamos agora testar uma terceira hipótese, referente a negatividade de beta 2, que é dada por:
Agora, ao contrário dos testes anteriores, trata-se de um teste bicaudal e isso traz importantes consequências no modo de executar os testes.
Pela abordagem do intervalo de confiança, que como visto, para a = 10% é dado por:
Rejeitamos a hipótese nula dado que o valor 0 está fora do intervalo de confiança, o mesmo vale para a = 5% e a = 1%.
Utilizando o critério do teste de significância, agora que estamos trabalhando com um teste bicaudal, temos que utilizar um conceito diferente de região de aceitação e região crítica.
A partir de agora usaremos o conceito de intervalo de aceitação como o intervalo de referência, e por natureza, a região de rejeição é todo valor fora desse intervalo.
O intervalo de aceitação é função de t mas dessa vez em função do valor a/2, dado o fato que dessa vez a rejeição pode acontecer tanto pelo valor de t ser inferior ao limite inferior quanto superior ao limite superior.
Tal que, dessa maneira que o intervalo passa as ser dado por:
Para exemplificar, vamos construir um intervalo de aceitação para a = 10%. Nesse caso precisaremos utilizar o valor t(a = 5%, g.l = 10) dado que a/2 = 5%.
Esse intervalo é dado por:
E o intervalo de rejeição:
O critério que utilizaremos para rejeitar ou não a hipótese nula é a estatística de teste t estar ou não dentro da região de aceitação. Como visto:
Como se observa, -3,48 não está dentro do intervalo de aceitação, o que aponta que é coerente rejeitar a hipótese nula de que Beta 2 = 0 ao nível de confiança de 90%.
Para a = 5%, temos os seguintes intervalos de aceitação e rejeição:
Como t não está dentro do intervalo de aceitação, mantemos a postura de rejeitar a hipótese nula.
Para a = 1% temos os seguintes intervalos de aceitação e rejeição:
Mantemos a postura de rejeitar a hipótese nula para a = 1%.
Em suma, rejeitamos a hipótese nula para a = 1%, a = 5% e a = 10%.
Como interpretar isso? Chamo atenção para o fato de que esse teste em especial é bem importante. Testar se um determinado beta é igual a 0 é essencialmente testar se ele tem alguma relevância dentro do modelo. Isso vem do fato de que se Beta for igual a zero então a variável explicativa em questão não tem influência real sobre o valor da variável dependente. No caso em questão, esse teste pode nós responder se o preço do pão realmente influencia a quantidade de pães vendidos. Como a hipótese nula foi rejeitada, então dizemos que o preço do pão é significativo para determinar a quantidade de pães vendidos.
O último teste em questão era o teste dado por:
A lógica desse teste é muito parecida com a do teste anterior.
Se seguiremos a abordagem do intervalo de confiança, vemos que para todos os níveis de significância o valor -350 está dentro do intervalo de confiança, o que nos dá um argumento forte de que não devemos rejeitar a hipótese nula.
Utilizando a abordagem do teste de significância, precisamos definir uma nova variável t dada por:
Relembrando, para a = 10% temos:
Como t se encontra dentro do intervalo de aceitação então não rejeitamos a hipótese nula.
Para a = 5%:
Continuamos não rejeitando a hipótese nula.
Para a = 1% temos:
Mantemos a postura de não rejeitar a hipótese nula.
Ou seja, existe fortes evidências de que não devemos rejeitar a hipótese de que R$1,00 a mais de pão reduz em 350 a quantidade de pães consumidos.
Resumindo o que foi visto até agora, temos a seguinte tabela resumo de como fazer um teste de hipótese para o valor de beta:
No caso da hipóteses aqui formuladas:
Importante observar os "***", trata-se de uma linguagem utilizada comumente em trabalhos acadêmicos, significa essencialmente que é significativo ao nível de a = 10%. "**" significa que o teste é significativo ao nível de a = 5% e "*" significa que o teste é significativo a nível de 1%. A ausência implica que o teste é não significativo.
Partindo do estudo que aqui fazemos, o conselho de administração da padaria poderia tomar decisões melhores, tendo em mente que os dados trazem alguns insights relevantes sobre a demanda.
Também é possível testar hipóteses sobre Beta 1, o que só é válido quando o valor da constante tem algum significado especial dentro do modelo trabalhado, o que não aparenta ser o caso.
No próximo artigo, iremos trabalhar com testes de hipóteses referentes a variância.
Gostou do conteúdo? Deixe seu comentário!
Não gostou? Deixe também, queremos melhorar!
GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
Comentários
Postar um comentário