(Resolução) Capitulo 2 do livro Econometria Básica do Gujarati

  

Dando continuidade a resolução das questões do livro texto de Econometria Básica do autor Damodar Gujarati, nesse artigo reponderemos as questões do capitulo 2.

Observação 1: Todas as tabelas utilizadas na resolução podem ser baixadas clicando aqui ou no nome das tabelas.

Observação 2: As questões serão resolvidas com enfoque no aparato teórico, sem desenvolver as ferramentas que serão utilizadas pelo editor (Python, R e Excel). Isso surge para que sirva para que a resolução sirva para estudantes de todas as ferramentas estatísticas. Futuramente poderemos trazer respostas voltadas para determinados pacotes.

2.1. O que é função de esperança condicional ou função de regressão populacional?

    Trata-se de uma função que representa o quanto a média de uma variável Y evolui sujeito as variações de uma variável X, sendo dada pela esperança condicional de Y dado X, ou seja:
    Graficamente ela é o local geométrico das médias condicionadas de Y, pois ela intercepta todas as médias de Y condicionadas a X.
    
    Para melhor entender a ideia de Função de Esperança Condicional veja nosso artigo sobre a formalização do modelo de regressão simples.

2.2. Qual a diferença entre as funções de regressão populacional e amostral? Essa distinção é
indiferente?

    A grande diferença gira em torno da ideia de inferência, pois a Função de Regressão Populacional fornece uma função que devolve a esperança condicional da população como um todo, enquanto a Função de Regressão amostral é apenas um estimador para a Função de Regressão Populacional, sendo utilizada quando não se tem acesso a todas as observações da população. Essa distinção não é indiferente, pois as duas estão sujeitas a diferenças significativas por questões amostrais, dado que cada amostra trará uma Função de Regressão Amostral diferente, não atoa o grande objetivo da análise de regressão é buscar descobrir uma Função de Regressão Amostral que se aproxime o máximo possível da Função de Regressão Populacional.

    Para melhor entender a diferença entre a Função de Regressão Amostral e a Função de Regressão Populacional veja nosso artigo sobre a formalização do modelo de regressão simples.

2.3. Qual o papel do termo de erro estocástico, ui, na análise de regressão? Qual a diferença entre
o termo de erro estocástico e o resíduo, ûi?

    O termo de erro estocástico representa o erro da análise de regressão, ou seja, a diferença entre o valor previsto pela FRP e o valor observado, tal que:
    O seu papel, na prática, é representar todos os fatores que afetam o variável dependente (Y) que não foram levadas em conta na regressão, seja por impossibilidade prática, inacessibilidade, ou simplesmente pela escolha do pesquisador. Também pode ser encarado como um elemento de "aleatoriedade" no modelo, visando representar as pertubações não previsíveis na realidade, como o comportamento humano ou os choques aleatórios de mercado.
    A diferença entre o termo estocástico e o resíduo ûi é que o resíduo é a diferença entre o valor previsto pela FRA e o valor observado de facto, tal que:

    Os motivos que justificam a existência do termo de resíduo são os mesmos que justificam a existência do erro estocástico, ou seja, levar em conta todos os fatores que afetam o modelo mas que não estão incluídos, assim como os choques aleatórios e imprevisíveis.
    O grande ponto é que o termo de resíduo ûé apenas uma estimativa do valor real, ui.

2.4. Por que precisamos da análise de regressão? Por que não usar simplesmente o valor médio do
regressando como o melhor valor?

    A análise de regressão se faz útil pois não gera apenas estatísticas pontuais, como a média, mas estabelece uma razão funcional que permite estudar a dinâmica dessa relação. Ao se utilizar como parâmetro de análise somente o valor médio do regressando, saberíamos apenas o valor médio da despesas de consumo, mas não saberíamos a lógica dessa relação, se a relação entre renda e consumo é positiva ou negativa, também não saberíamos a intensidade dessa relação e nem seriamos capaz de tentar 'prever' qual a despesa de cada setor da sociedade. Além disso a média é uma medida frágil, pois além de não dizer nada sobre a dispersão dos dados, é bastante propensa a ser afetada por outliers.

2.5. O que entendemos por modelo de regressão linear?

    O termo linear tem dois significados, linearidade nas variáveis e linearidade nos parâmetros. A linearidade nas variáveis ocorre quando Y é uma função linear de X, onde a variável independente X tem expoente igual a 1 e não está multiplicado ou dividido por valor nenhum, como por exemplo:
    Uma definição mais formal da linearidade das variáveis é afirmar que a derivada de Y com relação a X independe de Y, como no caso em questão, onde tem-se que:
    Já linearidade nos parâmetros parte do mesmo pressuposto, onde os parâmetros do modelo tem que ter expoente iguala 1 não podem estar multiplicados ou divididos por qualquer valor, como por exemplo:
    A lógica é a mesma, se uma função é linear nos parâmetros, então a derivada de Y em função do parâmetro é independente do parâmetro, no caso em questão, temos:
    Para fins de econometria, define-se como um modelo de regressão linear, um modelo onde a forma funcional apresenta linearidade nos parâmetros, independendo se o modelo apresenta linearidade nas variáveis.

2.6. Determine se os modelos a seguir são lineares nos parâmetros ou nas variáveis ou em ambos.
Quais destes modelos são modelos de regressão linear?


    O modelo é linear nos parâmetros, uma vez que todos os parâmetros tem expoente 1 e não estão multiplicados ou divididos por qualquer outro valor.
    O modelo não é linear nas variáveis, visto que:
    Como a derivada de Y com relação a X depende de Y então, ela não é linear nas variáveis.
    O modelo é uma regressão linear sim, uma vez que atende o requisito de linearidade nos parâmetros.
 

    O modelo é linear nos parâmetros, uma vez que todos os parâmetros tem expoente 1 e não estão multiplicados ou divididos por qualquer outro valor.
    O modelo não é linear nas variáveis, dado que:
    Mesmo assim, o modelo é linear, pois é dotado de linearidade nos parâmetros.
    

    O modelo é linear nos parâmetros, visto que todos os parâmetros tem expoente 1 não estão multiplicados ou divididos entre si. O modelo é linear na variável dado que:
    Como o modelo é linear nas variáveis e nos parâmetros, então ele é linear.

    O modelo não é linear nos parâmetros, visto que a relação entre Y e o parâmetro beta 1 não é linear. O modelo não é linear nas variáveis, dado que a relação entre X e Y é logaritmizada, ou seja, não linear.
    Portanto, esse modelo não é linear, a não ser que haja transformações, como no caso onde:
    Nesse caso, temos:
    Nesse caso a relação entre Y e os parâmetros é linear, gerando um modelo linear.

    A relação entre a variável Y e os parâmetros é linear, já a relação entre a variável Y e a variável X não é linear. O modelo é linear dado a existência de linearidade nos parâmetros.

2.7. Os modelos a seguir são modelos de regressão linear? Justifique sua resposta.


    Aplicando uma transformação no modelo, aplicando logaritmo natural de ambos os lados, chegamos a:
    Nesse caso há linearidade nos parâmetros e nas variáveis, tornando o modelo, um modelo de regressão linear.
    Esse modelo em si não é linear, mas é possível transformar esse modelo em um modelo linear através de uma transformação conhecida como transformação LOGIT que consiste essencialmente em:
    O modelo obtido ao final é um modelo de regressão linear.

    É um modelo de regressão linear, dado que beta 1 e beta 2 tem índice 1 e não estão multiplicado nem divididos entre si!



    Claramente não se trata de um modelo de regressão linear.


    Também não é um modelo de regressão linear, dado que beta 2 tem o expoente 3.

2.8. O que entendemos por modelo de regressão intrinsecamente linear? Se Beta 2 no Exercício 2.7d fosse 0,8, seria um modelo de regressão linear ou não-linear?

    A ideia de um modelo de regressão intrinsecamente linear diz respeito a um modelo que ainda que não seja essencialmente linear, pode se tornar linear nos parâmetros, a partir de uma transformação. Um exemplo disso é a transformação LOGIT, que transforma um modelo não-linear em um modelo linear.
    Para analisar se o modelo se tornaria linear com beta 2 = 0.8, vamos substituir os valores na equação:

    Observe que ao final, obtemos um modelo linear.

2.9. Considere os modelos não-estocásticos a seguir (isto é, modelos sem termo de erro estocástico). São modelos de regressão linear? Se não forem, é possível, por meio de manipulações algébricas adequadas, convertê-los em modelos lineares?

    O modelo não é linear em si, mas pode tornar-se através da seguinte transformação:


        O modelo não é linear em si, mas pode se tornar linear com a seguinte transformação:

    Trata-se de uma simples aplicação da transformação LOGIT:

2.10. Dados o gráfico de dispersão da Figura 2.8 e linha de regressão correspondente, que conclusão geral você tiraria do diagrama? A linha de regressão da figura é populacional ou amostral?

    A figura 2.8 é a seguinte:

    Esse modelo de regressão traz uma análise sobre relação entre a variação no salário das indústrias em função da variação da proporção exportação/PIB. Os resultados apontam uma evidência interessante: os países com uma maior crescimento na  proporção exportação/PIB (tradicional de economias voltadas para a exportação ou em processo de desenvolvimento do setor exportados) tem um crescimento acentuado nos salários dos industriais. A linha de regressão é amostral, dado que o estudo foi feito em cima de uma amostra de 50 países em desenvolvimento, não levando em conta todos os países do mundo.

2.11. Com base no diagrama de dispersão da Figura 2.9, que conclusões gerais poderiam ser tiradas? Qual a teoria econômica que embasa o gráfico? (Dica: pesquise em um livro de economia internacional o modelo de comércio de Heckscher-Ohlin).

    A figura 2.9 é a seguinte:


    Esse modelo supõe que a escassez da terra (que o modelo associa a qualificação dos trabalhadores) é um determinante relevante das características dos produtos que um determinado país exporta. Os dados apontam essa relação é positiva, afirmando que quanto maior a escassez de terra (o que implica uma alta qualificação dos trabalhadores) implica em uma gama de exportação mais voltada para bens de alto valor agregado, e pelo outro lado, uma economia com certa abundância de terra apresenta forte probabilidade de ser uma economia voltada para a exportação de commodities de baixo valor agregado, principalmente produtos agrícolas.
    A teoria que endossa esses resultados é o modelo de troca Heckscher-Ohlin, uma teoria do comércio internacional que afirma que os países exportam bens com base na intensidade de seus fatores de produção, tal que um país irá ofertar os bens cujo fator de produção relevante é intensivo . Na regressão analisada, essa relação é expressa em termos de abundância de terra e o grau de complexidade dos produtos, tal que um país que é abundante em terra exporta os bens que são intensivos no fator terra, ou seja, os bens agrícolas, como carne, tomate, trigo, feijão e etc. Por outro lado, partindo do fato de que países com escassez no fator terra tendem a ter abundância no fator capital (e capital humano). É visível que os países com escassez de terra em média produzem bens industriais de maior valor agregado, como celulares, carros, máquinas e etc.

2.12. O que o gráfico de dispersão da Figura 2.10 revela? Você afirmaria que a legislação relativa ao salário mínimo contribui para o bem-estar econômico?

    A figura 2.10 é a seguinte:
    
    O gráfico traz uma relação estatística entre o salário mínimo anual e o PNB per capita. Observa-se uma relação negativa entre salário mínimo e o Produto Nacional Bruto per capita, o que indica que maiores salários mínimos podem causar uma perca de produção, portanto de riqueza.


2.13 A linha de regressão apresentada na Figura 1.3 da Introdução é uma FRP ou uma FRA? Por quê? Como você interpretaria os pontos situados em torno da linha de regressão? Além do PIB, que outros fatores, ou variáveis, poderiam determinar as despesas pessoais de consumo?

    A figura 1.3. é a seguinte:


    Trata-se de uma FRA dado que estamos trabalhando somente com a amostra de 45 anos. Os pontos em torno da linha de regressão são os valores observados na amostra. 
    Outros fatores que podem afetar o consumo: taxa de juros, riqueza (não renda) e inflação.

2.14 Com os dados da Tabela 2.7 relativos aos Estados Unidos nos período 1980-2006:

a. Represente graficamente a relação entre a taxa de participação dos homens na força de trabalho civil e a taxa de desemprego civil dos homens. Trace, a olho, uma linha de regressão que passe pelos pontos. A priori, qual a relação esperada entre as duas variáveis e em que teoria econômica está embasada? O diagrama de dispersão respalda essa teoria?

    Antes de partir para a análise gráfica, vamos criar hipóteses a priori. A principal hipótese é a ideia de que a participação da força de trabalho civil dos homens deve ser positivamente relacionado  com a taxa de desemprego, isso surge baseado na hipótese do trabalhador adicional, um instrumento da Economia do Trabalho que afirma que quando o desemprego afeta um chefe da família, há uma tendência de que os seus filhos e dependentes entrem no mercado de trabalho, o que constitui uma "compensação" em termos de oferta de mão de obra. Isso surge pela necessidade de manter um certo nível de renda familiar. 
    Plotando a taxa de participação dos homens na força de trabalho civil em função da taxa de desemprego civil dos homens:
    

    Os dados observados demonstram em certo aspecto, que a teoria do trabalhador adicional é uma hipótese válida sobre o mercado de trabalho.

b. Faça o mesmo para as mulheres.

    Se a hipótese do trabalhador adicional formula que o aumento do desemprego tende a elevar a participação dos homens no mercado, há uma contraparte no que tange ao gênero feminino, a hipótese do desencorajamento do trabalho, uma formulação que afirma que a elevação do desemprego entre as mulheres tende a reduzir a participação das mulheres na oferta de trabalho civil. Essa hipótese se torna óbvia ao se observar o gráfico dispersão das duas variáveis:
    Há uma clara relação negativa entre a taxa de desemprego entre as mulheres e a sua taxa de participação no mercado.


c. Agora, represente graficamente a taxa de participação de homens e mulheres em relação aos ganhos médios por hora (em dólares de 1982). (Você pode usar gráficos separados.) O que constatou? Como você justificaria isso?

    Representado graficamente:
    
    A conclusão é que a participação dos homens no mercado varia negativamente com o salário/hora, o que significa que os homens reagem negativamente a salários maiores. já com as mulheres não há forte evidência de que os salários afetem a taxa de participação no mercado.


d. É possível representar graficamente a taxa de participação na força de trabalho em relação à taxa de desemprego e aos ganhos médios por horas simultaneamente? Em caso negativo, como você expressaria a relação entre as três variáveis?

    Poder, pode, o ponto é se devemos representar essa relação através de um gráfico 3D. Existem maneiras mais práticas de representar a relação de uma variável dependente com mais de uma variável explicativa, como uma tabela com os parâmetros.

2.15. A Tabela 2.8 apresenta dados sobre despesas com alimentação e totais, em rupias, para uma amostra de 55 domicílios rurais da Índia. (No início de 2000, um dólar americano era equivalente a cerca de 40 rupias indianas.)

a. Represente graficamente os dados colocando no eixo vertical as despesas com alimentação e no eixo horizontal os gastos totais. Trace uma linha de regressão.

    Visualmente, temos:
  

b. Que conclusões gerais você pode tirar deste exemplo?

    Trata-se de uma situação onde há uma relação positiva entre as despesas em sua totalidade e os gastos com alimentação. Em média, um indiano gasta cerca de 60% da sua renda com alimentação, ainda assim, há um grande desvio entre as residências. Se analisar pela ótica da economia, é possível utilizar um ferramental chamado função de consumo adaptando para se tornar uma função de consumo alimentar que diz que as despesas com alimentação variam proporcionalmente a renda (despesa) tal que:
 
 
    Os dados nos dizem, através dos métodos de estimação que c = 0,84, o que significa que a cada rúpia a mais de renda, 84 centavos se destinarão ao consumo alimentar.

c. Você esperaria, a priori, que as despesas com alimentação aumentassem linearmente com o aumento das despesas totais, independentemente do nível destas? Por quê? Utilize a despesa total como uma proxy para o nível de renda total.

    Sim, conforme explicado na questão anterior, é natural que uma elevação da despesa total eleve o consumo alimentar, dado que c > 0. A ideia é que se um indiano ganhar 1 unidade a mais de rúpia ele gastará pelo menos um centavo a mais do que antes.
 

2.16. A Tabela 2.9 apresenta dados sobre a pontuação média do Teste de Aptidão Escolar (SAT) para os estudantes que se preparavam para ingressar no ensino superior no período 1967-1990.

a. Use o eixo horizontal para os anos e o eixo vertical para a pontuação obtida para traçar as notas nas provas de aptidão verbal e matemática obtidas por homens e mulheres, separadamente.

 
    Foi decidido por manter a escala de aptidão fixa no gráfico entre 470 e 550 para melhor visualização. 

b. Que conclusões gerais você tirou desses gráficos?

    Se observa uma clara inversão de prioridades, com o passar dos anos tanto os homens quanto as mulheres tenderam a ter notas de aptidão verbal inferiores e notas de matemática superiores. É possível também observar uma heterocedasticidade onde homens tem notas médias bem superiores as mulheres em matemática, e apenas um pouco superior em aptidão verbal.

c. Conhecendo a pontuação de homens e mulheres nos testes de aptidão verbal, você poderia prever suas notas em matemática?

    Vamos tomar como parâmetro o gráfico de dispersão, que nos revela que:
 
    Isso aponta que existe uma chance de probabilisticamente haver uma relação entre ambas, mas essa relação não parece muito forte a primeira vista, principalmente das mulheres, então vamos afirmar que dificilmente é possível prever com qualidade a nota de matemática dos alunos com base em sua nota nos testes de aptidão verbal.

d. Represente graficamente as notas de matemática das mulheres em relação às dos homens. O que você observa?

 
    Nota-se uma clara relação linear entre as notas das mulheres e a nota dos homens, indicando que a nota dos ambos são correlacionadas.
 

2.17. A Tabela 2.10 apresenta dados sobre a pontuação média no SAT em relação à renda para três tipos de provas: aptidão verbal, matemática e redação. No Exemplo 2.2, apresentamos a Figura 2.7, que representa graficamente a pontuação média em matemática em relação à renda média familiar
 

a. Consulte a Figura 2.7 e prepare um gráfico semelhante relacionando as notas de aptidão verbal à renda média familiar. Compare seus resultados com aqueles da Figura 2.7.

    A figura 2.7. é:
 
    Trazendo para o nosso caso, temos: 
     
    Como podemos ver, há uma relação positiva entre a renda média e a aptidão verbal, apontando para o fato de que quanto maior a renda, maior a aptidão verbal do aluno, assim como na figura 2.7.

b. Repita o exercício (a) relacionando as notas de redação à renda média familiar.

    Repetindo o exercício obtemos:
 
    A mesma relação positiva é mantida, apontando que a renda dos alunos afeta o seu desempenho em redação.

c. Examinando os três gráficos, que conclusões gerais você pode tirar?

 
     Nota-se que em todos os níveis a renda é um determinante do desempenho, dado que a renda média se relaciona positivamente com a o desempenho nos 3 aspectos tratados no teste de aptidão. Em matemática aparenta que essa relação é ainda mais forte.

Comentários