Para trabalhar com estatística é preciso saber trabalhar com os dados, para isso existe a a área da estatística denominada de Estatística Descritiva que se propõe a desenvolver métodos para a manipulação de dados e extração de resultados.
Ao lidar com econometria é preciso ter em mente a natureza dos dados econômicos com que se está trabalhando, que dependem essencialmente do seu conteúdo e da maneira que estão arranjados, cada modelo exige um determinado tratamento, existindo inclusive campos de estudo focado em determinado modelo de dados, como a Econometria de Séries Temporais, que geralmente é tratada como cadeira a parte da econometria normal.
Quanto a sua natureza, os dados são categorizados em quanto a sua qualidade, tempo e grau de agregação.
Quanto a qualidade, dividimos os dados econômicos em quantitativos e qualitativos, sendo os dados quantitativos representados por números, inteiros (descritivos) ou reais (contínuos), e as variáveis qualitativas representadas por valores não numéricos, como sexo, país de origem, etc.
Quanto ao tempo, divide-se em dados fluxo e dados estoque, uma variável fluxo representa um valor em um determinado intervalo temporal, como o fluxo de comércio em um país entre um determinado período de tempo. Já uma variável estoque representa o valor em um determinado período de tempo, como o PIB de um determinado país em um determinado ano.
Quanto ao grau de agregação, divide-se em dados macro e dados micro, sendo uma divisão referente ao campo econômico tratado, dados microeconômicos, como a quantidade demandada, preço ou satisfação são variáveis micro, enquanto variáveis globais como PIB e Inflação são variáveis macro.
Em suma, temos o seguinte quadro resumo:
Categoria
|
Tipos
|
Característica
|
Exemplo
|
Forma
|
Qualitativa
|
Variáveis não numéricas
|
Sexo e religião
|
Quantitativa
|
Variáveis numéricas
|
Idade e salário
|
Tempo
|
Fluxo
|
Ocorrida em um intervalo de tempo
|
Vendas durante 10 dias
|
Estoque
|
Um único momento do tempo
|
Vendas em um único dia
|
Grau de Agregação
|
Micro
|
Variáveis microeconômicas
|
Demanda e oferta de um bem.
|
Macro
|
Variáveis macroeconômicas
|
PIB, Inflação e Desemprego
|
Agora tratando sobre a maneira com que os dados são arranjados, trata-se de uma importante diferenciação sobre a maneira que recebemos os dados, que variam de acordo com o número de variáveis e o horizonte temporal.
As principais categorias são:
Séries Temporais
Trata-se de um dos modelos mais comuns de dados, sendo a observação de uma única variável durante um período de tempo.
Nesse tipo de estudo, o pesquisador escolhe uma variável de interesse e analisa o seu valor a cada período de tempo em intervalos regulares (ou não) que podem ser diários, semanais, mensais, anuais, etc.
Para compreender melhor, aqui vai um exemplo, suponha que um analista do mercado financeiro queira fazer um estudo sobre o preço da ação PETR4, para isso ele escolhe uma variável: O valor de Fechamento, e então escolhe um intervalo de tempo, no caso, entre o dia 7 de julho de 2021 e o dia 4 de agosto de 2021, no caso ele obteria os seguintes dados:
Esse é um exemplo de uma série temporal, esse modelo de
organização de dados se destaca por uma série de fatores, como a sua
facilidade de representação gráfica, já que é bastante fácil representar essa relação, com um simples
gráfico de série temporal. No caso da ação, podemos representar graficamente da seguinte maneira:
É um dos arranjos mais trabalhados em econometria, destacando-se tanto que existe um disciplina a parte chamada
Econometria de Séries Temporais que além de ser uma disciplina separada nos currículos de
cursos superiores de Economia, é assunto de livros específicos.
Corte Transversal
O oposto ao caso da série temporal, pois ao invés de se analisar a fluxo temporal de uma determinada variável ao longo do tempo, o pesquisador analisa o valor de uma série de variáveis em um único período do tempo.
Para seguir no exemplo do analista de mercado financeiro, vamos supor que ele não está interessado mais em estudar a variação do valor de fechamento da ação PETR4, mas sim em analisar o valor de fechamento de uma série de ações no dia 4 de agosto de 2021, para analisar a sua carteira, para isso ele vai se valer de um corte transversal, que essencialmente é dado por:
Assim como a análise de séries temporais, ele tem suas características especiais, sendo muito relevante para se comparar situações como o IDH dos países em um determinado ano ou o PIB per capita de todos os estados brasileiros em um determinado ano.
Os dados em corte transversal não tem a mesma facilidade de tratamento gráfico que os dados em séries temporais, como será visto posteriormente, questões como a escala e a magnitude das variáveis pode inviabilizar análises, a primeira vista, mas são igualmente relevantes.
Dados mistos ou Dados em Painel
Enquanto a série temporal é uma análise de uma única variável ao longo do tempo, e o corte transversal é uma análise de uma série de variáveis em um determinado momento do tempo, existe uma categoria média que são os chamados dados em painel que são uma combinação de séries temporais de uma série de variáveis.
Trata-se provavelmente da categoria mais útil, pois permite analisar a evolução de uma série de variáveis ao longo do tempo, sendo um formato muito comum por sua simplicidade de representação em painel.
Retomando o caso do mercado financeiro, suponha que o analista queira analisar como todas as ações da sua carteira estão evoluindo com o tempo, para isso ele cria um painel com o valor de fechamento de cada variável em cada momento do tempo, tal que, para a carteira apresentada anteriormente, o painel que representa a evolução das ações entre o dia 7 de julho e o dia 4 de agosto é dado por:
O arranjo de dados mistos é bastante comum e mistura as vantagens e as dificuldades dos dois arranjos que o compõem. Uma das facilidades é a representação gráfica, pois com alguns cliques é possível gerar um gráfico de série temporal que mostra a evolução de todas as ações, no caso o gráfico em questão seria:
Observe que esse gráfico não se revelou muito útil a primeira vista, devido ao efeito magnitude que não permite enxergar com precisão a variação das ações, mas se for observar, podemos notar que as ações estão
gravitando um certo valor médio e que nenhuma delas sofreu uma queda ou elevação realmente grande no curto prazo.
Sobre a representação gráfica de dados mistos é importante antecipar algumas regras pra tornar-las mais agradáveis: Primeiro, não exagere no número de variáveis, um gráfico deve ser simples e não confuso. Segundo, evite o efeito magnitude que ocorre do fato de que existem variáveis outlier em que as escalas são muito maiores do que outras, isso leva a uma situação anti-estética onde as variáveis menores que a outlier ficam muitos próximas, dificultando diferencia-las. Para lidar com isso, o pesquisador pode usar uma série de métodos, mas inicialmente, vamos eliminar as variáveis cuja escala são muito elevadas, no caso as ações VALE3 e NTCO3, ficando com o seguinte gráfico:
Bem mais claro, não? Se reduzirmos o limite mínimo do eixo do preço, se torna ainda mais claro:
Nesse caso as variações estão mais claras do que no gráfico com todas as ações plotadas, tornando melhor para o analista visualizar e estudar a carteira.
Quanto os arranjos, temos o seguinte quadro resumo:
Ao longo do curso iremos tratar mais sobre dados mistos já que se trata, provavelmente, de um dos mais relevantes arranjos de dados para interessados em econometria e principalmente em sua aplicação no mercado financeiro.
Esse artigo foi útil para você? Esperamos que sim!
No próximo artigo iremos formalizar o modelo de regressão que será utilizado ao longo do curso.
Bibliografia
GUJARATI, Damodar N; PORTER, Dawn C. Basic Econometrics. 5ª Edição. New York. The McGraw-Hill, 2008.
Gostou do conteúdo? Deixe seu comentário! Não gostou? Deixa também, queremos ouvir sua opinião!
ResponderExcluirSiga nossa página no Instagram: @agenteracional