GOVERNO DO ESTADO DO CEARÁ                                          SECRETARIA DO PLANEJAMENTO E GESTÃO - SEPLAG          ...
Notas Técnicas do Instituto de Pesquisa e Estratégia Econômica do Ceará (IPECE)GOVERNO DO ESTADO DO CEARÁ  Cid Ferreira Go...
SUMÁRIOApresentação                                                     11. Pressupostos relacionados à metodologia de Dad...
IPECE – Nota Técnica N° 37                                              Apresentação        Em função de vários trabalhos ...
IPECE – Nota Técnica N° 371. Pressupostos relacionados à metodologia de Dados em Painel           Um modelo de regressão c...
IPECE – Nota Técnica N° 37           Se algum desses dois problemas, ou ambos, estiverem presentes no modelo, amatriz de v...
IPECE – Nota Técnica N° 372. Heterogeneidade Não-observada          O    problema        mais   frequente   em     dados  ...
IPECE – Nota Técnica N° 373. Efeitos Fixos         No caso em que Cov (ci , x j ) ≠ 0 , para que possamos estimar essa equ...
IPECE – Nota Técnica N° 374. Efeitos Aleatórios           Outro método de estimação bastante utilizado com dados em painel...
IPECE – Nota Técnica N° 375. Exogeneidade Estrita e Variáveis Instrumentais        Um ponto importante a se destacar dos t...
IPECE – Nota Técnica N° 37variável observável           zit    que sirva como instrumento (variável instrumental) e não es...
IPECE – Nota Técnica N° 37Anexo: Testes frequentemente utilizados em modelos com dados em painelA - Teste F para Heterogen...
IPECE – Nota Técnica N° 37C - Teste de Hausman para testar Efeitos Fixos contra Efeitos Aleatórios         Seja β EF o vet...
IPECE – Nota Técnica N° 37Referências BibliográficasDAVIDSON, R. and MACKINNON, J. G., Econometric Theory and Methods, Oxf...
IPECE – Nota Técnica N° 37WORRALL J. L.; PRATT T. C., On the Consequences of Ignoring Unobserved Heterogeneitywhen Estimat...
Upcoming SlideShare
Loading in …5
×

Econometria endogeneidade

4,807 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,807
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
64
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Econometria endogeneidade

  1. 1. GOVERNO DO ESTADO DO CEARÁ SECRETARIA DO PLANEJAMENTO E GESTÃO - SEPLAG INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ - IPECE NOTA TÉCNICA Nº 37 UMA BREVE DISCUSSÃO SOBRE OS MODELOS COM DADOS EM PAINEL André Oliveira Ferreira Loureiro1 Leandro Oliveira Costa2 Fortaleza – CE Março – 2009 Mestre em Economia – CAEN/UFC. Analista de Políticas Públicas do IPECE.1 Doutorando em Economia – CAEN/UFC. Analista de Políticas Públicas do IPECE.2
  2. 2. Notas Técnicas do Instituto de Pesquisa e Estratégia Econômica do Ceará (IPECE)GOVERNO DO ESTADO DO CEARÁ Cid Ferreira Gomes – GovernadorSECRETARIA DO PLANEJAMENTO E GESTÃO (SEPLAN) Silvana Maria Parente Neiva Santos– SecretáriaINSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ (IPECE) Marcos Costa Holanda – Diretor-Geral Marcelo Ponte Barbosa – Diretor de Estudos Econômicos Eveline Barbosa Silva Carvalho – Diretora de Estudos SociaisA Série Notas Técnicas do Instituto de Pesquisa e Estratégia Econômica doCeará (IPECE) tem como objetivo a divulgação de metodologias e trabalhoselaborados pelos servidores do órgão, que possam contribuir para adiscussão de diversos temas de interesse do Estado do Ceará.Instituto de Pesquisa e Estratégia Econômica do Ceará (IPECE)End.: Centro Administrativo do Estado Governador Virgílio TávoraAv. General Afonso Albuquerque Lima, S/N – Edifício SEPLAN – 2º andar60830-120 – Fortaleza-CETelefones: (85) 3101-3521 / 3101-3496Fax: (85) 3101-3500www.ipece.ce.gov.bripece@ipece.ce.gov.br
  3. 3. SUMÁRIOApresentação 11. Pressupostos relacionados à metodologia de Dados em Painel 22. Heterogeneidade Não-observada 43. Efeitos Fixos 54. Efeitos Aleatórios 65. Exogeneidade Estrita e Variáveis Instrumentais 7Anexo: Testes frequentemente utilizados em modelos com dados empainel 9Referências Bibliográficas 11
  4. 4. IPECE – Nota Técnica N° 37 Apresentação Em função de vários trabalhos do IPECE utilizarem a metodologia de dadosem painel na realização de avaliações sobre diversos aspectos socioeconômicoscearenses1, o presente trabalho busca ampliar a acessibilidade dos nossostrabalhos a essa metodologia amplamente utilizada nos artigos científicos dasciências sociais aplicadas e, principalmente, na economia. Dessa forma, apresente nota técnica apresenta um breve resumo sobre a metodologiaeconométrica utilizada no contexto de Dados em Painel, bem como um breveguia de como aplicá-la utilizando o software Stata2. Dados em Painel ou dados longitudinais são caracterizados por possuíremobservações em duas dimensões que em geral são o tempo e o espaço. Estetipo de dados contém informações que possibilitam uma melhor investigaçãosobre a dinâmica das mudanças nas variáveis, tornando possível considerar oefeito das variáveis não-observadas. Outra vantagem é a melhoria na inferênciados parâmetros estudados, pois eles propiciam mais graus de liberdade e maiorvariabilidade na amostra em comparação com dados em cross-section ou emséries temporais, o que refina a eficiência dos estimadores econométricos. Hsiao(2006) expõe um maior detalhamento das vantagens propiciadas pela análisede Dados em Painel. Após uma introdução que discute o modelo de dados em painel, éapresentado o conceito de heterogeneidade não-observada. São discutidos osprincipais modelos utilizados neste contexto: Efeitos Fixos, Primeiras Diferenças eEfeitos Aleatórios. Finalmente, é discutido o caso em que a hipótese deExogeneidade Estrita não é valida e a utilização de variáveis instrumentais.1 Entre os trabalhos do IPECE que se utilizam da metodologia de dados em painel, podemos citar os artigos de Irffi,Oliveira & Barbosa (2008), Irffi et al. (2008) e Loureiro (2008).2 A escolha do software STATA 10.0 se deve a sua ampla utilização nas ciências sociais aplicadas. 1
  5. 5. IPECE – Nota Técnica N° 371. Pressupostos relacionados à metodologia de Dados em Painel Um modelo de regressão com dados em painel, com n observações em Tperíodos e K variáveis, pode ser representado da seguinte forma: yit = xit β + ε it , i = 1, 2, ... , n; t = 1, 2, ... , T (1)onde yit é a variável dependente, xit é um vetor 1 × K contendo as variáveisexplicativas, β é um vetor K × 1 de parâmetros a serem estimados e ε it são os errosaleatórios. Os sub-índices i e t denotam a unidade observacional e o período de cadavariável, respectivamente. Desta forma, em uma base de dados com dados em painel,o número total de observações corresponde a n × T. Se o modelo seguir todas as hipóteses clássicas de regressão3, pode-se estimá-lopor Mínimos Quadrados Ordinários – MQO, obtendo as estimativas desejadas. Asprincipais se referem ao erro ε , que se supõe homoscedástico e não-correlacionado notempo e no espaço. Neste caso, ter-se-ia uma matriz de variância V da seguinte forma:V = (σ 2 I n ) ⊗ I T , onde σ 2 é a variância da regressão, ⊗ denota o produto de kroneckere I n e I T denotam matrizes identidade de ordem n e T, respectivamente. Assim, V éuma matriz de ordem nT × nT. No caso de dados em painel, os problemas deheteroscedasticidade e autocorrelação podem ocorrer tanto dentro dos grupos,quanto entre os grupos, ou as duas situações simultaneamente. O problema de heteroscedasticidade, se detectado, torna necessária autilização do método de Mínimos Quadrados Generalizados – MQG. Segundo Greene(2003), se fosse utilizado o estimador de Mínimos Quadrados Ordinários – MQO, nãolevando em consideração a não-homoscedasticidade dos distúrbios, as estimativasainda seriam não-viesadas e consistentes, mas não seriam mais eficientes. Desta forma,os testes de significância das estimativas seriam enviesados se MQO fosse utilizado. Omesmo argumento é válido na presença de autocorrelação dos erros.3 Para maiores detalhes dessas hipóteses, ver Greene (2003) e Davidson & MacKinnon (2004). 2
  6. 6. IPECE – Nota Técnica N° 37 Se algum desses dois problemas, ou ambos, estiverem presentes no modelo, amatriz de variância do modelo deixa de ser diagonal e passa a ser da seguinte forma:V = (σ 2 Σ) ⊗ Ω , onde Σe Ω representam matrizes cujos elementos podem assumirquaisquer valores. Em função de não se conhecer a matriz de variância V do modelo, não épossível realizar estimativas dos parâmetros por MQG diretamente, sendo entãonecessário estimar Σ e Ω. Mas a estimação de todos os parâmetros dessas matrizessem estabelecer qualquer padrão para as mesmas também é inviável, visto que nestecaso teremos mais parâmetros a serem estimados do que observações disponíveis. Maisprecisamente, em um modelo com nT observações, teremos mais nT(nT+1)/2 parâmetrosna matriz de variância V para serem estimados, além dos parâmetros usuais, tornandoqualquer estimativa impossível. Assim, para que se possa obter as estimativas, faz-senecessária a estimação por Mínimos Quadrados Generalizados Factíveis – MQGF, ondeo padrão dessa matriz é predeterminado.4 Outro problema que pode surgir em dados em painel, e que inviabilizaria autilização de MQO, é a endogeneidade. Esta ocorre quando a correlação entrealguma variável explicativa xj e o erro é diferente de zero, isto é: Cov ( x j , ε it ) ≠ 0 .Wooldridge (2002) destaca as três principais fontes de endogeneidade: omissão devariáveis do modelo (heterogeneidade não-observada), erros de medição das variáveise simultaneidade entre as variáveis.4 Para maiores detalhes sobre esse método, ver Greene (2003) e Wooldridge (2002). 3
  7. 7. IPECE – Nota Técnica N° 372. Heterogeneidade Não-observada O problema mais frequente em dados em painel é a questão daheterogeneidade não-observada. Neste caso, haveria fatores que determinam avariável dependente, mas não estão sendo considerados na equação dentro doconjunto de variáveis explicativas, por não serem diretamente observáveis oumensuráveis. Levando em consideração a heterogeneidade não-observada, o modeloacima pode ser reescrito da seguinte forma: yit = xit β + ci + ε it , i = 1, 2, ... , n; t = 1, 2, ... , T (2)onde ci representa a heterogeneidade não-observada em cada unidade observacional(no presente caso, estado) constante ao longo do tempo. Segundo Wooldridge (2002), se ci for correlacionado com qualquer variável emxit e tentarmos aplicar MQO neste caso, as estimativas serão não só viesadas comoinconsistentes.5 As mesmas consequências ocorrem no modelo no caso em que ahipótese clássica que não haja correlação entre alguma variável explicativa xj e o erro,Cov ( x j , ε it ) = 0 , não seja válida. Assim, neste caso, somente podemos utilizar MQO setivermos justificativas para assumir que Cov (ci , x j ) = 0 . Se essa hipótese for válidapodemos considerar um novo termo composto, vit ≡ ci + ε it , e estimar o modelo porMQO, visto que teríamos Cov(vit , x j ) = 0 . Esse método com dados em painel éconhecido como Mínimos Quadrados Ordinários Agrupados.5 Para uma discussão mais detalhada das implicações da existência da heterogeneidade não-observada nos modeloseconométricos, ver Worrall & Pratt (2004). 4
  8. 8. IPECE – Nota Técnica N° 373. Efeitos Fixos No caso em que Cov (ci , x j ) ≠ 0 , para que possamos estimar essa equaçãoconsistentemente, a abordagem mais usual no contexto de dados longitudinais é a deEfeitos Fixos. Neste método de estimação, mesmo permitindo que Cov (ci , x j ) ≠ 0 , a idéiaé eliminar o efeito não-observado ci , baseado na seguinte suposição: E (ε it x i , ci ) = 0 ,onde xi ≡ ( xi1 , xi 2 , ..., xiT ) , conhecida como condição de exogeneidade estrita. Atransformação de efeitos fixos (ou transformação within) é obtida em dois passos.Tirando-se a média da equação (2) no tempo obtemos: y i = x i β + ci + ε i (3)e subtraindo (3) de (2) para cada t, obtemos a equação transformada de efeitos fixos: yit − yi = ( x it − x i )β + ε it − ε i (4)ou &&it = &&it β + ε&it , y x & i = 1, 2, ... , n; t = 1, 2, ... , T (5)removendo assim a heterogeneidade não-observada ci . O estimador de Efeitos Fixos é obtido ao se aplicar MQO agrupados na equação(5) e sob a hipótese de exogeneidade estrita, esse estimador é consistente. Esteestimador também é conhecido como estimador within, por usar a variação do tempodentro de cada unidade observacional. Outro estimador bastante utilizado a partir dastransformações anteriores é o estimador between, que é obtido ao se aplicar MQOagrupados na equação (3), e leva em consideração somente a variação entre asunidades observacionais. 5
  9. 9. IPECE – Nota Técnica N° 374. Efeitos Aleatórios Outro método de estimação bastante utilizado com dados em painel é o deEfeitos Aleatórios. Assim como nos MQO agrupados, em uma análise de efeitosaleatórios, o efeito não-observado ci é colocado junto com o termo aleatório ε it .Entretanto, impõe três suposições adicionais6: a) E (ε it x i , ci ) = 0 , b) E (ci x i ) = E (ci ) = 0e c) Var (ci2 x i ) = σ c2 . A primeira é a mesma do modelo de efeitos fixos, a deexogeneidade estrita. A segunda diz respeito à ortogonalidade entre ci e cada xi emédia de ci ser nula. A terceira se refere à homoscedasticidade de ci . O modelo de efeitos fixos permite a existência de correlação entre os efeitosindividuais não-observados com as variáveis incluídas. Entretanto, se esses efeitos foremestritamente não-correlacionados com as variáveis explicativas, pode ser maisapropriado modelar esses efeitos como aleatoriamente distribuídos entre as unidadesobservacionais, utilizando o modelo de efeitos aleatórios. Em função das especificidadesdesse modelo, o problema de autocorrelação é uma constante, fazendo com que sejanecessária a utilização de MQG factíveis. Assim, o ponto crucial na decisão de que modelo deve ser utilizado, se efeitosfixos ou aleatórios, reside na questão se ci e xi são correlacionados ou não. Essequestionamento deve ser feito de acordo com os dados que se está trabalhando,examinando suas especificidades. Um teste mais formal pode ser realizado, o Teste deHausman, baseado nas diferenças das estimativas de efeitos fixos e aleatórios. Este testeé descrito na última seção. Haveria ainda a possibilidade de simplesmente não haver heterogeneidade não-observada no modelo que estamos estimando. Se isso for verdade a estimativa porMQO agrupado é eficiente e válida. A ausência de efeitos não-observados éequivalente a testar a hipótese de a variância de ci ser nula. Um teste para verificar aexistência de efeitos não-observados é o de Breusch e Pagan, baseado no multiplicadorde Lagrange, que é descrito em Greene (2003) e Wooldridge (2002).6 Além das suposições usuais de posto e dos erros. 6
  10. 10. IPECE – Nota Técnica N° 375. Exogeneidade Estrita e Variáveis Instrumentais Um ponto importante a se destacar dos três modelos discutidos acima que tratamda heterogeneidade não-observada é a hipótese comum a todos eles: a deexogeneidade estrita. Embora essa suposição seja crucial para a consistência de todosesses estimadores, é também uma das mais prováveis de não ser válida. Assim,precisamos saber que procedimento deve-se utilizar se a suposição de exogeneidadeestrita não for válida. Wooldridge (2002) sugere algumas soluções para esse problema,destacando a utilização de variáveis instrumentais e eliminação do efeito não-observado para que os estimadores sejam consistentes mesmo quanto à hipótese deexogeneidade estrita não for válida. Para que possamos utilizar variáveis instrumentais, é necessária a utilização demétodos específicos para quando estas precisam ser utilizadas no modelo. O métodomais utilizado nesse contexto é o método de Mínimos Quadrados em Dois Estágios –MQ2E. O objetivo principal de se utilizar esse tipo de estimação com variáveisinstrumentais é resolver o problema de endogeneidade. Uma discussão mais detalhada do método de M2QE fugiria do escopo dopresente trabalho.7 Entretanto, faz-se necessário definir o que caracteriza uma variávelinstrumental. Reescrevendo um modelo de regressão como o descrito na equação (1)destacando uma das variáveis contidas em xit que seja endógena (isto é,Cov ( wit , ε it ) ≠ 0 ), e a denotando por wit , teremos: yit = x it β + γ wit + ε it , i = 1, 2, ... , n; t = 1, 2, ... , T (7) Sabemos que a estimação de (7) por MQO resultará em estimativas inconsistentesnão só para γ, como para todos os parâmetros contidos no vetor β. O método devariáveis instrumentais – IV possibilita uma solução geral pra o caso em que existealguma variável endógena no modelo. Para utilizar essa abordagem, é necessária uma7 Para maiores detalhes sobre estimadores com variáveis instrumentais, ver Greene (2003), Davidson & MacKinnon(2004) e Wooldridge (2002). 7
  11. 11. IPECE – Nota Técnica N° 37variável observável zit que sirva como instrumento (variável instrumental) e não estejana equação (7). Esta variável precisa satisfazer duas condições. Primeiro, zit deve ser nãocorrelacionada com o erro ε it , isto é: Cov ( zit , ε it ) = 0 . Desta forma, assim como asdemais variáveis em xit , z it é exógena na equação (7). A segunda condição dizrespeito à relação entre z it e a variável endógena wit . Em uma projeção linear de witem todas as variáveis exógenas: wit = xit δ + θ zit + η it (8)o coeficiente de z it deve ser não-nulo, isto é: θ ≠ 0 . Essa condição pode ser entendidade uma forma não tão rigorosa como: Cov( wit , zit ) ≠ 0 . Ou seja, a variável instrumentaldeve ser correlacionada com a variável endógena. Como já foi mencionado e será discutido com mais detalhes mais a frente, nopresente trabalho, a variável no modelo a ser estimado que se acredita que sejaendógena, é a variável de gastos em segurança pública. Assim, devemos utilizar pelomenos uma variável instrumental não somente para corrigir esse problema, como naprópria determinação se a variável de gastos públicos em segurança é endógena nomodelo que iremos estimar.8 Assim, com uma variável instrumental que satisfaça essas condições, podemosimplementar o método apropriado para corrigir o problema de endogeneidade nomodelo que queremos estimar, seja este problema causado pela hipótese deexogeneidade estrita não ser válida, ou haver simultaneidade entre alguma variávelexplicativa e a variável independente. Isto é, alguma variável explicativa, além dedeterminar a variável dependente, ao mesmo tempo, ser influenciada pela variáveldependente.8 Somente com a variável instrumental em mãos, podemos testar se uma variável é endógena ou não em um modelo. Oteste mais difundido para este fim é o teste de Hausman de endogeneidade. 8
  12. 12. IPECE – Nota Técnica N° 37Anexo: Testes frequentemente utilizados em modelos com dados em painelA - Teste F para Heterogeneidade Não-ObservadaH 0 : ci = c ( RLDSV − RMQOA ) /(n − 1) 2 2 F (n − 1, nT − n − K ) = (A.1) (1 − RLSDV ) /(nT − n − K ) 2onde LSDV indica o estimador com variável dummy onde ci é levado em consideração.Se esta estatística exceder o valor tabelado, a hipótese de heterogeneidade não-observada é válida.B - Teste de Breusch e PaganH 0 :σ c2i = 0 [ ] ( ) 2 2 ⎡ n ⎤ ⎡ ⎤ nT ⎢ ∑i =1 ∑t =1 ε it nT ⎢ ∑i =1 Tε i T 2 n 2 ˆ ˆ LM = −1⎥ = − 1⎥ (A.2) 2(T − 1) ⎢ ∑n ∑T ε it ˆ2 ⎥ 2(T − 1) ⎢ ∑n ∑T ε itˆ2 ⎥ ⎢ ⎣ i =1 t =1 ⎥ ⎦ ⎢ i =1 t =1 ⎣ ⎥ ⎦onde é ε it ˆ resíduo da regressão de MQO agrupados e sob a hipótese nula, LM ~ χ 2com 1 grau de liberdade. Se esta estatística exceder o valor tabelado, a hipótese deheterogeneidade não-observada é válida. 9
  13. 13. IPECE – Nota Técnica N° 37C - Teste de Hausman para testar Efeitos Fixos contra Efeitos Aleatórios Seja β EF o vetor de estimativas de efeitos fixos e β EA o vetor de estimativas de ˆ ˆefeitos aleatórios, sob a hipótese nula de:H 0 : βˆ EF − βˆ EA = 0 (i.e. efeitos aleatórios é válido), a estatística: [ ˆ ][ ˆ ][ ˆ −1 ˆ H = β EF − β EA V ( β EF ) − V ( β EA ) β EF − β EA ˆ ˆ ] (A.3)possui distribuição χ 2 com K-1 graus de liberdade. Se esta estatística exceder o valortabelado, devemos utilizar efeitos fixos. 10
  14. 14. IPECE – Nota Técnica N° 37Referências BibliográficasDAVIDSON, R. and MACKINNON, J. G., Econometric Theory and Methods, OxfordUniversity Press, 2004.GREENE, William H. Econometric Analysis 5th ed. Prentice-hall. 2003.IRFFI, G. D.; OLIVEIRA, J.; BARBOSA, E. Análise dos Determinantes Socioeconômicos daTaxa de Mortalidade Infantil (TMI) no Ceará. Texto para Discussão IPECE Nº 48, 2008.IRFFI, G. D.; TROMPIERI, N.; OLIVEIRA, J.; NOGUEIRA, C. A.; BARBOSA, M.; HOLANDA, M.Determinantes do Crescimento Econômico dos Municípios Cearenses. Texto paraDiscussão IPECE Nº 39, 2008.HSIAO, Cheng, Analysis of panel data: Second Edition, Cambridge University Press, 2003.HSIAO, Cheng, Panel Data Analysis - Advantages and Challenges, IEPR Working Papers,Institute of Economic Policy Research (IEPR), 2006.LOUREIRO, A. O. F. Avaliando o Impacto do Policiamento sobre a Criminalidade noCeará. Texto para Discussão IPECE Nº 53, 2008.NERLOVE, M. Essays in Panel Data Econometrics. Cambridge University Press, 2002.WOOLDRIDGE, Jeffrey M., Econometric Analysis of Cross Section and Panel Data. The MITPress, Cambridge, MA, 2002. 11
  15. 15. IPECE – Nota Técnica N° 37WORRALL J. L.; PRATT T. C., On the Consequences of Ignoring Unobserved Heterogeneitywhen Estimating Macro-Level Models of Crime. Social Science Research, v. 33, p. 79-105,2004. 12

×