[MÚSICA] [MÚSICA] Nesta aula, nós veremos alguns testes de hipóteses que nos permitem testar a diferença entre o estimador de variáveis instrumentais (ou de mínimos quadrados de dois estágios) e o estimador de MQO. O primeiro teste que veremos é chamado de "teste de Hausman". A ideia dele é comparar o valor dos estimadores de MQO e de mínimos quadrados de dois estágios, ponderado pela diferença da variância entre eles. A hipótese nula do teste é de inexistência de endogeneidade (ou seja nesse caso o estimador de MQO é o melhor estimador possível, pois ele é não-viesado e pode ter variância mínima se vale a hipótese de homocedasticidade); a hipótese alternativa, aqui, será que há endogeneidade (ou seja, é melhor utilizarmos o estimador de mínimos quadrados de dois estágios com variáveis instrumentais). A estatística do teste, então, "H", será basicamente a comparação entre os vetores de estimação do mínimos quadrados de dois estágios e de MQO ponderado pelas suas variâncias. Hausman mostrou que essa estatística de teste converge para uma "Qui-quadrada" com "k" grau de liberdade, sendo "k" o número de variáveis que incluímos no nosso modelo. Se a estatística do teste for maior do que valor crítico dessa distribuição de Qui-quadrado, nós rejeitamos a hipótese nula, ou seja, é bem provável que haja endogeneidade e que precisemos estimar por mínimos quadrados de dois estágios. Outro teste bastante conhecido nessa literatura é o teste de Sargan. O teste de Sargan é conhecido como teste de sobreidentificação, e só pode ser aplicado quando temos mais variáveis instrumentais do que variáveis endógenas. Vamos supor um exemplo em que temos uma variável endógena "x1" e duas variáveis instrumentais "z3" e "z4". A ideia do teste de Sargan é, então, estimar a equação principal ou equação estrutural por variáveis instrumentais ou mínimos quadrados de dois estágios usando apenas um dos instrumentos (por exemplo, "z3"), guardar os resíduos dessa estimação usando apenas uma variável instrumental e correlacionar esses resíduos com todas as variáveis exógenas do modelo, ou seja, "z1", "z2", "z3" e "z4". O que esse teste mostra é que, nessa regressão auxiliar dos resíduos contra todas as exógenas, se elas forem conjuntamente significantes para explicar os resíduos, isso significa que os instrumentos não são exógenos. Nesse caso, podemos considerar que "z4", que foi o instrumento não utilizado na regressão principal, não é instrumento válido. A forma como o teste de Sargan é realizado é a partir de uma estatística LM. Essa estatística mostra que o número de observações multiplicado pelo "R-quadrado" da regressão do "u til" contra as demais variáveis exógenas convergem para uma "Qui-quadrado" com "m" graus de liberdade, sendo que "m" é a diferença entre o número de variáveis instrumentais excluídas e o número de endógenas, que, no nosso caso, vai ser igual a 1. Nós não vimos o teste LM quando falamos de testes conjuntos, mas, aqui, vou deixar o material auxiliar para quem quiser ter mais detalhes sobre esse teste. Veremos, agora, o exemplo da dissertação de mestrado da aluna Bruna Morais. Bruna estava interessada em analisar o efeito da poluição do ar em São Paulo sobre as internações de doenças respiratórias na cidade. A literatura mostra que a poluição é endógena nesse modelo, pois alguns indivíduos conseguem se adaptar à poluição do ar comprando equipamentos ou se mudando para locais menos poluídos. Se essas características que fazem com que os indivíduos se adaptem também influenciam na saúde dele, nós temos um caso clássico de endogeneidade. A aluna usa como variável instrumental para a poluição o vento. Isso porque tanto a velocidade quanto a direção do vento influenciam na poluição de cada local. Assim, ela tem duas variáveis instrumentais: a direção do vento e a velocidade do vento. Podemos fazer, então, um teste de Sargan de sobreidentificação para verificar se esses instrumentos são bons. Encontramos um "p-valor" do teste de 0,41, ou seja, muito maior do que o 0,05 que usamos como referência. Isso mostra que o instrumento excluído da regressão não foi importante, ou não foi correlacionado com os resíduos gerados da estimação com apenas uma variável instrumental. Fizemos o teste para os dois instrumentos e verificamos que ambos são exógenos, o que nos dá muito mais conforto para dizer que estamos lidando com a endogeneidade deste modelo. [MÚSICA] [MÚSICA] [MÚSICA]