[MÚSICA] [MÚSICA] Vimos, na aula passada, que podemos corrigir a quebra da hipótese quatro, de média condicional zero dos erros, utilizando variáveis "proxy". No entanto, só podemos utilizar essa solução em substituição à variável "x2", que é não-observada, e quando temos uma variável interessante, e com um erro determinadas condições, para substituí-la. Veremos, nessa aula, um estimador um pouco diferente, que é chamado de "estimador de variáveis instrumentais". Utilizando o mesmo exemplo, em que o modelo verdadeiro depende de "x1" e "x2", mas não observamos "x2", a inviabilidade da hipótese de média condicional zero vem do fato de que "x2" e "x1" são correlacionadas, ou seja, a esperança do erro do modelo estimado, que contém "x2" condicional a "x1", é, agora, diferente de zero, ou, de forma mais fraca, podemos dizer que a covariância entre "x1" e os erros é diferente de zero. Vimos que, se essa hipótese não é válida, o nosso estimador de MQO será viesado e não estimaremos o efeito causal da variável. A ideia do estimador de variáveis instrumentais é encontrar uma outra variável, a qual estamos chamando de "z", de forma que esta variável "z" seja correlacionada com o "x1", mas não-correlacionada com os erros do modelo. Veja que a ideia de variáveis instrumentais é bastante diferente da ideia de variáveis "proxy". A variável proxy substitui a variável não-observada que estamos omitindo, "x2". A variável instrumental deve ser correlacionada com a variável que sobra, que é a "x1", e é essa a variável cujo efeito sobre "y" estamos interessados em analisar. Utilizando o método dos momentos, nós podemos ver que, se aplicarmos a covariância de "z" a todo o nosso modelo, a covariância de "z" e "y" tem que ser igual a "Beta 1" covariância de "z" e "x1" mais covariância de "z" e "u". Como estamos supondo que a covariância de "z" e "u" é igual a zero, nós temos que o "Beta 1" será exatamente a covariância de "z" e "y" dividido pela covariância de "z" e "x1". Podemos, então, utilizar os momentos amostrais, ou seja, as covariâncias amostrais para escrever esse estimador. Uma forma de enxergarmos como a variável "z" elimina a endogeneidade do nosso modelo, é via o diagrama de Venn. Note que, a variável "z" é não-correlacionada com "y". Ela apenas se correlaciona com "y" por meio de "x1". Essa figura ilustra as duas hipóteses importantes: a primeira, que "z" é correlacionado com "x1" e que "z" é não-correlacionado com o erro, ou seja, com tudo que é "y", tirando "x1". Veremos então, como podemos generalizar o estimador de variáveis instrumentais quando observamos mais de uma variável instrumental. Suponha, então, que tenhamos o seguinte modelo: "y" vai ser igual a "Beta 0" mais "Beta 1" "x1" mais "Beta 2" "z1" mais "u" e que esse modelo apresenta endogeneidade. Agora, para encontrar o estimador usando múltiplas variáveis instrumentais, nós precisamos entender a relação de "x1" e todas as variáveis exógenas do modelo. Vamos supor aqui, duas variáveis exógenas: "z2" e "z3". A equação entre "x1" e as exógenas do modelo é conhecida por "equação reduzida". Essa equação reduzida terá todas as boas propriedades, e podemos estimá-la usando o estimador de MQO. Utilizando, então, no lugar de "x1" o "x chapéu 1", que é o valor estimado de "x1" a partir da nossa equação reduzida, nós temos o estimador de Mínimos Quadrados de 2 Estágios. Isso porque precisamos estimar, primeiro, a equação reduzida, para, então, colocá-la na equação principal. Temos, então, dois estágios de estimação. Em termos matriciais, podemos escrever o nosso estimador de mínimos quadrados de dois estágios como o vetor de "Beta chapé" igual ao "x chapéu linha" "x chapéu" a menos 1 "x chapéu linha" "y", ou seja, é o estimador de MQO aplicando a matriz "x chapéu", cujos elementos são o "x chapéu" que vem da equação reduzida e o "z1", que era a variável exógena já incluída no modelo. Aqui, só temos que tomar um cuidado, que é o cálculo da variância desse estimador. Isso, porque para calcular os resíduos dessa regressão, nós temos que utilizar o "Beta chapéu" estimado por esse modelo, mas o "x" original e não o "x chapéu". Assim, o resíduo da regressão para encontrar a variância fica dessa forma. [MÚSICA] [MÚSICA] [MÚSICA]