[MÚSICA] [MÚSICA] [MÚSICA] Nesta e nas próximas aulas, nós veremos as consequências da quebra da hipótese quatro, ou seja, que a média de "u" condicional a "x" será diferente de 0. Vimos que essa hipótese é bastante importante para demonstração do não-viés do estimador de MQO. Há vários motivos para a quebra dessa hipótese, como, por exemplo, problemas de especificação, (ou seja, a função de "x", que estamos considerando não estar correta); a omissão de variáveis relevantes que são correlacionadas com outras variáveis do modelo (que, geral, pode acontecer pois não observamos essas variáveis importantes); erros de medida na variável explicativa (que também podem levar a endogeneidade, ou seja, a quebra da hipótese quatro); e, por fim, viés de simultaneidade (ou seja, quando "y" explica "x" e "x" explica "y"). Veremos, então, exemplos da omissão de variáveis relevantes. Se temos um modelo verdadeiro com duas variáveis explicativas, "x1" e "x2", mas estimamos o modelo apenas com "x1", nós sabemos que o estimador de "Beta 1" do modelo estimado será igual ao estimador da regressão simples. Vimos, nas aulas passadas que a esperança desse estimador, o qual identificaremos por "Beta til 1" condicional a "x", será igual a "Beta 1", mais "Beta 2" vezes o somatório de "xi1", menos "x-barra-1" vezes "x2i", dividido pelo somatório de "xi1" menos "x-barra-1" ao quadrado. O viés desse estimador depende, então, da correlação entre "x1" e "x2", e do sinal de "Beta 2". Se "Beta 2" é igual a 0, isso significa que "x2" não deveria ser incluído no modelo verdadeiro. Se "x1" e "x2" são correlacionados, nós teremos, então, viés nesse estimador. Veremos duas soluções para esse problema. O uso de variáveis "proxy" e o uso de variáveis instrumentais. Variáveis "proxy" são variáveis observadas que medem com erro a variável não observada. Então, se "x2" é a nossa variável que não observamos, por exemplo, a habilidade na regressão entre salário, educação e habilidade, nós podemos, por exemplo, observar um teste de Q.I., que seja uma medida de habilidade dos indivíduos. Essa variável que representa o teste de Q.I. é o que chamamos de "x2 estrela", ou seja, é uma variável que se aproxima da variável que estamos omitindo. "x2 estrela" mede, então, "x2" com erro, de acordo com a seguinte equação. Vamos ver quais são os impactos para o nosso modelo verdadeiro do uso de "x2 estrela" no lugar de "x2". Substituindo, então, a fórmula que vimos de "x2 estrela" dentro do nosso modelo verdadeiro, nós temos o seguinte: "y" vai ser igual a "Beta 0" mais "Beta 1" "x1" mais "Beta 2", "x2 estrela" mais 1. Substituindo "x2 estrela" pela fórmula que vimos, nós temos o seguinte: "y" será igual a "Beta 0", mais "Beta 2", "Teta 0" -- esse será o novo intercepto desse modelo -- mais "Beta 1", "x1", mais "Beta 2" "Teta 1" "x2" -- note, agora, que "Beta 2" "Teta 1", será o novo parâmetro que acompanha a variável "x2" -- e o termo de erro "v" será composto por "Beta 2" "Épsilon" mais "u". Para que o uso dessa variável "proxy" gere estimadores não-viesados para esses parâmetros, nós precisamos de duas hipóteses importantes. Primeira, que a esperança de "Épsilon" condicional a "x1" e "x2" é igual a 0, ou seja, o erro de medida da variável "proxy" é não-correlacionado com "x1" e "x2". E a esperança de "u" condicional a "x1", "x2" e "x2 estrela" será igual a 0. Ou seja, para que "x2" se torne irrelevante nessa equação, nós temos que incluir tanto "x1" quanto "x2 estrela". Com essas hipóteses, nós podemos estimar o modelo verdadeiro transformado consistentemente usando o estimador de MQO. Nós temos, aqui, um exemplo dessa equação entre salários, educação e habilidade usando dados do estudo do Edivaldo Neves Júnior. Nesse estudo, esse aluno de doutorado propôs um conjunto de habilidades com base no tipo de ocupação dos indivíduos. Ou seja, como não observamos as habilidades dos indivíduos, ele calculou três indicadores de habilidades motoras, sociais e cognitivas com base na ocupação de cada indivíduo. Assim, poderíamos utilizar essas três variáveis como variáveis "proxy" de habilidade. Aqui, é interessante notar que a estimação sem essas variáveis e com essas variáveis, reduz bastante o efeito de educação sobre salários, o que faz bastante sentido, pois o sinal do viés, aqui, era positivo, pois, quando não incluímos a habilidade no nosso modelo, nós estamos pegando o efeito de educação e o efeito da correlação positiva entre educação e habilidade. [MÚSICA] [MÚSICA] [MÚSICA]