[MÚSICA] [MÚSICA] [MÚSICA] Nesta aula, nós veremos uma alternativa ao relaxamento da hipótese de homocedasticidade. Na aula anterior, vimos que podemos manter o estimador de MQO e, simplesmente, recalcular o estimador da variância usando a ideia de White. Nesta aula, nós vamos propor um novo estimador, alternativo ao estimador de mínimos quadrados ordinários, de forma que este novo estimador tenha todas as propriedades desejáveis, ou seja, seja não-viesado e seja o estimador mais eficiente dentre todos os lineares não-viesados (esse conceito é o que chamamos de BLUE). Para isso, vamos retomar o nosso modelo sob as hipóteses de 1 a 4. Nós temos, aqui, o nosso modelo linear, em que "y" é igual a "x" "Beta" mais "u", e a matriz de variância-covariância dos erros condicionais a "x" vai ser igual a uma matriz "Ômega", ou uma função "h" de "x", que não é mais um "Sigma 2" vezes a identidade constante. Então, a variância para cada observação, a qual chamamos de "Sigma 2i", vai ser igual a um "h" de "xi", ou, para simplificar, podemos chamar de um "h" com subscrito "i". A raiz desse termo é exatamente o desvio-padrão de cada observação. Se o nosso modelo é heterocedástico (ou seja, a variância de "ui" dado o "x" vai ser igual a "h" de "i"), para transformarmos essa variância em uma constante, bastaria dividirmos o nosso termo "ui" pela raiz de "hi". Como a variância de "ui" é igual à esperança de "ui" ao quadrado, se aplicarmos esse conceito no nosso "ui estrela" (que vai ser o "ui" dividido pela raiz de "hi"), nós temos que a variância de "ui estrela" vai ser igual à variância de "ui" dado "x" dividido por "hi", ou seja, "hi" dividido por "hi", que vai ser igual a 1, constante para todas as observações. Isso significa que, se transformarmos o nosso modelo dividindo todos os elementos pela raiz de "hi", nós recuperaremos a hipótese de homocedasticidade sobre o "u estrela". O nosso modelo de regressão múltipla fica, então, "yi" dividido pela raiz de "hi", que vai ser igual a 1 sobre raiz de "hi" vezes "Beta 0" mais "x1i" dividido pela raiz de "hi" vezes "Beta 1" mais todos os elementos até "xik" dividido pela raiz de "hi" vezes "Beta k" mais "ui" dividido pela raiz de "hi". Chamaremos os termos divididos por raiz de "hi" pelo mesmo nome do termo original, só que, agora, com asterisco. Agora, nós precisamos definir o termo que acompanha o "Beta zero" (que não será mais 1, mas sim 1 sobre a raiz de "hi"): chamaremos esse termo de "x0 estrela". Para esse modelo transformado, nós temos que a hipótese de homocedasticidade será válida, e que os "Betas" aqui estimados dessa forma, mantêm a interpretação usual. O estimador de mínimos quadrados aplicado a esse modelo transformado é o que chamamos de estimador de "Mínimos Quadrados Generalizados". Assim, nós temos que o estimador de MQG, ou seja, de mínimos quadrados generalizados, será o resultado da otimização da soma dos quadrados dos resíduos dividido pelo "hi". Veja, na verdade, que o mínimos quadrado ordinários é caso particular do estimador de mínimos quadrados generalizados, quando o "hi" é igual a 1 para todas as observações. Esse estimador de mínimos quadrados generalizados vai resgatar todas as hipóteses do teorema de Gauss-Markov, ou seja, as hipóteses de 1 a 5. Esse estimador, então, será, além de não-viesado, o estimador de menor variância dentre todos os demais estimadores lineares não-viesados. Nesse slide, nós vamos ver um exemplo de um caso de heterocedasticidade que é bastante comum de observarmos na prática quando temos um modelo individual. Ou seja, suponha que tenhamos o exemplo de um modelo de demanda individual e que estamos interessados em analisar o efeito de um aumento do preço sobre a quantidade demandada dos indivíduos. Suponha que tenhamos um modelo de demanda individual, em que temos hipóteses sobre a elasticidades dos consumidores de determinado produto. Assim, a nossa unidade de interesse "izinho" representa os consumidores de determinada região para aquele produto. Mas imagine que não conseguimos obter dados dos consumidores daquela região, mas, sim, apenas dados agregados dos bairros que compõem aquela região. Chamaremos essa unidade de medida de "j", ou seja, "i" são os nossos indivíduos e "j" são os bairros nos quais esses indivíduos moram. Como temos dados agregados para os bairros, o que observamos, na verdade, é uma média amostral daqueles consumidores daquele bairro. Assim, o "xj" vai ser a média amostral dos indivíduos que residem ali naquela região, dividido pelo total de indivíduos da região. Se a hipótese de homocedasticidade é válida para o modelo individual, ou seja, a variância de "ui" dado "x" é igual a um "Sigma 2" para todas as observações "i", nós temos que a variância de "uj" condicional a "xj", ou seja, a variância dos fatores não observados daquela região, vai ser igual a um "Sigma 2" dividido por "nj", que é o número de indivíduos daquela região. Note que, a depender da quantidade de indivíduos em cada bairro, essa variância não será constante entre as observações "j". Ou seja, nós temos um modelo no nível dos indivíduos, dos consumidores, em que as hipóteses são válidas, mas, por conta na natureza dos dados que coletamos, nós temos um problema de heterocedasticidade. Assim, como vimos, nós podemos calcular o estimador de mínimos quadrados generalizados ponderando aqui por "hj", que vai ser, exatamente, 1 sobre "nj". Essa correção vai restabelecer as hipóteses de Gauss-Markov e teremos um estimador de mínimos quadrados generalizados com boas propriedades e, portanto, representado um efeito causal entre as variáveis explicativas e o nosso "y". Esse é um dos casos em que conhecemos o "hj" do nosso modelo. Mas, em geral, nós não conhecemos a natureza de heterocedasticidade do nosso modelo. Nesse caso, nós podemos propor um estimador de "Mínimos Quadrados Generalizados Factíveis", ou MQGF. A ideia desse estimador é propor uma forma funcional para o nosso "hi", ou seja, "h" de xi" e, a partir dessa forma funcional, estimar esse peso que deve ser imputado no modelo para transformá-lo. Como a variância de "u" dado "x" deve ser sempre constante, nós podemos propor a seguinte forma funcional: variância de "u" dado "x" (que vai ser igual à esperança de "u" ao quadrado dado "x"), igual a "Sigma 2" vezes o exponencial de uma função linear "x". Esse termo do exponencial da função linear de "x" é o que chamamos de "h" de "x". Assim, para encontrar o estimador de "h" de "x", nós precisaríamos estimar todos esses termos "Deltas" que estão mostrados nessa equação. A partir dessa forma funcional que estamos propondo para essa relação, nós podemos passar o logaritmo e, então, estimar todos esses termos. Substituímos o nosso "u" pelos resíduos de MQO (que são bons resíduos, pois sabemos que o estimador de MQO continua não-viesado, mesmo sem termos a hipótese de homocedasticidade) e, a partir, então, do "ln" dos resíduos ao quadrado, podemos fazer a regressão desse termo contra todas as variávies explicativas do modelo, de forma a compor o nosso "h chapéu" de "i". Esse estimador com base em "h chapéu" tem boas propriedade assintóticas; no entanto, não tem as mesmas boas propriedades do estimador MQG. Assim, o estimador de MQG será sempre melhor do que o estimador de MQGF, pois ele tem excelentes propriedades para amostras finitas; é não viesado e tem a variância mínima dentre os estimadores lineares não viesados. No entanto, o desconhecimento de "hi" pode levar à impossibilidade de usar o estimador de MQG, sendo, então, o estimador de mínimos quadrados gerais factíveis uma solução importante. Para realizar testes de hipóteses conjuntas sob heterocedasticidade, basta aplicarmos esses pesos "hi" sobre os modelos restrito e irrestrito. Assim, podemos calcular a estatística "F" da forma como fizemos anteriormente, e ela terá a mesma convergência na distribuição "F" de Fisher. Note que, se estimarmos "h chapéu" da forma errada, nós ainda teremos um estimador de MQGF consistente, mas sabemos que o nosso estimador de MQO continua não-viesado, então, ele seria preferível a um estimador com o "hi chapéu" errado. Nesse slide, vemos um exemplo bastante conhecido de heterocedasticidade, em que podemos estimar "hi", sendo que conhecemos o quanto ele depende de "x". Esse é o caso do modelo de probabilidade linear, que vimos no módulo sobre variáveis "dummy", ou seja, quando "y" é uma variável binária. Como a variância de "y" condicional a "x" é igual à probabilidade de "y" igual a 1 dado "x" vezes 1 menos a probabilidade de "y" ser igual a 1 dado "x", nós temos que o nosso "h chapéu i" vai ser igual ao "y chapéu i" vezes 1 menos "y chapéu i". Ou seja, se fizermos a poderação utilizando esse "h chapéu", nós temos o estimador de mínimos quadrados gerais factíveis. No entanto, note que, se "y chapéu" é menor que 0 ou maior que 1, nós não podemos efetuar essa estimação. [MÚSICA] [MÚSICA] [MÚSICA]