[MÚSICA] Olá dando continuidade ao módulo Inferindo Propriedades e Características de uma População, a lição de hoje será sobre análise de regressão. No início deste módulo nós aprendemos como realizar teste de hipóteses e interpretar coeficientes e o nível de significância desses coeficientes estimados. Na sequência, nós aprendemos também como funciona a correlação a associação entre variáveis. Nessa vídeo aula nós vamos endereçar a questão da causalidade. O quanto que uma variável leva a outra. Por exemplo, o quanto que promoção no ponto de venda leva a aumento de vendas verdadeira. Para a gente conseguir aprofundar análise de regressão, eu chamo atenção para essa representação gráfica. Nós temos ali uma ação no ponto de venda no eixo X e vendas no eixo Y. Essa ação no ponto de venda pode ser display, pode ser uma uma ilha, ou uma ponta de gôndola que porventura uma determinada marca você venha comprar. E vendas é o quanto de produto que foi alvo daquela ação foi vendido naquele período. Então pensando nos consumidores, será que existe alguma relação causal entre ação no ponto de venda e vendas? E como a gente viu na aula de correlação, aqui a dispersão dos dados nesse diagrama ele nos indica que existe uma relação positiva. Se a gente fosse apenas concentrar correlação, eu diria para vocês que nós temos aqui uma correlação positiva. Se a gente quer aprofundar e testar a hipótese de que a ação no ponto de venda afeta vendas, eu tenho que utilizar análise de regressão. Eu poderia inclusive ter aí uma curva de tendência que iria na direção ali do canto inferior esquerdo para o canto superior direito, mostrando que a minha ação foi deveras de sucesso, ou seja, afetou positivamente vendas. Na análise de regressão existem dois elementos bastante importantes de serem considerados logo no início. O primeiro deles é a variável dependente e o segundo deles é a variável independente. A variável dependente é aquela que é a resposta a algum determinado efeito. É aquela que a gente quer explicar o comportamento dela. A variável independente é a variável que explica essa variável de resposta, que pode ser qualquer tipo de fator, ou ação que eu coloque no mercado a fim de afetar essa variável de resposta. Então de lado eu tenho a variável independente, do outro eu tenho a variável dependente. O quanto que essa variável afeta essa outra. Basicamente é isso que a gente faz com análise de regressão. Eu tenho Y e eu tenho X e o que eu quero é cruzar e saber se essa variável X afeta a variável Y. Como é que a gente ajusta a reta? A gente viu lá que na dispersão dos dados, eventualmente a gente é capaz de traçar uma curva de tendência. Como é que a gente chega nessa curva de tendência? Basicamente nós vamos buscar construir uma equação onde y = a+bx. Muito bem, eu sei o que é y eu sei o que é x. Agora o que seriam a e b? a e b são parâmetros que são estimados dada a variação, o comportamento que existe entre essas duas variáveis, onde a nada mais é do que o intercepto onde essa curva de tendência toca o eixo Y e b é o coeficiente que nos informa a inclinação dessa curva. Então eu vou a campo, coleto os dados de y, coleto os dados de x. Com base nesses dados eu volto para o escritório e eu estimo esses parâmetros a e b. Muito bem. Se a gente pegasse exemplo básico de investimento comunicação, o efeito de investimento comunicação como a nossa variável independente afetando a receita vendas, uma variável de resposta, ou seja, dependente, eu posso coletar os dados e encontrar uma equação com os seguintes coeficientes. Nós temos lá parâmetro, ou seja, coeficiente estimado, que é onde a curva toca o intercepto que nesse caso aqui 60.05 e nós temos também uma ideia de inclinação dessa curva com base no coeficiente 1.36. Coeficiente este que é positivo. Isso significa que a tendência desta curva é uma tendência positiva. Os investimentos que eu faço comunicação afetam a minha receita vendas. O interessante é que a análise de regressão nos permite também inferir sobre o poder de explicação do conjunto de variáveis que eu coloco no modelo. Então no caso nós estamos considerando apenas investimento comunicação como variável x. Eu poderia ter outras variáveis que eu gostaria de testar ao mesmo tempo se afetam vendas. A medida conhecida como R quadrado, é uma medida que nos informa sobre o poder de explicação naquele conjunto de variáveis que eu utilizei num modelo. Significa que quanto mais variáveis, ou seja, fatores que afetam vendas, forem considerados na minha análise de regressão é esperado que o R quadrado, ou seja, o poder explicação desse conjunto de variáveis aumente. De posse da equação e os coeficientes estimados eu consigo já de cara fazer algumas inferências. Por exemplo, quanto seria a venda se eu não gastasse tostão com ação de comunicação? Dada a amostra os dados que eu coletei eu posso afirmar que as vendas seriam na casa de 60.05. Ou seja, se eu não gastar dinheiro com promoção existem outros fatores que estão afetando vendas e haveriam vendas. Muito bem. Que nada mais é do que o nosso coeficiente estimado a naquela equação onde y = a + bx. Muito bem. Uma outra inferência que eu sou capaz de fazer é que se eu variar uma unidade de investimento comunicação, seja lá qual for essa unidade, eu terei uma variação média de receitas de 1.36. 1.36 nada mais é como você pode bem observar, o nosso parâmetro estimado b. Então se eu variar uma unidade de comunicação eu consigo variar receita 1.36. Essas são inferências importantes de serem feitas logo no início porque já nos dá alguma ideia de como o mercado se comporta dada essas duas variáveis. Se eu fizer alguma ação de comunicação quanto é que eu vou conseguir vender. Muito bem. Quanto seria as vendas se o financeiro nos abordasse e pedisse para gastar menos? Eu convido vocês a pegar essa equação estimada e calcular a venda se o nosso investimento fosse na casa de R$ 600 mil. Muito bem, vocês tiveram a oportunidade de fazer a conta de qual seria a receita prevista dado a restrição de orçamento. A restrição de orçamento foi imposta R$ 600. O que a gente vai fazer agora é utilizar a equação que foi estimada com base na pesquisa que nos informa que o y, que é a nossa variável de resposta é igual ao a, que é o parâmetro 60.05, mais o b, que é o parâmetro do x, que é 1.36. O que a gente precisa fazer é justamente substituir o x por 600, multiplica por 1.36, soma de 60.05, e aí a gente tem uma receita prevista de 876,05. Com base nessa informação a gente pode voltar para o financeiro e eventualmente até pleitear orçamento mais elevado, uma vez que o mercado, a gente realizou a pesquisa, o mercado nos permite receber uma receita talvez até maior do que aquela prevista pelo pessoal da área financeira. Eu convido vocês agora a olhar a próxima vídeo aula, onde nós faremos uma aplicação prática dessa análise. Onde levaremos consideração não apenas uma variável, mas conjunto de variáveis que podem explicar, por exemplo, vendas. Incluindo, por exemplo, o preço ou a promoção que concorrente pode realizar ao mesmo tempo que nós estamos fazendo a nossa ação. [SEM_ÁUDIO]