[MÚSICA] Dando continuidade ao módulo Inferindo Propriedades e Características de uma População eu gostaria de aprofundar pouco mais na lição de análise de regrassão. O que eu gostaria de fazer com você agora é uma aplicação prática dos conceitos que nós vimos na vídeo aula anterior. Então, imagina problema prático que anunciante contrata uma agência de trade marketing e tem interesse realizar algumas ações no ponto de vendas. Muito bem, e eu como profissional de marketing eu tenho que garantir que essas ações dêem resultados e o que eu posso de repente ao invés de me engajar nessa ação diretamente eu mil pontos de vendas que eu posso ter no meu portifólio de varejos de pontos de vendas. Eu posso selecionar alguns poucos pontos de venda e inserir o display nesses pontos de vendas e acompanhar vendas. Muito bem, eu posso inclusive fazer algumas variações nos displays. Displays que contém mais produtos e displays que contém menos produtos. Poderia também fazer de outras formas pensando cores do display, localização, coisas dessa natureza, que são bem práticas possíveis de se mensurar e de avaliar o impacto no resultado. E a que resultado nós vamos medir o tanto de produto que foi vendido naquela naquele ponto de venda, naquela janela de tempo? Dada as diferenças de displays que foram utilizados. Nós vamos medir também algumas outras variáveis para que a gente possa ter uma análise pouquinho mais profunda a respeito dos efeitos que levam os fatores possíveis que afetam vendas. Muito bem. Então, fomos a campo, coletamos as vendas junto com o varejista. Fomos lá e acompanhamos lá a quantidade de produtos que foram vendidos. Garantimos uma boa medida de quantidade de produtos que foram expostos e registramos isso ao longo de algumas semanas. Voltamos para o escritório, e trabalhamos esses dados. Então nós estamos basicamente como nós vimos na vídeo aula de análise de regressão uma variável y que é vendas, e uma variável x que nada mais é do que a quantidade de produtos que eu consegui colocar naquele display. Muito bem. O que eu faço então eu uso essas duas variáveis para estimar a minha equação conhecida como equação de regrassão. Como nós vimos na vídeo aula passada nós vamos estimar os parâmetros a e b. O a que é a constante, e o b que nada mais é do que o coeficiente atrelado a esse display. Ou seja, essa minha variável que explica vendas. A primeira análise que a gente consegue fazer o diagrama de dispersão. Nós vimos na vídeo aula de correlação a importância do diagrama de dispersão que já nos dá uma ideia de associação entre as variáveis. Então, o diagrama de dispersão ele mostra os pontos as observações que eu coloquei no campo. Linhas gerais eu poderia dizer que existe efeito de display vendas. Agora como é que eu consigo, eu poderia simplesmente calcular o coeficiente de correlação. Como é que eu consigo informar sobre causalidade? Que é justamente o poder da análise de regressão. O que eu faço eu vou a pacote estatístico. Eu posso usar tanto o Stata quanto inclusive o Microsoft Excel. Para rodar essa análise. E o que eu vou fazer eu vou informar que vendas é o meu y, é a minha variável resposta, e display é a minha variável de explicativa. Que é aquela que afeta vendas. Muito bem. Tem alguns indicadores antes da gente olhar o coeficiente e o p valor que são importantes da gente são importantes da gente observar. Deles é o r quadrado. O r quadrado como a gente viu na vídeo aula anterior ele informa o poder de explicação daquela variável que está sendo utilizada no modelo. O r quadrado ajustado ele nos informa o quanto que aquele conjunto de variáveis explicam aquela variável de resposta ponderando para o número de variáveis que estão sendo utilizadas no modelo. Nesse primeiro modelo nós estamos rodando simplesmente a ação de display vendas. Então, existe apenas uma variável. O r quadrado ajustado acaba sendo muito parecido com o r quadrado. O r quadrado elevado me ajuda a inferir que o conjunto de variáveis explicativas elas afetam a variável dependente. São as mais importantes de estarem consideradas no modelo. Para a gente ter uma noção, o que está de fora do r quadrado, aquilo que a gente não conseguiu atingir o é dado ao erro, a algum efeito que eu não fui capaz de observar. Muito bem, uma vez analisado o r quadrado é importante verificar o teste de probabilidade desse r quadrado. Se ele é ou não significativo. Que é justamente a probabilidade de f que me informa sobre esse coeficiente do r quadrado. E ele no nosso caso aqui ele é significativo. Muito bem. Uma vez eu olhei a equação como todo, eu vou e analiso a variável display. E na tabela ela me informa o coeficiente o efeito de display vendas e a parte mais importante o p valor. Recordando a vídeo aula de Teste de Hipóteses esse é o p valor que ajuda a gente a rejeitar a hipótese nula. No caso aqui nós temos p valor menor que 1%. Isso me informa que display afeta significativamente vendas. Isso é bastante importante porque se a variável estimada ela não for significativa a gente não pode tirar qualquer tipo de conclusão sobre o efeito dessa variável na variável explicativa. No caso aqui então, display afeta significativamente vendas e o coeficiente dele é positivo. Então quanto menos maior o número de produtos eu coloco nesse display, maior a minha venda. Aqui eu estaria, eu estarei utilizando o teste bicaudal. Na verdade, a gente considera que display ele inclusive ser prejudicial para as vendas. Não só positivo. Muito bem. Para a gente poder endereçar vendas de maneira adequada e análise de regressão múltipla nos permite incluir mais de uma variável explicativa toda a vez que o consumidor naquele ponto de venda passou pelo caixa, e levou o produto nós pedimos para ele responder uma escala de atitude com relação a marca. Essa escala variando de a sete foi também incluida no modelo. E aí o que a gente faz é na verdade colocar o y que é venda junto com o display que é uma das variáveis explicativas, ou seja o x, e a atitude com relação a marca. Eu rodo novamente a regressão estimo e vejo que o r quadrado saiu de 0.10 e foi para 0.17 mostrando o poder de explicação dessas duas variáveis que eu inclui no modelo. O teste de f para esse r quadrado também é significativo e o r ajustado mostra para mim inclusive que atitude é uma variável muito importante se considerar quando nós estamos estudando o comportamento de vendas. então mostra que aumentou o R quadrado pelo fato de termos colocados essa variável importante que é a atitude com relação à marca. Assim como o display, a atitude também tem coeficiente positivo e pelo p-valor, eu consigo também informar que a atitude afeta, significativamente, vendas. Para tornar a análise ainda mais completa, quando os consumidores passaram pelo caixa nós pedimos para eles também informar a renda que eles possuem e utilizamos renda na análise do comportamento de venda. Aí dessa vez nós temos y que é vendas, nós temos x1 que é display, x2 que é atitude e x3 que é renda, uma outra variável contínua que a gente incluiu no modelo. Avaliando o r quadrado, nós aumentamos o r quadrado para 0,18 e o r quadrado ajustado para 0,17. Esse r quadrado é significativo, assim como o teste de F informa para a gente. O curioso e interessante é que, no caso de vendas desse produto dessa marca específica, renda não é efeito que contribui tanto para a venda do produto. De alguma forma, aparentemente, existe uma inelasticidade desse produto, inerente aí das características da marca, do tipo de produto e et cetera. O que nós podemos informar, com relação à renda, é que renda não afeta significativamente vendas. Renda é positivo, o coeficiente é positivo mas não é significativo. E aí para finalizar e tornar a nossa análise ainda mais profunda com relação às vendas dos produtos e o efeito do display, ou seja da ação que eu coloquei no mercado, eu também acompanhei o quanto que outros concorrentes fizeram de ações nessa mesma época. Então eu fui lá e medi o meu concorrente direto quantos produtos receberam algum tipo de promoção. Uma vez que eu incluo no modelo a promoção dos concorrentes, eu vou lá e analiso o r quadrado. O r quadrado ele saltou de 0,10, quando eu apenas utilizava display no, na análise, para 0,19, mostra ganho de poder de explicação desse conjunto de variáveis e ele tem r quadrado significativo também, pelo teste de F e, uma vez que eu vou e analiso o coeficiente de promoção dos concorrentes, ele é negativo, omo há de se esperar, não é? Então a promoção dos concorrentes afeta negativamente a venda dos meus produtos. Porém, esse coeficiente ele não foi significativo. Quando a gente olha o teste de hipótese da hipótese nula, o p-valor, ele é 0,14, significa ele é 14%, ele está acima de nível mínimo de rigor de significância que seria 10%. 14% mais alto que 10%, isso permite eu inferir que promoção por mais que ela afete negativamente, ela não é significativa no, nas vendas do meu produto. Aí eu convido você a olhar esses resultados com pouco mais de cuidado e endereçar algumas ações possíveis. Aqui certamente nós podemos voltar para o nosso departamento financeiro, ou para reportar internamente dentro da empresa, de que a ação de promoção, ou seja, essa ação de trade marketing que eu coloquei prática, ela surtiu efeito nessa amostra de pontos de venda e ela poderia ser ampliada para o número de pontos de venda que são utilizados pela, por essa marca, esse produto, essa empresa. Uma vez que display, o número de frentes que existe nesse display afeta de maneira positiva e significativa as vendas dos produtos. Eu convido você a olhar a videoaula que mostramos como essas análises são feitas utilizando tanto o Microsoft Excel quanto pacote estatístico, o STATA. [ÁUDIO_EM_BRANCO]