[MÚSICA] [SEM_ÁUDIO] Olá. Retomando módulo 'Inferindo Propriedades e Características de uma População', nós iremos hoje praticar nessa vídeo aula a estimação de uma equação de regressão. Nós faremos isso Stata. Os dados para esse exercício estão aqui nessa planilha Excel chamada Regressão Stata. Nosso roteiro, nós vamos primeiro abrir o Stata, depois nós vamos abrir o editor de dados do Stata, abrir a base de dados chamada Regressão Stata.xls, que na verdade é essa que nós já estamos com ela aberta. Nós teremos uma pequena etapa aqui no Excel. Nós devemos converter o separador de decimal para ponto, pois o Stata apenas reconhece número no formato de decimal ponto. Nós vamos então copiar os dados para o Stata e nós iremos rodar duas agressões. Uma delas o efeito de display venda. Então existe uma causalidade que a gente está testando aqui de que quanto mais display maior a venda. E nós vamos também incluir outras variáveis para verificar o efeito vendas. Muito bem, nessa planilha Excel nós temos três guias. Uma delas é roteiro, a outra trata pouco mais dos detalhes dos dados e a outra é a base de dados propriamente dita. Que dados são esses que nós estamos utilizando? São os dados de uma agência de trade marketing que tem interesse testar essas ações no ponto de venda. Foram coletados 594 respostas de respondentes, dadas as vendas Reais por semana para aquele respondente, os displays com diferentes números de frentes de produtos a atitude com relação a marca, que é uma média de dois itens numa escala Likert de a sete, a renda do domicílio do respondente reais e o desconto oferecido pelo principal concorrente daquela marca. E a variável captura a diferença de preço Reais. Chamo a atenção para instrumento que nós utilizamos para capturar a atitude, basicamente dois itens, duas questões. Eu gosto do produto oferecido por essa marca e eu prefiro os produtos dessa marca. O respondente então responde 'discordo totalmente quando é o concordo totalmente quando é sete. É uma escala Likert. Nós vimos isso na vídeo aula sobre escalas. Uma escala intervalar muito utilizada marketing. Nosso banco de dados, cinco colunas, cada uma delas com os dados dessa pesquisa. Chamo a atenção então para a questão do separador decimal, que é vírgula. Para a gente converter os dados para Stata nós temos então que fazer uma pequena alteração no Excel. A gente vem aqui no menu Arquivo, Opções, Opções a gente olha no Avançado, Usar separadores do sistema, essa caixinha deve estar sem o tick e a gente tem que colocar o separador decimal aqui ponto. Eu dou OK. A partir de agora então a gente tem os dados, onde era antes apresentado vírgula agora está com o ponto. O que eu faço então é marcar os dados para que eu possa trazê-lo ela para o Stata. Eu tiro do Excel e vou para o Stata. Eu clico no Stata duas vezes, ele inicia o programa, eu venho aqui no editor de dados, abro essa janela e eu copio os dados para o Stata. Muito bem. Tem uma pergunta aqui que é muito importante responder de maneira adequada. Está me perguntando se a primeira linha da minha base de dados se refere aos nomes ou rótulos dados aos dados. E eu tenho que falar que sim, é para tratar essa primeira linha como nome de variáveis. Eu clico aqui cima e ele já copia os dados com os rótulos, assim como eu tinha no Excel. Muito bem. Agora que os dados já estão no Stata e que eu posso utilizá-los, as variáveis elas aparecem aqui para mim nessa janela, o que a gente vai fazer no menu Estatística, modelos lineares, regressão linear. Eu clico regressão linear, ele me apresenta uma janela que solicita a variável dependente e a gente quer justamente testar o efeito de display vendas. Então nossa variável dependente é vendas e a nossa variável independente display. Aí a gente clica no Ok e volta para nossa janela dos resultados e o que a gente consegue observar, o r quadrado ajustado muito próximo de ponto dez, marketing esse é r ajustado aceitável, a gente pode ir frente e analisar os coeficientes. E aí tem efeito de display vendas, coeficiente de 11.24, a constante 206, ou seja, onde toca o eixo Y, e a parte mais importante é esse p valor. O que mostra para mim p valor menor que 5%, ou seja, esse coeficiente de display positivo ele é significativo. O efeito de display venda é significativo. Quanto mais frentes do meu produto eu tenho nesse display, maior é a venda. Muito bem. Uma outra forma que eu também posso estimar a equação de regressão, é simplesmente escrever o comando de regressão que é Regress, eu escolho a variável que é a minha variável dependente, e nesse caso a ordem das variáveis é muito importante, a primeira variável após a linha de comando é a variável dependente. E aí eu coloco as variáveis explicativas. No caso aqui nós estamos rodando apenas com display e os resultados são apresentados aqui na janela de resultados. A gente pode, então, testar o efeito de outras variáveis vendas. Então o que eu vou fazer, eu vou no menu, primeiro pelo menu Suspenso eu vou lá Estatística, modelo linear, regressão linear. Como eu já fiz uma primeira estimação ele registrou aqui manteve o venda como variável dependente e o display como variável independente. O que eu pretendo agora é verificar se display, e o que eu quero é que saia nessa ordem, display atitude, renda e o desconto do concorrente. Então eu vou verificar qual o efeito de display, atitude, renda e desconto no concorrente o efeito desse conjunto de variáveis venda. Eu clico no Ok e o que eu tenho aqui o r quadrado ajustado, ponto 15, aumenta relação a equação anterior que dava ponto 10. Isso significa que eu inclui algumas variáveis porque elas são importantes no modelo. essa equação contendo essas quatro variáveis explicativas ela tem poder maior do que aquela equação que contém apenas display e o que eu consigo observar é que a variável display e atitude elas têm efeito significativo venda, ambas são positivas. Então quanto maior é a atitude com relação a marca daquele respondente, maior é a venda. Quanto maior o número de produtos expostos naquele display maior é a venda também. Nós incluímos uma variável demográfica de renda. A variável demográfica de renda, o coeficiente é muito próximo de zero. Apesar de ter dado negativo é muito próximo de zero e o efeito, o p-valor aqui ele é maior do que 5%, portanto renda não afeta significativamente venda. E o desconto do concorrente, esse diferente do renda, o coeficiente ele já é diferente de zero e ele é negativo, porém, também não é significativo. Então o que explica a venda dessa nossa pesquisa, apenas display e atitude. Eu também poderia simplesmente escrever na linha de comando o comando Regress. Eu identifico minha variável dependente como a primeira delas, display, atitude, renda e desconto no concorrente com as variáveis que eu vou testar com explicativas do modelo. Assim como eu fiz pelo menu eu posso fazer pela linha de comando e os resultados aparecem aqui. Uma coisa que pode ser muito útil é utilizar esses dados Excel. Então para a gente utilizar esses dados transferidos para o Excel, marca área que você pretende copiar, copia ela como tabela, abre o Excel numa nova guia e cola os seus dados. O que acontece é que a formatação não é das melhores. Por outro lado, os dados estão aqui para a gente poder utilizar e consultar quando nós quisermos. Então aqui mostra o p valor significativo nessas duas variáveis afetam significativamente vendas e eu tenho esses dados aqui de forma que eu posso trabalhar a hora que a gente quiser. Esse foi o vídeo de regressão. Utilizamos o Stata. Convido vocês a continuarem no módulo inferindo propriedades e características de uma população. Espero vocês no próximos vídeos. Até lá [SEM_ÁUDIO]