[MÚSICA] Olá, retomando o módulo Inferindo Propriedades e Características de uma População, eu gostaria de discutir com vocês a questão da correlação. Essa lição, nós vamos concentrar na importância que a correlação tem para marketing. Marketing, existe grande impacto prático de caráter exploratório que nós podemos utilizar essa técnica afim de entender pouco melhor, por exemplo, se algum esforço de vendas, no ponto de venda, surtiu efeito vendas. Por exemplo, se o preço colocado no produto afetou a propensão dos indivíduos a comprar o produto. Por exemplo, se a ação que eu fiz de propaganda na TV afetou a atitude com relação a minha marca, ou mesmo afetou a disposição deles de comprar o produto. Então, para marketing, correlação é algo super importante. Nesse momento, estamos mais preocupados identificar a associação entre variáveis. Ainda não entraremos no tópico sobre causalidade. Aqui nós queremos justamente verificar se existe a relação entre duas variáveis. E, para marketing, isso é bastante importante. Correlação, nós estaremos fazendo uma análise bidimensional. Qual que é o objetivo da análise bidimensional? É encontrar associação e relação entre variáveis e essas relações, elas podem ser identificadas por meio de gráficos ou mesmo medidas numéricas, o que facilita bastante a vida do profissional de marketing, que precisa endereçar problemas que envolvem orçamento, custo e envolve resultados, compra ou não de produtos. Vale frisar que a associação está relacionada a mudança de opinião sobre o comportamento de uma variável na presença de informação de uma outra variável. Então, no caso, quando eu chamo de variáveis, assim como eu falei para vocês, existem exemplos de consumo de produto e desconto que eu ofereço naquele produto naquele ponto de venda numa determinada época do tempo. A associação entre duas variáveis quantitativas, ela pode ser analisada com base num gráfico que é conhecido como gráfico de dispersão ou também como diagrama de dispersão. Esse é recurso gráfico, visual, bastante poderoso que nos permite visualizar o comportamento do conjunto de duas variáveis. Apresentações que você precisa fazer relacionadas variáveis diretamente ligadas a marketing, o diagrama de dispersão já permite a gente inferir sobre a associação dessas duas variáveis, como elas se comportam. Existe também uma outra forma de medir a associação entre duas variáveis que é justamente o coeficiente de correlação linear. O coeficiente de correlação linear, ele mede a intensidade da associação entre duas variáveis. Essa questão da intensidade é bastante importante porque complementa a nossa análise do diagrama de dispersão, nos informando com pouquinho mais de precisão se a associação é positiva ou negativa, por exemplo, ou, inclusive, utilizando de algum teste de hipótese, como a gente viu na lição de teste de hipótese, para informar se essa correlação é ou não significativa. Então, vamos primeiro para o gráfico de dispersão. Como a gente pode ver no gráfico de dispersão, existe aí no eixo y as vendas milhares de Reais. E no eixo x, o impacto de promoção. Então, quantos dias eu ofereci desconto daquele produto, naquele ponto de venda, naquela determinada região. Qual é a associação que existe desses dias de promoção com a venda. Será que o consumidor se sensibilizou mais com relação ao produto ou não? Nesse momento é interessante a gente observar que os pontos caminham na direção do quadrante superior direito. Com base no gráfico de dispersão, eu já consigo observar a associação positiva entre vendas e o impacto da promoção dias. Visualmente, a gente consegue perceber que os pontos caminham na direção do quadrante superior direito. Com base no diagrama de dispersão, a gente consegue já inferir o tipo de associação que existe entre as variáveis. Nós estamos vendo vendas e intensidade de promoção. Basicamente, o diagrama vai nos informar se existe uma associação positiva, negativa ou se não existe associação. Então, esse primeiro gráfico mostra para a gente de maneira bastante clara uma tendência de crescimento. Então, quanto maior a promoção, maior vendas. Então, os pontos estão dispersos de forma a eu inclusive ser capaz de traçar uma linha de tendência que vai do zero até o canto superior direito do gráfico. Quando os pontos se comportam dessa forma no gráfico, eu posso afirmar que existe uma associação positiva. E, por hora, eu só afirmaria que existe uma associação positiva. Eu não consigo ainda inferir qual a intensidade dessa associação positiva e se ela é significativa ou não. Outro comportamento que existe de associação entre duas variáveis é justamente a inversa, a associação negativa. Então, se eu olhar no próximo gráfico, os pontos estão dispersos de forma a eu conseguir traçar uma curva de tendência que vai do topo superior esquerdo para o canto inferior direito. Então, de forma que essas duas variáveis, por exemplo, se eu aumentar preço, o que vai acontecer com vendas. Aumentando o preço, vendas vai cair. E aí, finalmente, uma terceira inferência que eu tiro desse diagrama de dispersão, é quando, na verdade, eu não consigo afirmar que existe uma associação entre eles. E esse gráfico, ele mostra claramente que se eu aumentar ou diminuir essa ação, as vendas reagem de maneira talvez até aleatória, sem padrão definido. Agora que nós somos capazes de entender como os diagramas de dispersão se comportam, é interessante nós aprendermos como calcular coeficiente, que vai nos informar a intensidade e vai permitir, inclusive, a fazer teste de hipótese cima dessa intensidade. O coeficiente de correlação linear, ele, basicamente, leva consideração a covariância de duas variáveis, assim como a gente pode ver na fórmula, dividida pelo produto do desvio padrão dessas duas variáveis. Muito bem, grande parte dos pacotes hoje de software estatísticos e até Excel, eles já calculam isso para nós. A gente não precisa calcular isso na mão, como no passado a gente precisava. O que eu gotaria que você tivesse uma boa noção é de como esse coeficiente varia. Então, o coeficiente que é conhecido numa notação estatística como o "r" minúsculo, ele varia de menos a onde se ele estiver próximo do zero, é como aquele gráfico que nós vimos de dispersão onde não havia associação. Os pontos estarão dispersos no gráfico e a correlação no final seria muito próxima de zero. Essa medida de associação linear entre duas variáveis pode também nos informar coeficiente próximo de positivo. Isso nos indica que a correlação entre essas duas variáveis, ou seja, a associação bilateral ela é positiva. Agora, esse coeficiente pode também nos informar número próximo de menos ou seja, negativo. E aí o que eu posso inferir é que a associação entre essas duas variáveis é negativa. Como a gente viu no exemplo do diagrama de dispersão, onde o aumento de preço acabava levando a uma queda de vendas e uma diminuição de preço acaba levando aumento de vendas. Uma vez que nós entendemos como correlação funciona, eu convido vocês a assistir vídeo que é TED Talk de uma professora de estatística que endereça justamente esse tema que estamos vendo nessa videoaula. E, após assistir esse vídeo, volte para a próxima videoaula que vai, de maneira bem direta e curta, endereçar os riscos de correlação espúrias, ou seja, associações não diretas entre duas variáveis. Espero vocês no próximo vídeo. [ÁUDIO_EM_BRANCO]