[MÚSICA] [MÚSICA] Olá. Abrindo o módulo "Inferindo propriedades e características de uma população", eu gostaria de tratar da lição sobre teste de hipóteses nessa videoaula. Para a gente entender pouco melhor a questão do teste de hipótese, eu gostaria que vocês pensassem exemplo muito prático. Imaginem se vocês tivessem que testar se uma fábrica de fósforos está entregando fósforos que realmente acendem. Como inferir sobre a qualidade dos fósforos? Nós poderíamos, simplesmente, ao final de cada dia, testar cada dos fósforos. O problema é que nesse caso específico do fósforo, se eu testar o fósforo, eu não consigo ter produto para colocar no mercado, porque, afinal, o fósforo já estará usado. Como é que a gente endereça esse problema? E é nessa hora que o marketing analítico consegue emprestar de vários conceitos de estatística que permitem a gente endereçar esse problema de maneira adequada. A primeira coisa que a gente tem que pensar é que não precisamos testar todos os fósforos, ou seja, eu não preciso endereçar toda a população. Eu posso, simplesmente, retirar uma amostra dessa população, de maneira aleatória, e fazer o teste nessa amostra. Inferir sobre a qualidade da população com base na amostra. Desta forma, se a amostra for de, por exemplo, 10%, eu ainda tenho 90% da minha produção para colocar no mercado. E eu consigo ter uma informação valiosa da qualidade dos meus produtos. Como é que a gente faz isso na prática? Existem, então, alguns conceitos importantes que a gente tem que aprender para poder inferir sobre a amostra. Alguns dos tópicos dessa videoaula, o primeiro deles, sermos capazes de desenvolver hipóteses; capazes de retirar uma amostra de uma população; fazer teste de significância inferindo sobre a probabilidade dessa hipótese com base na amostra, que nos permite inferir sobre a população; aprender pouco do que vem a ser o P-valor, o 'p' de probabilidade; e, também, como eu poderia tomar decisões dado essas análises que eu faço sobre a minha amostra. Hipóteses. O que seriam hipóteses? Eu posso, por exemplo, pensar a respeito de vendas. Então, será que promoção que eu faço no ponto de venda afeta as vendas do meu produto? Eu tenho que pensar no teste formal de hipóteses? Basicamente, duas hipóteses, que são conhecidas como H0 e H1. H0 é conhecida como hipótese nula. Essa hipótese nula nos informa sobre o status Quo. Ela vai de alguma forma nos informar sobre a igualdade da relação entre as duas variáveis que estão sendo testadas. A minha hipótese alternativa, no caso, por exemplo, de satisfação de cliente, é que a satisfação de cliente varia dada a comunicação, por exemplo, a propaganda que eu fiz na TV. A minha hipótese nula seria que, justamente, a satisfação do cliente não varia dada a ação que eu fiz de promoção. Eu sempre buscarei verificar, no teste de hipótese, hipótese alternativa. E eu comparo essa hipótese alternativa a H0, que é a minha hipótese nula. É dessa forma que eu conseguirei inferir, de maneira estatística, o nível de significância do efeito que eu estou testando. No caso é a quantidade de fósforos que acende, satisfação sendo afetada pela comunicação, vendas sendo afetadas por alguma promoção que eu fiz no ponto de venda. A inferência estatística acaba acontecendo a partir da amostra, ou seja, com base na amostra, busca-se compreender sobre a população. Algo importante com relação ao teste de hipótese que, por frequência, a gente escuta por aí a utilização de termos incorretos no teste de hipótese. Eu chamo atenção para o fato de que nós não conseguimos provar a hipótese nula, ou alternativa. O nosso teste de hipótese busca, justamente, rejeitar a hipótese nula e aceitar a hipótese alternativa. Essa terminologia é bastante importante uma vez que temos que endereçar as conclusões com pouco de cuidado, uma vez que existem erros. O que nós vamos também abordar nessa videoaula. Gostaria também de chamar atenção para a questão da amostra. A amostra é uma quantidade de indivíduos, por exemplo, respondentes com relação à satisfação, que é representativa da população. É muito importante que essa amostra seja coletada de maneira aleatória, pois assim a gente incorpora o erro de maneira aleatória também. A amostra serve como base para a estimativa de diversos parâmetros; parâmetros como esse, por exemplo, médias, medianas, mesma proporção, desvio padrão. E essa amostra vai nos ajudar, também, na hora que precisarmos, por exemplo, inferir sobre associação, por exemplo, correlação, tema de uma lição deste módulo. Ou mesmo regressão, outro tema que será abordado nesse módulo também. Então, a amostra permite, no limite, que o fabricante de fósforos não fique no final do dia sem fósforos pelo simples fato que ele quer testar a qualidade daquele produto que ele vai colocar no mercado. Se tratando de significância, o que a gente busca é alguma chance, ou seja, a probabilidade, alguma chance de rejeitar a hipótese nula. No caso de vendas, é que a promoção que eu fiz não afeta vendas. Eu quero rejeitar esse tipo de hipótese. A hipótese que eu quero endereçar é, justamente, a hipótese alternativa de que mais promoção leva a mais venda. E isso nos permite, então, calcular, no teste de significância, o que é conhecido como Alfa. Esse Alfa nada mais é do que a probabilidade dado alguns níveis de significância, que varia de 1%, 5% ou 10%, dependendo do nível de rigor que você buscar na hora de tirar as conclusões. Esse 'p-valor', 1%, 5%, 10%, ele é calculado a partir da amostra, dado os parâmetros que estão sendo utilizados para aquele estudo. Eu posso então usar o 'p-valor' calculado com teste de 't', de 'student', que é o mais comum utilizado análises de correlação e regressão. Existem outros testes que nós veremos oportunamente, mas aqui nós estaremos utilizando o 't', que é o mais, comumente, utilizado testes de hipóteses. A decisão que eu tomo é, basicamente, se o 'p-valor' for menor do que o nível de significância, eu vou ser capaz de informar que a probabilidade de rejeitar a nossa hipótese nula é válida. Sendo que a hipótese nula é menor do que aquela definida pelo nível aceitável. Se o 'p-valor' for menor que o nível de significância 1%, 5%, 10%, a gente pode inferir que promoção afeta, significativamente, vendas. Se o 'p-valor' for maior que o nível de significância, 1%, 5% ou 10%, a probabilidade de se rejeitar H0 é maior e aí a gente acaba não conseguindo inferir de maneira estatística, significante, que promoção afeta vendas. Esses 'p' valores são estimados como nós vamos ver uma videoaula específica de estimação de, por exemplo, correlação, de parâmetros de correlação, ou de regressão, pelo próprio software estatístico. Com base nesse 'p-valor', nós vamos inferir se aquele parâmetro, ou aquela variável, afeta de maneira, significativamente, aquela variável de resposta, ou seja, se promoção afeta vendas. [SEM_ÁUDIO]