[МУЗЫКА] [МУЗЫКА] Уважаемые слушатели, в данном уроке мы рассмотрим с вами однофакторный дисперсионный анализ в пакете Statistica. Рассматривать мы его будем на том же уже знакомом нам примере выручки одного небольшого магазина. Как вы помните, в этом случае у нас рассматривалось два фактора — день недели и бригада, которая работает. И выдвигаемые гипотезы были о том, что день недели может оказывать влияние на выручку, а также то, какая бригада работает, также может оказывать влияние на выручку. То есть у нас имеются предположительно два фактора, но в этом уроке мы рассмотрим пока влияние только одного из них. Остановимся на влиянии дня недели и рассмотрим однофакторный дисперсионный анализ. В пакете Statistica есть несколько вариантов реализовать этот анализ, если вы зайдете в блок Statistics, вы в третьей строке увидите ANOVA, ANalysis Of VAriance, то есть собственно основной дисперсионный анализ делается именно в этом пункте. Но когда речь идет об однофакторном дисперсионном анализе, это более простой вариант, и он также содержится в основных статистиках и таблицах. Давайте сейчас пока рассмотрим именно этот пункт. Заходим Basic Statistics/Tables, основные статистики таблицы, и в предложенном списке выберем Breakdown & one-way ANOVA, то есть однофакторный дисперсионный анализ, нас сейчас интересует именно вот этот пункт. Заходим сюда, нажимаем OK. Нам нужно задать переменные, в качестве зависимой переменной в данном случае у нас выступает количественная переменная — выручка магазина. И в качестве фактора мы выберем с вами день недели. Нажимаем OK. Также вы можете определить коды группирующих переменных. Мы сейчас хотим рассмотреть влияние всех семи уровней. Поэтому, нажав на эту клавишу, мы с вами выбираем все. Если вы ничего не нажмете, автоматически все уровни будут подставлены сюда, то есть, в принципе, это действие выполнять не обязательно. Нажимаем OK. У нас теперь здесь указано, что все значения были выбраны, и продолжаем анализ. В первом окошке у нас появляется краткая информация о том, что мы конкретно анализируем. То есть у нас одна зависимая переменная — выручка, группирующая переменная также одна, и это день. Но у нее имеется семь различных факторов: понедельник, вторник, среда, четверг, пятница, суббота и воскресенье. Обратите внимание на то, что уровни факторов могут задаваться качественно, то есть они не несут в себе никакой количественной информации, а являются только маркерами того, в какой конкретный день была получена соответствующая выручка. По значением данной переменной будут группироваться значения количественной переменной. Здесь можно остаться на вкладке быстрого анализа, можно перейти в более подробный раздел ANOVA и тесты, то есть дисперсионный анализ и тесты, связанные с ним. Основное, что нас интересует, — это проверка гипотезы о том, что средние значения при всех уровнях факторов равны. Эта проверка осуществляется по критерию Фишера, заходим в анализ дисперсии и видим основной результат дисперсионного анализа. Нас по большей части интересуют здесь два последних окна, то есть это значение статистики Фишера для сравнения дисперсий и значение p-value для соответствующей гипотезы. При уровне значимости 0,05 значение p-value у нас получилось существенно меньше, соответственно, нулевая гипотеза о равенстве средних для данных уровней отклоняется. То есть имеется существенное статистически значимое отличие. Для того чтобы посмотреть, как именно изменялось среднее, мы можем нажать на кнопку «Графика». Заходим сюда, и вот мы видим, как изменялось значение по дням недели. Как видим, так же, как мы получали это в других пакетах, для первых четырех дней недели средняя выручка примерно одинаковая, а к концу недели она начинает существенно возрастать. И в соответствии с тем анализом, который мы только что провели, и тем выводом, который мы получили, мы можем сделать вывод о том, что имеются статистически значимые изменения при переходе от рабочих дней к концу недели. Чтобы убедиться в правильности проведения нашего анализа, мы должны проверить, были ли выполнены у нас предпосылки проведения дисперсионного анализа, то есть нормальность наблюдений и равенство дисперсий в группах. Равенство дисперсий в группах, в частности, можно проверить с помощью теста Левена. Если мы нажмем на эту клавишу, то у нас на экран выводятся результаты анализа сравнения дисперсий в группах. В данном случае вероятность p-value существенно превышает уровень значимости 0,05, то есть гипотеза о равенстве дисперсии в группах принимается. Соответственно, данная предпосылка дисперсионного анализа выполнена. Если мы для нашей переменной «выручка» проверим гипотезу о нормальности, зайдем в Statistics, Distribution Fitting, подгонка распределения, выбираем «нормальный» закон. Переменная, для которой мы это делаем, — это наша количественная переменная «выручка», подводим итог, и мы видим, что значение p-value также больше, чем 0,05. Соответственно, гипотеза о нормальности соответствующей выборки принимается. Все предположения дисперсионного анализа у нас были выполнены. Следовательно, мы можем сделать вывод о том, что день недели действительно влияет на выручку. [МУЗЫКА] [МУЗЫКА]