[МУЗЫКА] [МУЗЫКА] Теперь аналогичным образом сгенерируем в соседние ячейки выборку, подчиняющуюся нормальному закону. Также нажимаем дважды на имени ячейки, задаем имя, теперь это будет у нас нормальное распределение. И также в окне «Функции» задаем функцию генерации нормального распределения. Это операция RndNormal. Мы начинаем набирать это имя, и оно появляется у нас в подсказке. Можно выбрать ее из предложенного списка. При этом что является аргументом данной функции? Аргументом данной функции является среднеквадратическое отклонение. То есть если мы хотим получить распределение с заданными параметрами a и σ², мы должны в скобках указать значение параметра σ и добавить необходимое значение математического ожидания. Если мы хотим сгенерировать стандартное нормальное распределение, то мы в скобочках набираем 1 и просто ничего не прибавляем. Это будет распределение с параметрами 0, 1. Если же мы хотим сделать, например, математическое ожидание, равное 3, а дисперсию, равную 4, в скобках мы указываем значение 2, а потом сдвигаем полученную выборку на 3. Тем самым математическое ожидание у нас станет равным 3. Давайте оставим такое распределение и нажимаем OK. Выражение в порядке, при этом у нас появляется дополнительное сообщение о том, что мы уже начали проведение анализа с нашей таблицей. Чтобы не испортить то, что у нас уже сделано, Statistica предупреждает нас о том, что наши действия вносят определенные изменения в таблицу. Но в этом случае у нас ничего страшного не происходит, поэтому мы просто соглашаемся с этим предупреждением и продолжаем работу. Теперь у нас появилась вторая выборка, которая, предположительно, подчиняется нормальному закону. Для нее мы также можем попробовать построить гистограмму. Заходим в График > Гистограммы, и здесь у нас также есть два варианта. Поскольку мы уже строили гистограмму, здесь находится у нас окно с предыдущим анализом, мы можем либо вернуться в него и просто поменять там имя переменной, либо можем открыть новое окно построения гистограммы. В принципе, такой необходимости у нас нет. Мы можем поменять переменную в предыдущем окне, поэтому можно выбрать первую строку «Продолжить текущий анализ». У нас открывается то окно, какое было, при этом переменная была выбрана первая «Равномерная». Если мы в переменных укажем теперь вторую, соответственно, гистограмма будет построена для второй переменной с нормальным распределением. Оставляем так же настройки по умолчанию, нажимаем OK. Теперь у нас на этот график также накладывается гауссовский колокольчик, но поскольку сейчас мы работаем с нормальным распределением, то он здесь действительно имеет смысл. Количество интервалов разбиения Statistica определяет автоматически. Но если вы хотите поменять этот параметр и увеличить либо уменьшить количество интервалов, вы можете сделать это самостоятельно. Мы возвращаемся в окно построения гистограммы. Сейчас количество интервалов у нас определяется автоматически. Но если вы хотите задать число категорий, вы можете сделать это в соответствующем окне. У нас сейчас 100 наблюдений. По формуле Стерджеса оптимальным количеством интервалов разбиения предлагается брать значение 7. Давайте попробуем взять значение 7 в нашем случае. Нажимаем OK, и вот у нас построена гистограмма теперь уже по семи интервалам. При наведении на нее мы видим, какие конкретно наблюдения попали в соответствующий подинтервал разбиения. [ЗВУК] Теперь для наших обеих выборок мы можем рассчитать числовые характеристики. Поскольку мы генерировали их сами, мы знаем, чему должны быть равны теоретические числовые характеристики, то есть математическое ожидание и дисперсия. Для стандартного равномерного распределения в интервале от 0 до 1 математическое ожидание равно 1/2, а дисперсия равна 1/12, а для нашего сгенерированного нормального распределения мы определили параметр a, равный 3, а дисперсию — равную 4. Давайте проверим, насколько соответствуют выборочные числовые характеристики заданным генеральным характеристикам. Для того чтобы рассчитать числовые характеристики в пакете Statistica, мы заходим в раздел Statistics > > Основные статистики и таблицы, Basic Statistics/Tables. Дальше все описательные статистики собраны у нас в разделе Descriptive statistics. Заходим сюда, нажимаем OK. Также нам нужно определить переменные. В принципе, в данном разделе мы можем сразу указать две переменные. Тогда у нас будет таблица, по строкам которой будут расположены наши выборки, а по столбцам — соответствующие им характеристики. В принципе, мы также можем работать и с быстрым анализом, но в данном случае гораздо интереснее зайти на вкладку Advanced, расширенный анализ, и указать большее число характеристик, чем Statistica предлагает по умолчанию. Что мы видим в этой окне? Во-первых, у нас указан доступный объем выборки. Сейчас мы генерировали 100 наблюдений, то есть в нашей таблице 100 строк, но если мы работаем с реальными данными, не исключена ситуация, что таблица содержит пропуски по каким-то столбцам или по каким-то строкам. Соответственно, здесь будет указано количество доступных наблюдений без пропусков. Следующее, аналогично — процент доступных наблюдений по отношению ко всему объему выборки. Следующая характеристика, mean — это среднее. Далее sum — это сумма всех значений выборки, медиана, мода, геометрическое среднее, гармоническое среднее, стандартное отклонение, доверительный интервал стандартного отклонения, где вы можете указать доверительную вероятность. Далее коэффициент вариации, дисперсия, стандартная ошибка среднего, доверительный интервал для среднего, коэффициент асимметрии, коэффициент эксцесса. Дальше, в следующем блоке вы можете указать минимальное и максимальное значение, квартили, первый и третий, перцентили, указав требуемый процент, и так далее. То есть, как видите, Statistica предлагает нам достаточно богатый выбор числовых характеристик. Давайте оставим здесь среднее и добавим к нашему списку дисперсию. Поставим галочку в строке Variance. Также можно указать еще коэффициенты асимметрии и эксцесса, которые говорят нам о форме распределения, и, в частности, для нормального распределения должны быть равны нулю. Подведем итог, нажимая на кнопку Summary. Перед нами появляется таблица с соответствующими числовыми характеристиками. Как мы видим, поскольку обе выборки не содержат пропусков, у нас доступны по 100 наблюдений для каждой. Далее рассмотрим равномерную выборку. Как мы уже сказали, среднее значение должно быть равно 1/2, оценка среднего составляет 0,53, что достаточно близко. Далее минимальное и максимальное значения — это оценки верхней и нижней границы. Мы генерировали распределение в интервале от 0 до 1, соответственно, нижняя граница близка к нулю, верхняя граница близка к единице. Дисперсия равна 1/12, оценка дисперсии должна быть близка примерно к 0,083. У нас получилось значение чуть-чуть больше, но тем не менее погрешность не слишком велика. Стандартное отклонение — это корень из дисперсии, а дальше значения коэффициентов асимметрии и эксцесса. Мы видим, что для равномерного распределения коэффициент асимметрии получился очень близким к нулю, то есть действительно данное распределение является достаточно симметричным, а вот коэффициент эксцесса существенно меньше нуля, что говорит о плосковершинности нашего распределения. Для нормальной выборки мы получили значение выборочного среднего 2,7 при теоретическом среднем, равном 3. Также оценка достаточно близка, хотя имеется некоторая погрешность. Далее по правилу трех сигм с достаточной высокой вероятностью, близкой к единице, значения нормальной случайной величины лежат в интервале от (a − 3σ) до (a + 3σ). В нашем случае при параметрах a = 3 и σ = 2 мы должны получить интервал от −3 до +9. Как видим, нижняя граница немного не достигается, а на верхней границе значение чуть-чуть его превосходит. Но это вероятностные характеристики, вероятностные модели, поэтому такая ситуация возможна. σ мы задавали, равное 2, соответственно, теоретическая дисперсия равна 4, и в данном случае мы получили значение, очень-очень близкое к 4, и к 2 для среднеквадратического отклонения соответственно. Для нормального распределения коэффициенты асимметрии и эксцесса должны быть равны нулю. В нашем случае они действительно очень маленькие, близкие к нулю, но также имеются определенные погрешности. [МУЗЫКА] [МУЗЫКА]