[МУЗЫКА] [МУЗЫКА]
[МУЗЫКА] Сегодня
мы поговорим с вами про метод Монте-Карло.
Метод Монте-Карло — это на самом деле группа методов для решения самых
различных математических задач при помощи моделирования случайных величин.
Метод является достаточно старым.
Он появился на свет в 1949 году,
и получил свое название в честь знаменитых казино Монте-Карло,
так как рулетка является простым примером генератора случайных чисел.
Так в чем же состоит суть метода?
Для этого вспомним Бюффона, которого мы с вами уже обсуждали,
который бросал монетку много раз, пытаясь оценить вероятность выпадения орла.
Так вот, с именем Бюффона связана еще одна задача — о
бросании иглы на листок с параллельными линиями.
В чем состоит суть задачи?
У нас есть лист,
расчерченный параллельными линиями на некотором расстоянии r.
И у нас есть игла длиной L, которую мы бросаем на этот листок,
и мы хотим посчитать вероятность того, что игла пересечет параллельные линии.
Соответственно, мы можем посчитать эту вероятность аналитически.
Выглядит она следующим образом.
Но важность этой задачи состоит в том,
что она позволила численно посчитать значение числа π.
Каким образом?
Если мы будем повторять этот эксперимент много раз,
то есть повторять бросание иглы, и считать сколько экспериментов у нас было удачных,
сколько неудачных, это позволит нам численно посчитать значение числа π.
Ну и соответственно, чем больше экспериментов мы будем делать,
тем точнее эта оценка будет.
Ну пример с иглой не очень интуитивно понятный,
поэтому давайте рассмотрим еще более простой пример,
где метод Монте-Карло позволяет нам рассчитать значение числа π.
Допустим, у нас есть квадрат со стороной 2,
и в него вписана окружность радиусом 1.
Далее мы будем генерировать точки внутри этого квадрата.
То есть в качестве координат у нас будут числа,
равномерно распределенные от −1 до 1.
После того как мы сгенерировали точку,
мы смотрим: попала ли она в окружность или нет.
Если точка попала в окружность, мы будем считать такой эксперимент удачным для нас.
И, соответственно, если не попала, то неудачным.
Если мы оценим статистическую вероятность попадания в
окружность — в нашем случае это отношение количества удачных для
нас экспериментов N* к общему количеству экспериментов — то можно увидеть,
что приблизительно эта статистическая вероятность также оценивает
отношение площадей окружности к площади квадрата.
Ну и в данном случае мы видим, что это отношение π к 4.
Соответственно, если мы проведем какое-то количество экспериментов,
по имеющимся у нас данным мы можем рассчитать некоторую оценку числа π.
Ну и чем больше экспериментов мы будем делать, тем точнее будет эта оценка.
Здесь мы видим результаты для 100, 1000, 10 000 и для 100 000 экспериментов.
И видим, что уже при 100 000, в принципе,
мы достаточно приблизились к истинному значению числа π.
И продолжая увеличивать количество экспериментов,
наша оценка стала бы еще точнее.
Собственно именно в этом и состоит метод Монте-Карло.
Мы моделируем некоторые случайные величины и решаем с помощью них
поставленную перед нами задачу, которая может быть самой различной.
Ну, а как применяется метод Монте-Карло для проверки статистических гипотез?
Вспомним, что когда мы работаем с любым статистическим критерием,
мы должны знать распределение статистики критерия при верной нулевой гипотезе.
Потому что с помощью этого распределения мы считаем как критическое значение,
так и достигнутый уровень значимости.
Но на самом деле, часто мы этого распределения не знаем.
И это может быть связано с самыми разными причинами.
Например, мы знаем, что статистика критерия должна иметь некоторый закон
распределения, ну, например, стандартный нормальный закон распределения.
Но по факту, статистика критерия имеет такое распределение только на больших
объемах выборок.
Ну, например, начиная со 100–200 или даже больше.
Мы хотим проверить гипотезу на выборке маленького объема,
ну например, в 20 элементов.
В таком случае распределение статистики может отклоняться от заявленного,
и мы не можем воспользоваться известным нам законом распределения
для рассчета критического значения или достигнутого уровня значимости.
Либо есть критерии,
для которых предельное распределение статистики критерия в принципе неизвестно.
Поэтому в данном случае мы сможем смоделировать это распределение при
помощи метода Монте-Карло.
Каким же образом?
Алгоритм здесь выглядит примерно следующим образом: мы
формулируем гипотезу H0, которую мы хотим проверить, выбираем критерий,
с помощью которого мы будем проверять, и далее мы моделируем выборку
нужного нам объема с учетом верной нулевой гипотезы.
Например: мы хотим проверить гипотезу H0 о согласии выборки в
20 элементов с нормальным законом распределения.
Тогда в пункте 3 мы должны смоделировать выборку объема 20,
соответствующую нормальному распределению.
В постмоделированной выборке мы считаем статистику нашего критерия,
и дальше мы повторяем пункты 3 и 4 большое количество раз.
Тем самым мы получим большую выборку, состоящую из реализации
случайной величины статистики нашего критерия при верной нулевой гипотезе.
По этой выборке мы уже можем посчитать что угодно.
Мы можем посчитать критическое значение для нужной нам вероятности как
выборочную квантиль, или посчитать достигнутый уровень значимости.
Собственно, именно таким образом применяется метод Монте-Карло для проверки
статистических гипотез.
Ну а конкретно мы поговорим об этом еще позднее,
как он используется для разных критериев.