[МУЗЫКА] [МУЗЫКА] Рассмотрим теперь, как в пакете Statistica построить диаграммы размаха или коробки с усами, и как их можно использовать для определения и устранения выбросов. Рассматривать мы это будем для тех же самых данных с информацией о росте и весе школьников и, в частности, посмотрим, как строить диаграмма размаха для переменной роста аналогично тому, как мы это делали в пакете R и SPSS. Для того чтобы построить диаграмму размаха или Box Plot в пакете Statistica, мы заходим в раздел «Графика», «2D графики», «Box Plots». Будем строить стандартный график, коробку с усами, укажем переменные. Основная переменная у нас будет рост, а группирующая переменная будет пол. Нажимаем Ok, посмотрим, какова будет структура графика. Это стандартная коробка с усами, где центральная точка соответствует медиане. Верхняя и нижняя границы ящика соответствуют первому и третьему квартилям или 25 и 75 перцентилям, а усы показывают нам крайние наблюдения, которые не были классифицированы как выбросы. Также в принципе здесь мы можем поменять тип этого графика, когда у нас в качестве центральной точки выбирается среднее значение и, соответственно, коробка и усы соответствуют среднеквадратическим отклонениям. Мы оставим стандартный график через квартили. Нажимаем Ok и перед нами появляется диаграмма размаха со значениями роста для каждого пола. Точки, которые выпадают за пределы усов, соответственно, вот это наблюдение и вот это наблюдение, они у нас классифицируется как выбросы, outliers. Как видите, в «Статистике» при наведении на соответствующую точку у нас появляется информация о ее значении. Она равна 121 и стоит в 80 строке. Аналогично вот это наблюдение, у нас стоит во второй строке и его значение — 154. Если мы хотим автоматически удалить эти наблюдения из таблицы, мы можем проделать следующее действие: выбираем инструмент, который называется Brushing, при нажатии на него появляется дополнительное окно. С помощью этого инструмента мы можем пометить либо исключить необходимые наблюдения. Давайте мы выберем строку Off, то есть эта операция будет исключать наблюдение из дальнейших расчетов. Каким образом мы можем его пометить? Можно, например, выбрать инструмент Box или инструмент Lasso, для того чтобы пометить соответствующее наблюдение. Инструментом Box он будет выделяться вот таким вот образом. Опять-таки, у нас проводится некий анализ нашей таблицы, поэтому вносимые изменения могут его нарушить. Мы соглашаемся с этим, помечаем данное наблюдение и также помечаем соответствующее еще одно наблюдение и применяем операцию. Как видите, два этих наблюдения были исключены, масштаб при этом по оси Y у нас изменился, поэтому коробки немножко вытянулись. Давайте вернемся к исходной таблице и посмотрим, к чему это привело. Если мы вернемся теперь в нашу таблицу, мы видим, что наблюдение, стоящее во второй строке, а именно, значение роста равное 154, и 80 наблюдение, значение которого равно 121, которые были классифицированы как выбросы, они сейчас у нас пометились вот таким вот символом, и если мы будем теперь проводить дальнейшие расчёты с этими наблюдениями, в этих расчетах данные наблюдения участвовать уже не будут. При этом они по-прежнему сохраняются в нашей таблице, мы можем их видеть и при необходимости можем вернуть обратно. Для этого в соответствующей строке нам нужно нажать правую кнопку мышки и снять галочку с исключения. Делаем это для второго и также для 80 наблюдения. В принципе, зная номера строк в котором содержится наблюдение, которое необходимо удалить, это можно сделать и вручную, повторив действие в обратном порядке. Также выбираем соответствующую строку и выбираем необходимое действие. Например, помечаем это наблюдение, исключая его из расчетов. [МУЗЫКА] [МУЗЫКА]