Итак, 13 различных вариантов модели, которые используют разные ковариаты дисперсии. И вот, надо нам сделать выбор между ними. Естественно, для этого будем использовать информационные критерии, информационные критерии "Акайке". И вот перед вами значение этих самых критериев, которые мы все сложили в один dataframe AICs и вот они все перед нами. Среди них надо выбрать ту модель, у которой будет минимальное значение AIC. Для этого мы воспользуемся нехитрым ходом, используем функцию which.min, которая найдет нам минимальное значение. Это модель номер 10, которая включает элемент, моделирующий дисперсию довольно сложным образом, это комбинация пропорциональной связи дисперсии с длиной [inaudible] , которую подбирают с функцией varFixed, которая скомбинирована элементом моделирующим связь дисперсии с дискретным фактором Activity, вот эта часть. То есть у нас эта функция достаточно сложная. И вот теперь давайте рассмотрим график рассеяния остатков финальной модели. Мы видим, что явно клиновидный паттерн, который был изначально, вот эта первая модель, с которой мы начали, а вот модель, в который мы ввели поправку на дисперсию. Так вот явно клиновидный паттерн, который был изначально, исчез. Соответственно, теперь мы будем более-менее уверены, что наша модель соответствует условиям применимости модели основанных на нормальном распределении. И теперь мы можем заняться обустройством фиксированной части модели. И вот здесь необходимо вспомнить, что пока мы подбирали оптимальную модель, в которой были разные случайные части, мы могли использовать метод REML. Когда же мы начнем работать с фиксированной частью модели, попытаемся подобрать ее оптимальную структуру, то в этой ситуации метод REML не годится и нам нужно переподобрать модель с помощью метода максимального правдоподобия ML. Соответственно, мы производим новый объект, в котором меняем метод подбора с REML на ML. Теперь мы можем воспользоваться функцией drop1, которая используя тест-отношение правдоподобий, сравнит полную модель с вложенной моделью, в которой будут пошагово удаляться те или иные элементы. Так вот, мы видим, что если удалить из модели взаимодействие thorax и activity, то модель существенно не изменяется. И мы можем, таким образом, ее упростить. Когда мы это сделаем, соответственно, удалим из модели взаимодействия и вновь посмотрим, нельзя ли чего-нибудь выкинуть из модели, мы увидим, что уже более ничего выкинуть нельзя, любые удаления предикторов из полученной моделей приведет к ее существенному ухудшению поскольку доверительное значение AIC сильно возрастут. Соответственно, финальная структура фиксированной части найдена, она включает в себя два предиктора: это thorax и activity. Однако, мы помним, что метод максимального правдоподобия дает смещенные оценки параметров, поэтому мы подбираем финальную модель опять же с помощью метода REML, мы ее переподбираем и указываем в параметры метод, который называется REML. Ну и осталось изучить summary этой модели и описать эту самую финальную модель. Описание модели, которую мы будем давать в отчете или статье, будет довольно сложным. Возможно его придется вынести куда-то в приложение, так как нам придется указывать не только подобранные коэффициенты фиксированной части, но еще и какое-то описание того, как ведет себя дисперсия после того, как мы ввели некоторую ее связь с ковариатами. Поэтому недостаточно будет указать, что переменная longevity находится в связи с переменными thorax и activity с помощью таких-то коэффициентов, но необходимо будет еще указать, что структура дисперсии, которую мы в эту модель ввели, включает в себя определенные связи с ковариатами, ковариатами оказываются дискретные факторы activity и thorax, непрерывная величина. И мы использовали комбинированную функцию моделирования дисперсии и, соответственно, где-то в приложении необходимо перевести вот эти параметры, которые здесь указаны в summary. Для того чтобы визуализировать модель, которую мы получили, мы воспользуемся уже знакомым нам методом, который мы многократно применяли, мы сформируем искусственный data set, в котором перечислены все возможные параметры, которые необходимо перевести на графике, это значение дискретного фактора activity, минимальное и максимальное значение непрерывной величины длины thorax, мы подберем 100 таких точек. И дальше мы должны сделать предсказание для каждой из этих точек в нашем новом dataset, мы это делаем с помощью матричной алгебры. Мы строим модель на матрицу, как это мы обычно делали. Из подобранной финальной модели берем коэффициенты и дальше производим матричное умножение, которое нам приведет к вычислению предсказанных значений. Ошибки мы находим точно также используя коммуникационно-ковариационную матрицу как это делали раньше. И теперь у нас все готово для того, чтобы произвести визуализацию. Код для визуализации у нас тоже стандартный, с помощью функции пакета ggplot мы строим наши регрессионные прямые и поскольку взаимодействия факторов нет, то мы видим, что модель визуализируется в виде серии параллельных прямых, которые отражают связь продолжительности жизни с длиной thorax, но для разных групп дискретного фактора activity. Осталась дать биологическую трактовку тем результатам, которые мы получили. Полученная модель действительно описывает значимую связь между продолжительностью жизни и размерами самцов. И поскольку взаимодействия нет, то для всех градаций фактора activity мы видим однотипную связь с thorax-oм, это предсказывает наша модель. И мы видим, что в случае высокой половой активности продолжительность жизни существенно смещается. Но здесь надо помнить, что для того чтобы произвести сопоставление этой градации со всеми остальными, нам необходимо применить пост хок тесты. Мы об этом сейчас говорить не будем, но в целом результат достаточно очевидный. После того как мы ввели коррекцию дисперсии, мы получили достаточно надежные результаты, которым можем доверять, согласно которым повышенная половая активность самцов приводит к снижению продолжительности их жизни.