[БЕЗ_ЗВУКА] Поговорим об особенностях моделирования в машинном обучении. Почему модели могут работать плохо? Причин может быть много, но давайте поговорим по крайней мере о трех. Первая — это вы неправильно поработали с данными. То есть вы либо неправильно очистили, либо не убрали шумы, либо у вас остались какие-то пробелы, либо вы просто неправильно сделали выборку, она у вас неоднородная, допустим. Поэтому когда вы работаете с моделями, всегда нужно хорошо проверять, что ваша выборка сделана хорошо. Обращайте на это внимание для того, чтобы потом избежать многих проблем. Другая проблема — это не совсем правильные ожидания у заказчика. То есть многие не знают и не понимают, что для того, чтобы машинное обучение начало работать хорошо, нужно время. То есть нужно подождать какое-то время, когда модель начнет сама улучшаться. Поэтому если у вас недостаточно времени для того, чтобы обучить модель, и вы ее уже куда-то поставили для демонстрации, вы должны правильно объяснить, что нужно время для того, чтобы модель обучилась. Ну и наконец, самое распространенное — это переобучение модели. Переобучение модели выглядит следующим образом: у вас есть некоторый набор данных, он разбит на две части, это обучающее множество и тестовое множество. И вот когда вы смотрите на вашу модель, на вашу решающую функцию, на ваш алгоритм и сравниваете, как он работает с обучающим множеством, то вы увидите, что он очень хорошо проходит через все точки, то есть ошибка минимальна, но как только вы ставите тестовое множество, то оказывается, что у вас ошибки становятся очень большими. То есть почему это происходит, эффект переобучения? Ну, причины могут быть разными. Можно сказать про такие, что использовали слишком сложную модель. То есть вы задали много степеней свободы параметров этого алгоритма или опять же вы плохо поработали с данными, и там остался какой-то шум, или вы сделали неправильно разбиение данных на обучающую выборку и на тестовую, и получилось, что у вас модель работает плохо. Поэтому нужно всегда следить за тем, чтобы у вас переобучения не было. В зависимости от типа модели data-scientist-ы по-разному работают с переобучением. Вот такие вот нюансы работы в моделях, они очень важны для работы с бизнес-заказчиком и, собственно, понимания, какие, собственно, сложности вы можете увидеть в своей работе, и как их преодолеть. Спасибо. [ЗВУК]