Informações sobre o curso
113,817 visualizações recentes

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 43 horas para completar

Sugerido: 8 hours/week...

Russo

Legendas: Russo

Habilidades que você terá

Random ForestPython ProgrammingMachine LearningSupervised Learning

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 43 horas para completar

Sugerido: 8 hours/week...

Russo

Legendas: Russo

Programa - O que você aprenderá com este curso

Semana
1
9 horas para concluir

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей.

...
13 vídeos ((Total 82 mín.)), 8 leituras, 8 testes
13 videos
Как устроена специализация, и зачем ее проходить3min
МФТИ1min
Знакомство с машинным обучением11min
Обучение на размеченных данных5min
Обучение без учителя5min
Признаки в машинном обучении8min
Линейные модели в задачах регрессии9min
Обучение линейной регрессии6min
Градиентный спуск для линейной регрессии7min
Стохастический градиентный спуск4min
Линейная классификация6min
Функции потерь в задачах классификации6min
8 leituras
Формат специализации и получение сертификата10min
Немного о Yandex10min
МФТИ10min
Forum&Chat10min
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
6 exercícios práticos
Основные термины в машинном обучении6min
Типы задач в машинном обучении6min
Машинное обучение: задачи и признаки12min
Линейная регрессия4min
Градиентный спуск4min
Линейные модели8min
Semana
2
9 horas para concluir

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных.

...
14 vídeos ((Total 126 mín.)), 9 leituras, 8 testes
14 videos
Регуляризация7min
Оценивание качества алгоритмов7min
Сравнение алгоритмов и выбор гиперпараметров4min
Метрики качества в задачах регрессии10min
Метрики качества классификации4min
Точность и полнота8min
Объединение точности и полноты5min
Качество оценок принадлежности классу12min
Встроенные датасеты. Sklearn.datasets15min
Кросс-валидация. Sklearn.cross_validation9min
Линейные модели. Sklearn.linear_model. Классификация10min
Линейные модели. Sklearn.linear_model. Регрессия7min
Метрики качества. Sklearn.metrics13min
9 leituras
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
Встроенные датасеты. Sklearn.datasets (ipython notebook)10min
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10min
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10min
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10min
Метрики качества. Sklearn.metrics (ipython notebook)10min
6 exercícios práticos
Проблема переобучения6min
Проблема переобучения и борьба с ней10min
Как измерить качество алгоритма?6min
Метрики качества10min
Встроенные датасеты и кросс-валидация8min
Введение в scikit-learn10min
Semana
3
7 horas para concluir

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn.

...
14 vídeos ((Total 97 mín.)), 7 leituras, 7 testes
14 videos
Метод максимального правдоподобия4min
Регрессия как максимизация правдоподобия2min
Регрессия как оценка среднего4min
Регуляризация8min
Задача оценивания вероятностей и логистическая регрессия8min
Масштабирование признаков6min
Спрямляющие пространства5min
Работа с категориальными признаками4min
Несбалансированные данные5min
Многоклассовая классификация4min
Подбор параметров по сетке. Sklearn.grid_search9min
Задача: bike sharing demand15min
Задача: bike sharing demand. Продолжение13min
7 leituras
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10min
Задача Bike Sharing Demand (ipython notebook)10min
Задача Bike Sharing Demand. Продолжение (ipython notebook)10min
6 exercícios práticos
Метод максимального правдоподобия6min
Линейные модели: статистический взгляд14min
Линейные модели: подготовка признаков6min
Линейные модели: практические аспекты6min
Подбор параметров по сетке6min
Анализ данных в scikit-learn12min
Semana
4
10 horas para concluir

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе.

...
17 vídeos ((Total 114 mín.)), 10 leituras, 8 testes
17 videos
Обучение решающих деревьев6min
Критерии информативности7min
Критерии останова и стрижка деревьев4min
Решающие деревья и категориальные признаки8min
Решающие деревья в sklearn10min
Композиции деревьев6min
Смещение и разброс9min
Случайные леса6min
Трюки со случайными лесами4min
Случайные леса в sklearn7min
Композиции простых алгоритмов5min
Градиентный бустинг7min
Борьба с переобучением в градиентном бустинге6min
Градиентный бустинг для регрессии и классификации4min
Градиентный бустинг над решающими деревьями5min
Градиентный бустинг в XGBoost5min
10 leituras
Решающие деревья в sklearn (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
Случайные леса в sklearn (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
XGBoost10min
Градиентный бустинг в XGBoost (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
6 exercícios práticos
Построение решающих деревьев8min
Решающие деревья14min
Бэггинг6min
Композиции и случайные леса8min
Обучение композиций и градиентный бустинг4min
Градиентный бустинг: обучение и практические аспекты8min
4.8
252 avaliaçõesChevron Right

50%

comecei uma nova carreira após concluir estes cursos

58%

consegui um benefício significativo de carreira com este curso

33%

recebi um aumento ou promoção

Principais avaliações do Обучение на размеченных данных

por RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

por YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

Instrutores

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

Sobre Instituto de Física e Tecnologia de Moscou

Московский физико-технический институт (Физтех) является одним из ведущих вузов страны и входит в основные рейтинги лучших университетов мира. Институт обладает не только богатой историей – основателями и профессорами института были Нобелевские лауреаты Пётр Капица, Лев Ландау и Николай Семенов – но и большой научно-исследовательской базой. Основой образования в МФТИ является уникальная «система Физтеха», сформулированная Петром Капицей: кропотливый отбор одаренных и склонных к творческой работе абитуриентов; участие в обучении ведущих научных работников; индивидуальный подход к отдельным студентам с целью развития их творческих задатков; воспитание с первых шагов в атмосфере технических исследований и конструктивного творчества с использованием потенциала лучших лабораторий страны. Среди выпускников МФТИ — нобелевские лауреаты Андрей Гейм и Константин Новоселов, основатель компании ABBYY Давид Ян, один из авторов архитектурных принципов построения вычислительных комплексов Борис Бабаян и др....

Sobre Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Sobre o Programa de cursos integrados Aprendizado de máquina e análise de dados

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Aprendizado de máquina e análise de dados

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.