Informações sobre o curso
100,901

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 43 horas para completar

Sugerido: 8 hours/week...

Russo

Legendas: Russo

Habilidades que você terá

Random ForestPython ProgrammingMachine LearningSupervised Learning

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 43 horas para completar

Sugerido: 8 hours/week...

Russo

Legendas: Russo

Programa - O que você aprenderá com este curso

Semana
1
9 horas para concluir

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
13 vídeos (total de (Total 82 mín.) min), 8 leituras, 8 testes
13 videos
Как устроена специализация, и зачем ее проходить3min
МФТИ1min
Знакомство с машинным обучением11min
Обучение на размеченных данных5min
Обучение без учителя5min
Признаки в машинном обучении8min
Линейные модели в задачах регрессии9min
Обучение линейной регрессии6min
Градиентный спуск для линейной регрессии7min
Стохастический градиентный спуск4min
Линейная классификация6min
Функции потерь в задачах классификации6min
8 leituras
Формат специализации и получение сертификата10min
Немного о Yandex10min
МФТИ10min
Forum&Chat10min
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
6 exercícios práticos
Основные термины в машинном обучении6min
Типы задач в машинном обучении6min
Машинное обучение: задачи и признаки12min
Линейная регрессия4min
Градиентный спуск4min
Линейные модели8min
Semana
2
9 horas para concluir

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
14 vídeos (total de (Total 126 mín.) min), 9 leituras, 8 testes
14 videos
Регуляризация7min
Оценивание качества алгоритмов7min
Сравнение алгоритмов и выбор гиперпараметров4min
Метрики качества в задачах регрессии10min
Метрики качества классификации4min
Точность и полнота8min
Объединение точности и полноты5min
Качество оценок принадлежности классу12min
Встроенные датасеты. Sklearn.datasets15min
Кросс-валидация. Sklearn.cross_validation9min
Линейные модели. Sklearn.linear_model. Классификация10min
Линейные модели. Sklearn.linear_model. Регрессия7min
Метрики качества. Sklearn.metrics13min
9 leituras
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
Встроенные датасеты. Sklearn.datasets (ipython notebook)10min
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10min
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10min
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10min
Метрики качества. Sklearn.metrics (ipython notebook)10min
6 exercícios práticos
Проблема переобучения6min
Проблема переобучения и борьба с ней10min
Как измерить качество алгоритма?6min
Метрики качества10min
Встроенные датасеты и кросс-валидация8min
Введение в scikit-learn10min
Semana
3
7 horas para concluir

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
14 vídeos (total de (Total 97 mín.) min), 7 leituras, 7 testes
14 videos
Метод максимального правдоподобия4min
Регрессия как максимизация правдоподобия2min
Регрессия как оценка среднего4min
Регуляризация8min
Задача оценивания вероятностей и логистическая регрессия8min
Масштабирование признаков6min
Спрямляющие пространства5min
Работа с категориальными признаками4min
Несбалансированные данные5min
Многоклассовая классификация4min
Подбор параметров по сетке. Sklearn.grid_search9min
Задача: bike sharing demand15min
Задача: bike sharing demand. Продолжение13min
7 leituras
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10min
Задача Bike Sharing Demand (ipython notebook)10min
Задача Bike Sharing Demand. Продолжение (ipython notebook)10min
6 exercícios práticos
Метод максимального правдоподобия6min
Линейные модели: статистический взгляд14min
Линейные модели: подготовка признаков6min
Линейные модели: практические аспекты6min
Подбор параметров по сетке6min
Анализ данных в scikit-learn12min
Semana
4
10 horas para concluir

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
17 vídeos (total de (Total 114 mín.) min), 10 leituras, 8 testes
17 videos
Обучение решающих деревьев6min
Критерии информативности7min
Критерии останова и стрижка деревьев4min
Решающие деревья и категориальные признаки8min
Решающие деревья в sklearn10min
Композиции деревьев6min
Смещение и разброс9min
Случайные леса6min
Трюки со случайными лесами4min
Случайные леса в sklearn7min
Композиции простых алгоритмов5min
Градиентный бустинг7min
Борьба с переобучением в градиентном бустинге6min
Градиентный бустинг для регрессии и классификации4min
Градиентный бустинг над решающими деревьями5min
Градиентный бустинг в XGBoost5min
10 leituras
Решающие деревья в sklearn (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
Случайные леса в sklearn (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
XGBoost10min
Градиентный бустинг в XGBoost (ipython notebook)10min
Слайды к лекциям10min
Конспект10min
6 exercícios práticos
Построение решающих деревьев8min
Решающие деревья14min
Бэггинг6min
Композиции и случайные леса8min
Обучение композиций и градиентный бустинг4min
Градиентный бустинг: обучение и практические аспекты8min
4.8
247 avaliaçõesChevron Right

50%

comecei uma nova carreira após concluir estes cursos

58%

consegui um benefício significativo de carreira com este curso

33%

recebi um aumento ou promoção

Melhores avaliações

por RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

por YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

Instrutores

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

Sobre Instituto de Física e Tecnologia de Moscou

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

Sobre Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Sobre o Programa de cursos integrados Aprendizado de máquina e análise de dados

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Aprendizado de máquina e análise de dados

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.