Informações sobre o curso
4.7
895 classificações
98 avaliações
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 25 horas para completar

Sugerido: 4 недели обучения, через 3-5 часа / неделю...
Idiomas disponíveis

Russo

Legendas: Russo

Habilidades que você terá

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 25 horas para completar

Sugerido: 4 недели обучения, через 3-5 часа / неделю...
Idiomas disponíveis

Russo

Legendas: Russo

Programa - O que você aprenderá com este curso

Semana
1
Horas para completar
7 horas para concluir

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов....
Reading
15 vídeos (total de (Total 109 mín.) min), 8 leituras, 5 testes
Video15 videos
Как устроена специализация, и зачем ее проходить3min
Структура уроков1min
Задача кластеризации4min
Примеры задач кластеризации5min
Знакомство с методами кластеризации9min
Пример: кластеризация текстов по теме13min
Выбор метода кластеризации7min
МФТИ1min
Метод K средних (K-Means)10min
Expectation Maximization (EM-алгоритм)9min
Агломеративная иерархическая кластеризация12min
Графовые методы кластеризации4min
Методы, основанные на плотности6min
Оценка качества и рекомендации по решению задачи кластеризации13min
Reading8 leituras
Блокнот из примера кластеризации текстов20min
Слайды к лекциям10min
Конспект10min
Немного о Yandex10min
МФТИ10min
Forum&Chat10min
Слайды к лекциям10min
Конспект10min
Quiz4 exercícios práticos
Знакомство с кластеризацией6min
Введение в кластеризацию8min
Некоторые методы кластеризации8min
Подробнее о методах кластеризации12min
Semana
2
Horas para completar
6 horas para concluir

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем....
Reading
15 vídeos (total de (Total 108 mín.) min), 4 leituras, 5 testes
Video15 videos
Одномерный отбор признаков8min
Жадные методы отбора признаков6min
Отбор признаков на основе моделей6min
Понижение размерности4min
Метод главных компонент: постановка задачи7min
Метод главных компонент: решение6min
Матричные разложения13min
SGD и ALS5min
Прогнозирование неизвестных значений в матрице6min
Проблема отсутствия негативных примеров и implicit методы6min
Вероятностный взгляд на матричные разложения5min
Неотрицательные матричные разложения: постановка и решение10min
Неотрицательные матричные разложения: функционалы и инициализация5min
Обработка пропусков8min
Reading4 leituras
Слайды к лекциям10min
Конспект10min
Слайды к лекциям10min
Конспект10min
Quiz4 exercícios práticos
Отбор признаков6min
Понижение размерности и отбор признаков14min
Матричные разложения8min
Неотрицательные матричные разложения10min
Semana
3
Horas para completar
4 horas para concluir

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы....
Reading
8 vídeos (total de (Total 57 mín.) min), 5 leituras, 5 testes
Video8 videos
Параметрическое восстановление плотности9min
Непараметрическое восстановление плотности8min
Одноклассовый SVM5min
Задача визуализации5min
Многомерное шкалирование4min
Метод t-SNE6min
Визуализация данных в sklearn12min
Reading5 leituras
Слайды к лекциям10min
Конспект10min
Визуализация данных в sklearn10min
Слайды к лекциям10min
Конспект10min
Quiz4 exercícios práticos
Восстановление плотности6min
Поиск аномалий4min
Методы SNE и t-SNE6min
Визуализация14min
Semana
4
Horas para completar
10 horas para concluir

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать. ...
Reading
14 vídeos (total de (Total 151 mín.) min), 8 leituras, 6 testes
Video14 videos
Постановка задачи тематического моделирования12min
Базовые тематические модели и EM-алгоритм14min
Регуляризация тематических моделей10min
Мультимодальные тематические модели9min
Внутренние критерии качества тематических моделей9min
Внешние критерии качества тематических моделей16min
Визуализация тематических моделей10min
Тематические модели на практике11min
Пример использования библиотеки gensim для построения тематической модели10min
Установка BigARTM в Windows3min
Установка BigARTM в Linux Mint2min
Установка BigARTM в Mac OS-X3min
Пример использования библиотеки BigARTM для построения тематической модели19min
Reading8 leituras
Слайды к лекциям10min
Конспект10min
Ноутбук из демонстрации использования gensim10min
Ноутбук из демонстрации использования BigARTM10min
Слайды к лекциям10min
Конспект10min
Финальные титры10min
Стань ментором специализации10min
Quiz4 exercícios práticos
Постановка задачи и базовые понятия6min
Тематическое моделирование-18min
Критерии качества тематических моделей6min
Тематическое моделирование-26min
4.7
98 avaliaçõesChevron Right
Direcionamento de carreira

50%

comecei uma nova carreira após concluir estes cursos
Benefício de carreira

40%

consegui um benefício significativo de carreira com este curso
Promoção de carreira

33%

recebi um aumento ou promoção

Melhores avaliações

por KTJun 1st 2016

Отличны курс! Спасибо большое создателям! Отличная подача материала, хорошие практические примеры и вообще всё просто классно! Категорически рекомендую, в том числе начинающим :)

por TYMar 16th 2017

Последняя неделя этого курса была значительно сложнее всего, что было раньше, но это того стоило. Пока лучший курс из всех, что я знаю на эту тему.

Instrutores

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

Sobre Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

Sobre Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Sobre o Programa de cursos integrados Машинное обучение и анализ данных

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.