Informações sobre o curso
3.8
52 classificações
14 avaliações
Programa de cursos integrados
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível avançado

Nível avançado

Horas para completar

Aprox. 79 horas para completar

Sugerido: 5 weeks of study, 6-8 hours/week...
Idiomas disponíveis

Inglês

Legendas: Inglês
Programa de cursos integrados
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível avançado

Nível avançado

Horas para completar

Aprox. 79 horas para completar

Sugerido: 5 weeks of study, 6-8 hours/week...
Idiomas disponíveis

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1
Horas para completar
7 minutos para concluir

Welcome

...
Reading
5 vídeos (total de (Total 7 mín.) min)
Video5 videos
Course Structure1min
Meet Alexey2min
Meet Pavel37s
Meet Ilya1min
Horas para completar
1 hora para concluir

(Optional) Machine Learning: Introduction

...
Reading
6 vídeos (total de (Total 43 mín.) min), 1 leitura
Video6 videos
(Optional) Basic concepts11min
(Optional) Types of problems and tasks5min
(Optional) Supervised learning7min
(Optional) Unsupervised learning6min
(Optional) Business applications of the machine learning4min
Reading1 leituras
Slack Channel is the quickest way to get answer to your question10min
Horas para completar
5 horas para concluir

Spark MLLib and Linear Models

...
Reading
11 vídeos (total de (Total 94 mín.) min), 3 leituras, 5 testes
Video11 videos
First example. Linear regression10min
How MLlib library is arranged10min
How to train algorithms. Gradient descent method9min
How to train algorithms. Second order methods8min
Large scale classification. Logistic regression12min
Regularization8min
PCA decomposition9min
K-means clustering7min
How to submit your first assignment3min
How to Install Docker on Windows 7, 8, 104min
Reading3 leituras
Grading System: Instructions and Common Problems10min
Docker Installation Guide10min
Assignments. General requirements10min
Quiz4 exercícios práticos
Large scale machine learning. The beginning14min
Large scale regression and classification. Detailed analysis10min
Regularization and Unsupervised Techniques10min
Spark MLLib and Linear Models18min
Semana
2
Horas para completar
2 horas para concluir

Machine Learning with Texts & Feature Engineering

...
Reading
12 vídeos (total de (Total 70 mín.) min), 5 testes
Video12 videos
Feature Engineering for Texts, part 17min
Feature Engineering for Texts, part 25min
N-grams4min
Hashing trick6min
Categorical Features6min
Feature Interactions2min
Spark ML. Feature Engineering for Texts, part 17min
Spark ML. Feature Engineering for Texts, part 25min
Spark ML. Categorical Features3min
Topic Modeling. LDA.7min
Word2Vec11min
Quiz5 exercícios práticos
Feature Enginering for Texts16min
Categorical Features & Feature Interactions6min
Spark ML Tutorial: Text Processing6min
Advanced Machine Learning with Texts8min
Machine Learning with Texts & Feature Engineering20min
Semana
3
Horas para completar
6 horas para concluir

Decision Trees & Ensemble Learning

...
Reading
13 vídeos (total de (Total 64 mín.) min), 6 testes
Video13 videos
Decision Trees Basics4min
Decision Trees for Regression6min
Decision Trees for Classification3min
Decision Trees: Summary1min
Bootstrap & Bagging8min
Random Forest6min
Gradient Boosted Decision Trees: Intro & Regression7min
Gradient Boosted Decision Trees: Classification6min
Stochastic Boosting1min
Gradient Boosted Decision Trees: Usage Tips & Summary3min
Spark ML. Decision Trees & Ensembles6min
Spark ML. Cross-validation3min
Quiz5 exercícios práticos
Decision Trees16min
Bootstrap, Bagging and Random Forest6min
Gradient Boosted Decision Trees10min
Spark ML Programming Tutorial: Decision Trees & CV6min
Decision Trees & Ensemble Learning16min
Semana
4
Horas para completar
3 horas para concluir

Recommender Systems

...
Reading
15 vídeos (total de (Total 118 mín.) min), 1 leitura, 4 testes
Video15 videos
Recommender Systems, Introduction. Part II4min
Non-Personalized Recommender Systems9min
Content-Based Recommender Systems8min
Recommender System Evaluation10min
Collaborative Filtering RecSys: User-User and Item-Item10min
RecSys: SVD I7min
RecSys: SVD II8min
RecSys: SVD III5min
RecSys: MF I7min
RecSys: MF II6min
RecSys: iALS I6min
RecSys: iALS II11min
RecSys: Hybrid I7min
RecSys: Hybrid II7min
Reading1 leituras
Recommender Systems. Spark Assignment10min
Quiz4 exercícios práticos
Basic RecSys for Data Engineers14min
Moderate RecSys for Data Engineers10min
Advanced RecSys for Data Engineers4min
Recommender Systems16min

Instrutores

Avatar

Pavel Mezentsev

Senior Data Scientist
PulsePoint inc
Avatar

Alexey A. Dral

Founder and Chief Executive Officer
BigData Team
Avatar

Ilya Trofimov

Principal Data Scientist
Yandex
Avatar

Evgeny Frolov

Data Scientist, PhD Student @Skoltech
Computational and Data Intensive Science and Engineering

Sobre Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Sobre o Programa de cursos integrados Big Data for Data Engineers

This specialization is made for people working with data (either small or big). If you are a Data Analyst, Data Scientist, Data Engineer or Data Architect (or you want to become one) — don’t miss the opportunity to expand your knowledge and skills in the field of data engineering and data analysis on the large scale. In four concise courses you will learn the basics of Hadoop, MapReduce, Spark, methods of offline data processing for warehousing, real-time data processing and large-scale machine learning. And Capstone project for you to build and deploy your own Big Data Service (make your portfolio even more competitive). Over the course of the specialization, you will complete progressively harder programming assignments (mostly in Python). Make sure, you have some experience in it. This course will master your skills in designing solutions for common Big Data tasks: - creating batch and real-time data processing pipelines, - doing machine learning at scale, - deploying machine learning models into a production environment — and much more! Join some of best hands-on big data professionals, who know, their job inside-out, to learn the basics, as well as some tricks of the trade, from them. Special thanks to Prof. Mikhail Roytberg (APT dept., MIPT), Oleg Sukhoroslov (PhD, Senior Researcher, IITP RAS), Oleg Ivchenko (APT dept., MIPT), Pavel Akhtyamov (APT dept., MIPT), Vladimir Kuznetsov, Asya Roitberg, Eugene Baulin, Marina Sudarikova....
Big Data for Data Engineers

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.