Informações sobre o curso
14,688 visualizações recentes

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível avançado

Aprox. 76 horas para completar

Sugerido: 5 weeks of study, 6-8 hours/week...

Inglês

Legendas: Inglês
User
Os alunos que estão fazendo este Course são
  • Data Scientists
  • Machine Learning Engineers
  • Data Engineers
  • Data Analysts
  • Technical Solutions Engineers
User
Os alunos que estão fazendo este Course são
  • Data Scientists
  • Machine Learning Engineers
  • Data Engineers
  • Data Analysts
  • Technical Solutions Engineers

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível avançado

Aprox. 76 horas para completar

Sugerido: 5 weeks of study, 6-8 hours/week...

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1
7 minutos para concluir

Welcome

5 vídeos (Total 7 mín.)
5 videos
Course Structure1min
Meet Alexey2min
Meet Pavel37s
Meet Ilya1min
1 hora para concluir

(Optional) Machine Learning: Introduction

6 vídeos (Total 43 mín.), 1 leitura
6 videos
(Optional) Basic concepts11min
(Optional) Types of problems and tasks5min
(Optional) Supervised learning7min
(Optional) Unsupervised learning6min
(Optional) Business applications of the machine learning4min
1 leituras
Slack Channel is the quickest way to get answer to your question10min
5 horas para concluir

Spark MLLib and Linear Models

11 vídeos (Total 94 mín.), 3 leituras, 5 testes
11 videos
First example. Linear regression10min
How MLlib library is arranged10min
How to train algorithms. Gradient descent method9min
How to train algorithms. Second order methods8min
Large scale classification. Logistic regression12min
Regularization8min
PCA decomposition9min
K-means clustering7min
How to submit your first assignment3min
How to Install Docker on Windows 7, 8, 104min
3 leituras
Grading System: Instructions and Common Problems10min
Docker Installation Guide10min
Assignments. General requirements10min
4 exercícios práticos
Large scale machine learning. The beginning14min
Large scale regression and classification. Detailed analysis10min
Regularization and Unsupervised Techniques10min
Spark MLLib and Linear Models18min
Semana
2
2 horas para concluir

Machine Learning with Texts & Feature Engineering

12 vídeos (Total 70 mín.), 5 testes
12 videos
Feature Engineering for Texts, part 17min
Feature Engineering for Texts, part 25min
N-grams4min
Hashing trick6min
Categorical Features6min
Feature Interactions2min
Spark ML. Feature Engineering for Texts, part 17min
Spark ML. Feature Engineering for Texts, part 25min
Spark ML. Categorical Features3min
Topic Modeling. LDA.7min
Word2Vec11min
5 exercícios práticos
Feature Enginering for Texts16min
Categorical Features & Feature Interactions6min
Spark ML Tutorial: Text Processing6min
Advanced Machine Learning with Texts8min
Machine Learning with Texts & Feature Engineering20min
Semana
3
6 horas para concluir

Decision Trees & Ensemble Learning

13 vídeos (Total 64 mín.), 6 testes
13 videos
Decision Trees Basics4min
Decision Trees for Regression6min
Decision Trees for Classification3min
Decision Trees: Summary1min
Bootstrap & Bagging8min
Random Forest6min
Gradient Boosted Decision Trees: Intro & Regression7min
Gradient Boosted Decision Trees: Classification6min
Stochastic Boosting1min
Gradient Boosted Decision Trees: Usage Tips & Summary3min
Spark ML. Decision Trees & Ensembles6min
Spark ML. Cross-validation3min
5 exercícios práticos
Decision Trees16min
Bootstrap, Bagging and Random Forest6min
Gradient Boosted Decision Trees10min
Spark ML Programming Tutorial: Decision Trees & CV6min
Decision Trees & Ensemble Learning16min
Semana
4
3 horas para concluir

Recommender Systems

15 vídeos (Total 118 mín.), 1 leitura, 4 testes
15 videos
Recommender Systems, Introduction. Part II4min
Non-Personalized Recommender Systems9min
Content-Based Recommender Systems8min
Recommender System Evaluation10min
Collaborative Filtering RecSys: User-User and Item-Item10min
RecSys: SVD I7min
RecSys: SVD II8min
RecSys: SVD III5min
RecSys: MF I7min
RecSys: MF II6min
RecSys: iALS I6min
RecSys: iALS II11min
RecSys: Hybrid I7min
RecSys: Hybrid II7min
1 leituras
Recommender Systems. Spark Assignment10min
4 exercícios práticos
Basic RecSys for Data Engineers14min
Moderate RecSys for Data Engineers10min
Advanced RecSys for Data Engineers4min
Recommender Systems16min
Indique um amigo para aprender no Coursera!

Convide seus amigos e ganhe 50% de desconto

Compartilhe seu amor pelo conhecimento! Convide um amigo para fazer um curso e vocês receberão 50% de desconto em um curso ou no primeiro mês de um curso integrado quando o seu amigo fizer uma compra.

Ver termos e condições

Instrutores

Avatar

Alexey A. Dral

Founder and Chief Executive Officer
BigData Team
Avatar

Evgeny Frolov

Data Scientist, PhD Student @Skoltech
Computational and Data Intensive Science and Engineering
Avatar

Ilya Trofimov

Principal Data Scientist
Yandex

Sobre Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Sobre Programa de cursos integrados Big Data for Data Engineers

This specialization is made for people working with data (either small or big). If you are a Data Analyst, Data Scientist, Data Engineer or Data Architect (or you want to become one) — don’t miss the opportunity to expand your knowledge and skills in the field of data engineering and data analysis on the large scale. In four concise courses you will learn the basics of Hadoop, MapReduce, Spark, methods of offline data processing for warehousing, real-time data processing and large-scale machine learning. And Capstone project for you to build and deploy your own Big Data Service (make your portfolio even more competitive). Over the course of the specialization, you will complete progressively harder programming assignments (mostly in Python). Make sure, you have some experience in it. This course will master your skills in designing solutions for common Big Data tasks: - creating batch and real-time data processing pipelines, - doing machine learning at scale, - deploying machine learning models into a production environment — and much more! Join some of best hands-on big data professionals, who know, their job inside-out, to learn the basics, as well as some tricks of the trade, from them. Special thanks to Prof. Mikhail Roytberg (APT dept., MIPT), Oleg Sukhoroslov (PhD, Senior Researcher, IITP RAS), Oleg Ivchenko (APT dept., MIPT), Pavel Akhtyamov (APT dept., MIPT), Vladimir Kuznetsov, Asya Roitberg, Eugene Baulin, Marina Sudarikova....
Big Data for Data Engineers

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.