Informações sobre o curso

56,493 visualizações recentes
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário
Aprox. 12 horas para completar
Inglês

O que você vai aprender

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

Habilidades que você terá

Data ScienceApache SparkSQL
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário
Aprox. 12 horas para completar
Inglês

oferecido por

Placeholder

Universidade da Califórnia, Davis

Programa - O que você aprenderá com este curso

Semana
1

Semana 1

3 horas para concluir

Introduction to Spark

3 horas para concluir
6 vídeos (Total 32 mín.), 3 leituras, 2 testes
6 videos
Why Distributed Computing?7min
Spark DataFrames6min
The Databricks Environment8min
SQL in Notebooks3min
Import Data2min
3 leituras
A Note From UC Davis10min
Readings and Resources40min
Assignment #1 - Queries in Spark SQL30min
2 exercícios práticos
Assignment #1 Quiz - Queries in Spark SQL30min
Module 1 Quiz30min
Semana
2

Semana 2

2 horas para concluir

Spark Core Concepts

2 horas para concluir
6 vídeos (Total 25 mín.), 2 leituras, 2 testes
6 videos
Spark Terminology3min
Caching5min
Shuffle Partitions7min
Spark UI3min
Broadcast Joins3min
2 leituras
Readings30min
Assignment #2 - Spark Internals30min
2 exercícios práticos
Assignment #2 Quiz - Spark Internals30min
Module 2 Quiz30min
Semana
3

Semana 3

3 horas para concluir

Engineering Data Pipelines

3 horas para concluir
7 vídeos (Total 43 mín.), 2 leituras, 2 testes
7 videos
Spark as a Connector6min
Accessing Data10min
File Formats8min
Schemas and Types4min
Writing Data6min
Managed and Unmanaged Tables4min
2 leituras
Readings1h
Assignment #3 - Engineering Data Pipelines30min
2 exercícios práticos
Assignment #3 Quiz - Engineering Data Pipelines30min
Module 3 Quiz30min
Semana
4

Semana 4

4 horas para concluir

Machine Learning Applications of Spark

4 horas para concluir
7 vídeos (Total 35 mín.), 2 leituras, 3 testes
7 videos
Applications of Machine Learning4min
Machine Learning Fundamentals6min
Linear Regression6min
Training Linear Regression Model8min
Applying Machine Learning with UDFs4min
Course Summary3min
2 leituras
Readings1h
Assignment #4 - Logistic Regression Classifier10min
2 exercícios práticos
Assignment #4 Quiz - Logistic Regression Classifier30min
Module 4 Quiz30min

Avaliações

Principais avaliações do DISTRIBUTED COMPUTING WITH SPARK SQL

Visualizar todas as avaliações

Sobre Programa de cursos integrados Learn SQL Basics for Data Science

Learn SQL Basics for Data Science

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.