Informações sobre o curso

15,421 visualizações recentes

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 16 horas para completar

Sugerido: 4 weeks of study, 2-5 hours/week...

Inglês

Legendas: Inglês

O que você vai aprender

  • Check

    U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Check

    Use Spark UI to analyze performance and identify bottlenecks

  • Check

    Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • Check

    B​uild a linear regression model and make predictions using SparkSQL

Habilidades que você terá

Data ScienceApache SparkSQL

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 16 horas para completar

Sugerido: 4 weeks of study, 2-5 hours/week...

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1

Semana 1

3 horas para concluir

Introduction to Spark

3 horas para concluir
6 vídeos (Total 32 mín.), 3 leituras, 2 testes
6 videos
Why Distributed Computing?7min
Spark DataFrames6min
The Databricks Environment8min
SQL in Notebooks3min
Import Data2min
3 leituras
A Note From UC Davis10min
Readings and Resources40min
Assignment #1 - Queries in Spark SQL30min
2 exercícios práticos
Assignment #1 Quiz - Queries in Spark SQL30min
Module 1 Quiz30min
Semana
2

Semana 2

2 horas para concluir

Spark Core Concepts

2 horas para concluir
6 vídeos (Total 25 mín.), 2 leituras, 2 testes
6 videos
Spark Terminology3min
Caching5min
Shuffle Partitions7min
Spark UI3min
Broadcast Joins3min
2 leituras
Readings30min
Assignment #2 - Spark Internals30min
2 exercícios práticos
Assignment #2 Quiz - Spark Internals30min
Module 2 Quiz30min
Semana
3

Semana 3

3 horas para concluir

Engineering Data Pipelines

3 horas para concluir
7 vídeos (Total 43 mín.), 2 leituras, 2 testes
7 videos
Spark as a Connector6min
Accessing Data10min
File Formats8min
Schemas and Types4min
Writing Data6min
Managed and Unmanaged Tables4min
2 leituras
Readings20min
Assignment #3 - Engineering Data Pipelines30min
2 exercícios práticos
Assignment #3 Quiz - Engineering Data Pipelines30min
Module 3 Quiz30min
Semana
4

Semana 4

4 horas para concluir

Machine Learning Applications of Spark

4 horas para concluir
7 vídeos (Total 35 mín.), 2 leituras, 3 testes
7 videos
Applications of Machine Learning4min
Machine Learning Fundamentals6min
Linear Regression6min
Training Linear Regression Model8min
Applying Machine Learning with UDFs4min
Course Summary3min
2 leituras
Readings20min
Assignment #4 - Logistic Regression Classifier10min
2 exercícios práticos
Assignment #4 Quiz - Logistic Regression Classifier30min
Module 4 Quiz30min
4.5

2 avaliações

Chevron Right

Principais avaliações do Distributed Computing with Spark SQL

por JBJan 6th 2020

Extremely informative for those who are seeking to learn the fundamentals for distributed computing using Spark SQL.

Instrutores

Imagem do instrutor, Brooke Wenig

Brooke Wenig

Machine Learning Practice Lead at Databricks
Continuing and Professional Education
Imagem do instrutor, Conor Murphy

Conor Murphy

Data Scientist at Databricks
Continuing and Professional Education

Sobre Universidade da Califórnia, Davis

UC Davis, one of the nation’s top-ranked research universities, is a global leader in agriculture, veterinary medicine, sustainability, environmental and biological sciences, and technology. With four colleges and six professional schools, UC Davis and its students and alumni are known for their academic excellence, meaningful public service and profound international impact....

Sobre Programa de cursos integrados Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.