Informações sobre o curso

64,783 visualizações recentes
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário
Aprox. 13 horas para completar
Inglês
Legendas: Inglês

O que você vai aprender

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

Habilidades que você terá

Data ScienceApache SparkSQL
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário
Aprox. 13 horas para completar
Inglês
Legendas: Inglês

oferecido por

Logotipo de Universidade da Califórnia, Davis

Universidade da Califórnia, Davis

Programa - O que você aprenderá com este curso

Semana
1

Semana 1

3 horas para concluir

Introduction to Spark

3 horas para concluir
6 vídeos (Total 32 mín.), 3 leituras, 2 testes
6 videos
Why Distributed Computing?7min
Spark DataFrames6min
The Databricks Environment8min
SQL in Notebooks3min
Import Data2min
3 leituras
A Note From UC Davis10min
Readings and Resources40min
Assignment #1 - Queries in Spark SQL30min
2 exercícios práticos
Assignment #1 Quiz - Queries in Spark SQL30min
Module 1 Quiz30min
Semana
2

Semana 2

2 horas para concluir

Spark Core Concepts

2 horas para concluir
6 vídeos (Total 25 mín.), 2 leituras, 2 testes
6 videos
Spark Terminology3min
Caching5min
Shuffle Partitions7min
Spark UI3min
Broadcast Joins3min
2 leituras
Readings30min
Assignment #2 - Spark Internals30min
2 exercícios práticos
Assignment #2 Quiz - Spark Internals30min
Module 2 Quiz30min
Semana
3

Semana 3

3 horas para concluir

Engineering Data Pipelines

3 horas para concluir
7 vídeos (Total 43 mín.), 2 leituras, 2 testes
7 videos
Spark as a Connector6min
Accessing Data10min
File Formats8min
Schemas and Types4min
Writing Data6min
Managed and Unmanaged Tables4min
2 leituras
Readings1h
Assignment #3 - Engineering Data Pipelines30min
2 exercícios práticos
Assignment #3 Quiz - Engineering Data Pipelines30min
Module 3 Quiz30min
Semana
4

Semana 4

5 horas para concluir

Machine Learning Applications of Spark

5 horas para concluir
7 vídeos (Total 35 mín.), 2 leituras, 3 testes
7 videos
Applications of Machine Learning4min
Machine Learning Fundamentals6min
Linear Regression6min
Training Linear Regression Model8min
Applying Machine Learning with UDFs4min
Course Summary3min
2 leituras
Readings1h
Assignment #4 - Logistic Regression Classifier10min
2 exercícios práticos
Assignment #4 Quiz - Logistic Regression Classifier30min
Module 4 Quiz30min

Avaliações

Principais avaliações do DISTRIBUTED COMPUTING WITH SPARK SQL

Visualizar todas as avaliações

Sobre Programa de cursos integrados Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Perguntas Frequentes – FAQ

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

  • Se você se inscrever, terá 7 dias para testar sem custo e, durante este período, pode cancelar sem multa. Depois disso, não reembolsamos, mas você pode cancelar sua inscrição a qualquer momento. Veja nossa política para o reembolso total.

  • Sim, a Coursera oferece auxílio financeiro ao aluno que não possa pagar a taxa. Faça a solicitação clicando no link Auxílio Financeiro, abaixo do botão "Inscreva-se" à esquerda. Preencha uma solicitação e será notificado caso seja aprovado. Você terá que completar esta etapa para cada curso na Especialização, incluindo o Trabalho de Conclusão de Curso. Saiba mais .

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.