Mejores prácticas para el procesamiento de datos en Big Data

4.9
estrelas
40 classificações
oferecido por
Coursera Project Network
Neste projeto guiado, você irá:

Utilizar las librerías adecuadas en un contexto de Big Data

Crear clúster para procesamiento masivo

Crear funciones de usuario para optimizar el análisis

Clock60 minutos
IntermediateIntermediário
CloudSem necessidade de download
VideoVídeo em tela dividida
Comment DotsEspanhol
LaptopApenas em desktop

En este proyecto de 1 hora, aprenderás a aplicar buenas prácticas bajo el contexto de procesamiento Big Data, utilizando una de las plataformas más importantes en la actualidad, Databricks. Además, podrás analizar las mejores opciones y librerías para la manipulación de datos sobre dataframes de Spark.

Habilidades que você desenvolverá

  • Big Data
  • PySpark
  • Databricks

Aprender passo a passo

Em um vídeo reproduzido em uma tela dividida com a área de trabalho, seu instrutor o orientará sobre esses passos:

  1. Creación de clústers

  2. Uso de Dataframes, SQL y Hive

  3. Crear funciones definidas por usuario (UDF)

  4. Uso de librería Koalas

  5. Streaming de datos y joins

Como funcionam os projetos guiados

Sua área de trabalho é um espaço em nuvem, acessado diretamente do navegador, sem necessidade de nenhum download

Em um vídeo de tela dividida, seu instrutor te orientará passo a passo

Avaliações

Principais avaliações do MEJORES PRÁCTICAS PARA EL PROCESAMIENTO DE DATOS EN BIG DATA

Visualizar todas as avaliações

Perguntas Frequentes – FAQ

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao estudante.