Informações sobre o curso
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 17 horas para completar

Sugerido: 8 horas semana en promedio...
Idiomas disponíveis

Espanhol

Legendas: Espanhol...
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 17 horas para completar

Sugerido: 8 horas semana en promedio...
Idiomas disponíveis

Espanhol

Legendas: Espanhol...

Programa - O que você aprenderá com este curso

Semana
1
Horas para completar
1 hora para concluir

INTRODUCCIÓN

...
Reading
1 vídeo (Total de 3 min), 8 leituras
Reading8 leituras
BIENVENIDA1min
Contenidos del curso (Temario)3min
Organización del curso y evaluación7min
Sobre el certificado2min
FAQs - Generales10min
FAQs - Cuestionarios y ejercicios2min
FAQs - Certificado10min
Links relacionados2min
Horas para completar
1 hora para concluir

LA MÁQUINA VIRTUAL

A lo largo de estos cursos vamos a trabajar con un conjunto de herramientas contenidas en la máquina virtual Cloudera. En este apartado te explicamos cómo descargar e instalar dicha máquina virtual en tu ordenador. <br><br>La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco. <br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 vídeos (Total de 16 min), 4 leituras
Video4 videos
Instalación de la máquina virtual - Import start4min
Instalación de la máquina virtual - Tips3min
Instalación de la máquina virtual - Pyspark setup4min
Reading4 leituras
Link para la descarga de la MV_Cloudera20min
Instalación de la MV - Import start20min
Instalación de la MV - Tips10min
Instalación de la MV - Pyspark set up10min
Horas para completar
2 horas para concluir

MÓDULO 1 - Introducción al ecosistema Apache Hadoop

En este módulo se van a introducir los conceptos básicos sobre el uso de Apache Hadoop y su utilización para plantear análisis de grandes conjuntos de datos. Se van a presentar las herramientas principales y la arquitectura del sistema.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Hadoop y HDFS, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 vídeos (Total de 55 min), 1 leitura, 2 testes
Video7 videos
El ecosistema Hadoop11min
Modelo Map Reduce11min
HDFS: Hadoop Distributed File System7min
Arquitectura HDFS8min
YARN: Yet Another Resource Negotiator8min
HADOOP6min
Reading1 leituras
LEEME10min
Quiz2 exercícios práticos
Cuestionario ecosistema Hadoop20min
Ejercicio práctico Hadoop y HDFS30min
Semana
2
Horas para completar
2 horas para concluir

MÓDULO 2 - Tecnologías SQL y NoSQL. Consistencia, fiabilidad y escalabilidad

En este módulo se introducen conceptos básicos sobre la naturaleza de los datos a tratar y de qué forma los sistemas NoSQL se diferencian de las bases de datos relacionales. Se presenta el teorema CAP y se muestra su importancia en el contexto de los sistemas distribuidos. Finalmente, se muestran una serie de sistemas junto con su uso en la industria actual. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
7 vídeos (Total de 76 min), 1 teste
Video7 videos
Tipos de datos8min
Tecnologías SQL y NoSQL12min
Consistencia, fiabilidad y escalabilidad7min
Tecnologías de BBDD NoSQL I11min
Tecnologías de BBDD NoSQL II22min
Introducción a BBDD analíticas y orientadas a grafos12min
Quiz1 exercício prático
Bases de datos NoSQL18min
Semana
3
Horas para completar
2 horas para concluir

MÓDULO 3 - Adquisición de datos

En este módulo se presentan los desafíos que hay que resolver a la hora de incorporar datos a los sistemas NoSQL y una breve introducción a las herramientas asociadas al ecosistema Hadoop más importantes. <br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza el ejercicio práctico sobre Apache Scoop, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
6 vídeos (Total de 44 min), 1 leitura, 2 testes
Video6 videos
Adquisición de datos13min
Apache Flume6min
Apache Sqoop6min
Apache Kafka7min
SQOOP7min
Reading1 leituras
LEEME10min
Quiz2 exercícios práticos
Adquisición de datos18min
Ejercicio práctico Apache Sqoop20min
Semana
4
Horas para completar
3 horas para concluir

MÓDULO 4 - Herramientas para el análisis de datos industrial

En este módulo se presenta el análisis industrial de grandes volúmenes de datos y se introducen una serie de herramientas y sistemas de segunda generación dedicados a resolver necesidades específicas de la industria.<br><br><i>Visualiza los vídeos, contesta el cuestionario tantas veces como quieras, realiza los ejercicios prácticos sobre Apache Hive y Sparck, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 vídeos (Total de 102 min), 1 leitura, 3 testes
Video10 videos
Bases de datos analíticas10min
Business Intelligence14min
Apache Impala8min
Apache Hive11min
Apache Spark14min
Graph processing (I)11min
Graph processing (II)13min
HIVE6min
SPARK8min
Reading1 leituras
LEEME10min
Quiz3 exercícios práticos
Bases de datos analíticas18min
Ejercicio Apache Hive6min
Ejercicio sesión básica con Apache Spark30min

Instrutores

Avatar

Antonio Espinosa

Profesor Agregado Interino
Departamento de Arquitectura de Computadores y Sistemas Operativos
Avatar

Tomás Margalef

Catedrático
Dept. de Arquitectura de Computadores y Sistemas Operativos
Avatar

Andrés Cencerrado

Profesor
Área de Arquitectura y de Tecnología de Computadores

Sobre Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

Sobre o Programa de cursos integrados Big Data – Introducción al uso práctico de datos masivos

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.