Informações sobre o curso
5.0
1 classificações
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 17 horas para completar

Sugerido: Se estima una dedicación de 6 a 8 horas por semana....
Idiomas disponíveis

Espanhol

Legendas: Espanhol...
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível intermediário

Nível intermediário

Horas para completar

Aprox. 17 horas para completar

Sugerido: Se estima una dedicación de 6 a 8 horas por semana....
Idiomas disponíveis

Espanhol

Legendas: Espanhol...

Programa - O que você aprenderá com este curso

Semana
1
Horas para completar
1 horas para concluir

INTRODUCCIÓN

...
Reading
2 vídeos (Total de 10 min), 8 leituras
Video2 videos
Presentación del curso6min
Reading8 leituras
Bienvenida1min
Contenidos del curso (Temario)1min
Organización del curso y evaluación5min
Sobre el certificado2min
FAQs - Generales10min
FAQs - Cuestionarios y ejercicios2min
FAQs - Certificado10min
Enlaces relacionados1min
Horas para completar
1 horas para concluir

LA MÁQUINA VIRTUAL

<b>ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.</b><br><br>Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data. En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data. En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador. La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.<br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 vídeos (Total de 16 min), 4 leituras
Video4 videos
Instalación de la máquina virtual - Import start4min
Instalación de la máquina virtual - Tips3min
Instalación de la máquina virtual - Pyspark setup4min
Reading4 leituras
Link para la descarga de la MV_Cloudera10min
Instalación de la MV - Import start10min
Instalación de la MV - Tips10min
Instalación de la MV - Pyspark setup10min
Horas para completar
2 minutos para concluir

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO

Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de ficheros de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido. Verás que algunos vídeos llevan un código entre paréntesis que coincide con el nombre de alguno de estos ficheros. Esto significa que en el vídeo correspondiente se trabaja con dicho fichero. <br><br>A continuación te explicamos como incorporarlos en la máquina virtual....
Reading
2 leituras
Reading2 leituras
FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE1min
INICIO DE LA SESIÓN - IMPORTANTE1min
Horas para completar
2 horas para concluir

MÓDULO 1 - Análisis Exploratorio de Datos

Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos. Cada pocos temas tratados en los vídeos encontrarás un pequeño custionario de 5 preguntas. <br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 vídeos (Total de 84 min), 6 testes
Video10 videos
Datos - Fuentes de información4min
Distintos problemas y técnicas8min
Caso de estudio y herramientas4min
Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)5min
Exploración de la estructura de datos (S1E5.ipynb)14min
Primera etapa del análisis exploratorio (S1E6.ipynb)11min
Preproceso de datos (I) - (S1E7.ipynb)11min
Preproceso de datos (II) - (S1E8.ipynb)6min
Segunda etapa del análisis exploratorio (S1E9.ipynb)14min
Quiz6 exercícios práticos
Cuestionario 110min
Cuestionario 210min
Cuestionario 310min
Cuestionario 410min
Cuestionario 510min
Cuestionario 610min
Semana
2
Horas para completar
3 horas para concluir

MÓDULO 2 - MODELOS DE REGRESIÓN

En el módulo 2 del curso se introducen conceptos de modelización generales (calibración y validación) y en particular los modelos de regresión lineal y regresión logística. Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación. <br><br><i>Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 vídeos (Total de 89 min), 7 testes
Video10 videos
Objetivo de la Modelización8min
Calibración del modelo10min
Resultado de la Modelización11min
Regresión Simple (S2E4.ipynb)11min
Nuevas variables (S2E5.ipynb)8min
Regresión Múltiple (I) (S2E6.ipynb)7min
Regresión Múltiple (II) (S2E7.ipynb)11min
Regresión Logística (I) (S2E8.ipynb)8min
Regresión Logística (II) (S2E9.ipynb)10min
Quiz7 exercícios práticos
Cuestionario 110min
Cuestionario 210min
Cuestionario 310min
Cuestionario 410min
Cuestionario 510min
Cuestionario 610min
Cuestionario 710min
Semana
3
Horas para completar
3 horas para concluir

MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN

En el módulo 3 del curso se introduce la família de modelos basada en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste. Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 vídeos (Total de 89 min), 7 testes
Video10 videos
Introducción a la Modelización5min
Medir la Incertidumbre10min
Concepto de Árbol8min
Árboles de Regresión11min
Modelización con Árboles de Regresión (S3E5.ipynb)9min
Árboles de Clasificación9min
Modelización con Árboles de Clasificación (S3E7.ipynb)9min
Bosques Aleatorios14min
Modelización con Bosques Aleatorios (S3E9.ipynb)9min
Quiz7 exercícios práticos
Cuestionario 18min
Cuestionario 210min
Cuestionario 310min
Cuestionario 410min
Cuestionario 510min
Cuestionario 610min
Cuestionario 710min
Semana
4
Horas para completar
3 horas para concluir

MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS

En el módulo 4 del curso se introduce la família de modelos basada en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad. En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza el ejercicios práctico, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 vídeos (Total de 75 min), 1 leitura, 7 testes
Video10 videos
Redes Neuronales12min
Modelización con redes neuronales (S4E2.ipynb)6min
Introducción al reconocimiento de patrones5min
Reducción dimensión11min
Análisis de componentes principales (S4E6.ipynb)10min
Clasificación automática8min
Análisis de clústers (S4E8.ipynb)7min
Revisión de la ciencia de datos (I)5min
Revisión de la ciencia de datos (II)6min
Reading1 leituras
TRABAJO PRÁCTICO - Enunciado30min
Quiz7 exercícios práticos
Cuestionario 110min
Cuestionario 210min
Cuestionario 310min
Cuestionario 410min
Cuestionario 510min
Cuestionario 610min
Cuestionario del Ejercicio Práctico30min

Instrutores

Avatar

Llorenç Badiella

Director Servei d'Estadística Aplicada UAB
Universitat Autònoma de Barcelona
Avatar

Isabel Serra

Doctora
Centre de Recerca Matemàtica

Sobre Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

Sobre o Programa de cursos integrados Big Data – Introducción al uso práctico de datos masivos

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.