Informações sobre o curso

16,565 visualizações recentes
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Aprox. 20 horas para completar
Inglês

Habilidades que você terá

Relational AlgebraPython ProgrammingMapreduceSQL
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Aprox. 20 horas para completar
Inglês

Instrutores

oferecido por

Placeholder

Universidade de Washington

Programa - O que você aprenderá com este curso

Classificação do conteúdoThumbs Up89%(2,830 classificações)Info
Semana
1

Semana 1

6 horas para concluir

Data Science Context and Concepts

6 horas para concluir
22 vídeos (Total 125 mín.), 4 leituras, 1 teste
22 videos
Appetite Whetting: Extreme Weather2min
Appetite Whetting: Digital Humanities8min
Appetite Whetting: Bibliometrics4min
Appetite Whetting: Food, Music, Public Health5min
Appetite Whetting: Public Health cont'd, Earthquakes, Legal4min
Characterizing Data Science5min
Characterizing Data Science, cont'd5min
Distinguishing Data Science from Related Topics4min
Four Dimensions of Data Science6min
Tools vs. Abstractions7min
Desktop Scale vs. Cloud Scale5min
Hackers vs. Analysts2min
Structs vs. Stats5min
Structs vs. Stats cont'd5min
A Fourth Paradigm of Science3min
Data-Intensive Science Examples6min
Big Data and the 3 Vs5min
Big Data Definitions4min
Big Data Sources6min
Course Logistics7min
Twitter Assignment: Getting Started14min
4 leituras
Supplementary: Three-Course Reading List10min
Supplementary: Resources for Learning Python10min
Supplementary: Class Virtual Machine10min
Supplementary: Github Instructions10min
Semana
2

Semana 2

5 horas para concluir

Relational Databases and the Relational Algebra

5 horas para concluir
24 vídeos (Total 122 mín.)
24 videos
From Data Models to Databases4min
Pre-Relational Databases5min
Motivating Relational Databases3min
Relational Databases: Key Ideas4min
Algebraic Optimization Overview6min
Relational Algebra Overview4min
Relational Algebra Operators: Union, Difference, Selection6min
Relational Algebra Operators: Projection, Cross Product4min
Relational Algebra Operators: Cross Product cont'd, Join6min
Relational Algebra Operators: Outer Join4min
Relational Algebra Operators: Theta-Join4min
From SQL to RA6min
Thinking in RA: Logical Query Plans4min
Practical SQL: Binning Timeseries5min
Practical SQL: Genomic Intervals6min
User-Defined Functions3min
Support for User-Defined Functions4min
Optimization: Physical Query Plans5min
Optimization: Choosing Physical Plans4min
Declarative Languages5min
Declarative Languages: More Examples4min
Views: Logical Data Independence5min
Indexes6min
Semana
3

Semana 3

5 horas para concluir

MapReduce and Parallel Dataflow Programming

5 horas para concluir
26 vídeos (Total 122 mín.)
26 videos
A Sketch of Algorithmic Complexity5min
A Sketch of Data-Parallel Algorithms5min
"Pleasingly Parallel" Algorithms4min
More General Distributed Algorithms4min
MapReduce Abstraction4min
MapReduce Data Model3min
Map and Reduce Functions2min
MapReduce Simple Example3min
MapReduce Simple Example cont'd3min
MapReduce Example: Word Length Histogram2min
MapReduce Examples: Inverted Index, Join6min
Relational Join: Map Phase4min
Relational Join: Reduce Phase4min
Simple Social Network Analysis: Counting Friends3min
Matrix Multiply Overview5min
Matrix Multiply Illustrated4min
Shared Nothing Computing4min
MapReduce Implementation5min
MapReduce Phases6min
A Design Space for Large-Scale Data Systems4min
Parallel and Distributed Query Processing5min
Teradata Example, MR Extensions5min
RDBMS vs. MapReduce: Features6min
RDBMS vs. Hadoop: Grep5min
RDBMS vs. Hadoop: Select, Aggregate, Join3min
Semana
4

Semana 4

3 horas para concluir

NoSQL: Systems and Concepts

3 horas para concluir
36 vídeos (Total 166 mín.)
36 videos
NoSQL Roundup4min
Relaxing Consistency Guarantees3min
Two-Phase Commit and Consensus Protocols5min
Eventual Consistency4min
CAP Theorem4min
Types of NoSQL Systems4min
ACID, Major Impact Systems4min
Memcached: Consistent Hashing2min
Consistent Hashing, cont'd4min
DynamoDB: Vector Clocks5min
Vector Clocks, cont'd5min
CouchDB Overview4min
CouchB Views3min
BigTable Overview5min
BigTable Implementation5min
HBase, Megastore3min
Spanner5min
Spanner cont'd, Google Systems6min
MapReduce-based Systems5min
Bringing Back Joins4min
NoSQL Rebuttal4min
Almost SQL: Pig4min
Pig Architecture and Performance3min
Data Model3min
Load, Filter, Group5min
Group, Distinct, Foreach, Flatten5min
CoGroup, Join3min
Join Algorithms3min
Skew5min
Other Commands3min
Evaluation Walkthrough3min
Review6min
Context3min
Spark Examples5min
RDDs, Benefits6min
2 horas para concluir

Graph Analytics

2 horas para concluir
21 vídeos (Total 91 mín.)
21 videos
Structural Analysis4min
Degree Histograms, Structure of the Web4min
Connectivity and Centrality4min
PageRank3min
PageRank in more Detail3min
Traversal Tasks: Spanning Trees and Circuits5min
Traversal Tasks: Maximum Flow1min
Pattern Matching6min
Querying Edge Tables4min
Relational Algebra and Datalog for Graphs4min
Querying Hybrid Graph/Relational Data3min
Graph Query Example: NSA6min
Graph Query Example: Recursion4min
Evaluation of Recursive Programs3min
Recursive Queries in MapReduce4min
The End-Game Problem3min
Representation: Edge Table, Adjacency List4min
Representation: Adjacency Matrix2min
PageRank in MapReduce5min
PageRank in Pregel5min

Avaliações

Principais avaliações do MANIPULAÇÃO DE DADOS EM ESCALA: SISTEMAS E ALGORITIMOS

Visualizar todas as avaliações

Sobre Programa de cursos integrados Ciência de dados em larga escalaCiência de Dados em Larga Escala

Ciência de dados em larga escalaCiência de Dados em Larga Escala

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.