Informações sobre o curso

68,508 visualizações recentes

Resultados de carreira do aprendiz

33%

comecei uma nova carreira após concluir estes cursos

33%

consegui um benefício significativo de carreira com este curso

33%

recebi um aumento ou promoção
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 22 horas para completar
Inglês

Habilidades que você terá

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

Resultados de carreira do aprendiz

33%

comecei uma nova carreira após concluir estes cursos

33%

consegui um benefício significativo de carreira com este curso

33%

recebi um aumento ou promoção
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 22 horas para completar
Inglês

oferecido por

Placeholder

Universidade de AlbertaUniversidade de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - O que você aprenderá com este curso

Classificação do conteúdoThumbs Up92%(3,076 classificações)Info
Semana
1

Semana 1

1 hora para concluir

Welcome to the Course!

1 hora para concluir
2 vídeos (Total 10 mín.), 2 leituras
2 videos
Meet your instructors!8min
2 leituras
Reinforcement Learning Textbook10min
Read Me: Pre-requisites and Learning Objectives10min
3 horas para concluir

Monte Carlo Methods for Prediction & Control

3 horas para concluir
11 vídeos (Total 58 mín.), 3 leituras, 2 testes
11 videos
Using Monte Carlo for Prediction6min
Using Monte Carlo for Action Values2min
Using Monte Carlo methods for generalized policy iteration2min
Solving the Blackjack Example3min
Epsilon-soft policies5min
Why does off-policy learning matter?4min
Importance Sampling4min
Off-Policy Monte Carlo Prediction5min
Emma Brunskill: Batch Reinforcement Learning12min
Week 1 Summary3min
3 leituras
Module 1 Learning Objectives10min
Weekly Reading40min
Chapter Summary40min
1 exercício prático
Graded Quiz30min
Semana
2

Semana 2

5 horas para concluir

Temporal Difference Learning Methods for Prediction

5 horas para concluir
6 vídeos (Total 37 mín.), 2 leituras, 2 testes
6 videos
Rich Sutton: The Importance of TD Learning6min
The advantages of temporal difference learning5min
Comparing TD and Monte Carlo5min
Andy Barto and Rich Sutton: More on the History of RL12min
Week 2 Summary2min
2 leituras
Module 2 Learning Objectives10min
Weekly Reading40min
1 exercício prático
Practice Quiz30min
Semana
3

Semana 3

6 horas para concluir

Temporal Difference Learning Methods for Control

6 horas para concluir
9 vídeos (Total 30 mín.), 3 leituras, 2 testes
9 videos
Sarsa in the Windy Grid World3min
What is Q-learning?3min
Q-learning in the Windy Grid World3min
How is Q-learning off-policy?4min
Expected Sarsa3min
Expected Sarsa in the Cliff World3min
Generality of Expected Sarsa1min
Week 3 Summary2min
3 leituras
Module 3 Learning Objectives10min
Weekly Reading40min
Chapter summary40min
1 exercício prático
Practice Quiz30min
Semana
4

Semana 4

7 horas para concluir

Planning, Learning & Acting

7 horas para concluir
11 vídeos (Total 47 mín.), 4 leituras, 2 testes
11 videos
Comparing Sample and Distribution Models2min
Random Tabular Q-planning3min
The Dyna Architecture5min
The Dyna Algorithm5min
Dyna & Q-learning in a Simple Maze5min
What if the model is inaccurate?3min
In-depth with changing environments5min
Drew Bagnell: self-driving, robotics, and Model Based RL7min
Week 4 Summary1min
Congratulations!2min
4 leituras
Module 4 Learning Objectives10min
Weekly Reading40min
Chapter Summary40min
Text Book Part 1 Summary40min
1 exercício prático
Practice Assessment45min

Avaliações

Principais avaliações do SAMPLE-BASED LEARNING METHODS

Visualizar todas as avaliações

Sobre Programa de cursos integrados Reforço de aprendizagem

Reforço de aprendizagem

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.