Informações sobre o curso
93,709 visualizações recentes

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 20 horas para completar

Sugerido: 4-6 hours/week...

Inglês

Legendas: Inglês
User
Os alunos que estão fazendo este Course são
  • Data Scientists
  • Scientists
  • Machine Learning Engineers
  • Researchers
  • Data Engineers

Habilidades que você terá

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
User
Os alunos que estão fazendo este Course são
  • Data Scientists
  • Scientists
  • Machine Learning Engineers
  • Researchers
  • Data Engineers

100% on-line

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 20 horas para completar

Sugerido: 4-6 hours/week...

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1
1 hora para concluir

Welcome to the Course!

2 vídeos (Total 10 mín.), 2 leituras
2 videos
Meet your instructors!8min
2 leituras
Reinforcement Learning Textbook10min
Read Me: Pre-requisites and Learning Objectives10min
Semana
2
3 horas para concluir

Monte Carlo Methods for Prediction & Control

11 vídeos (Total 58 mín.), 2 leituras, 1 teste
11 videos
Using Monte Carlo for Prediction6min
Using Monte Carlo for Action Values2min
Using Monte Carlo methods for generalized policy iteration2min
Solving the Blackjack Example3min
Epsilon-soft policies5min
Why does off-policy learning matter?4min
Importance Sampling4min
Off-Policy Monte Carlo Prediction5min
Emma Brunskill: Batch Reinforcement Learning12min
Week 1 Summary3min
2 leituras
Weekly Reading40min
Chapter Summary40min
1 exercício prático
Graded Quiz
Semana
3
6 horas para concluir

Temporal Difference Learning Methods for Prediction

6 vídeos (Total 37 mín.), 1 leitura, 2 testes
6 videos
Rich Sutton: The Importance of TD Learning6min
The advantages of temporal difference learning5min
Comparing TD and Monte Carlo5min
Andy Barto and Rich Sutton: More on the History of RL12min
Week 2 Summary2min
1 leituras
Weekly Reading40min
1 exercício prático
Practice Quiz30min
Semana
4
8 horas para concluir

Temporal Difference Learning Methods for Control

9 vídeos (Total 30 mín.), 2 leituras, 2 testes
9 videos
Sarsa in the Windy Grid World3min
What is Q-learning?3min
Q-learning in the Windy Grid World3min
How is Q-learning off-policy?4min
Expected Sarsa3min
Expected Sarsa in the Cliff World3min
Generality of Expected Sarsa1min
Week 3 Summary2min
2 leituras
Weekly Reading40min
Chapter summary40min
1 exercício prático
Practice Quiz18min
4.7
20 avaliaçõesChevron Right

Principais avaliações do Sample-based Learning Methods

por KNOct 3rd 2019

Great course! The notebooks are a perfect level of difficulty for someone learning RL for the first time. Thanks Martha and Adam for all your work on this!! Great content!!

por IFSep 29th 2019

Great course. Clear, concise, practical. Right amount of programming. Right amount of tests of conceptual knowledge. Almost perfect course.

Instrutores

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

Sobre Universidade de AlbertaUniversidade de Alberta

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

Sobre Alberta Machine Intelligence Institute

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

Sobre Programa de cursos integrados Reforço de aprendizagem

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Reforço de aprendizagem

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.