Informações sobre o curso

105.134 visualizações recentes
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglês

O que você vai aprender

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Habilidades que você terá

  • Artificial Intelligence (AI)
  • Machine Learning
  • Reinforcement Learning
  • Function Approximation
  • Intelligent Systems
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglês

oferecido por

Placeholder

Universidade de AlbertaUniversidade de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - O que você aprenderá com este curso

Classificação do conteúdoThumbs Up93%(15,162 classificações)Info
Semana
1

Semana 1

1 hora para concluir

Welcome to the Course!

1 hora para concluir
4 vídeos (Total 20 mín.), 2 leituras
4 horas para concluir

An Introduction to Sequential Decision-Making

4 horas para concluir
8 vídeos (Total 46 mín.), 3 leituras, 2 testes
Semana
2

Semana 2

3 horas para concluir

Markov Decision Processes

3 horas para concluir
7 vídeos (Total 36 mín.), 2 leituras, 2 testes
Semana
3

Semana 3

3 horas para concluir

Value Functions & Bellman Equations

3 horas para concluir
9 vídeos (Total 56 mín.), 3 leituras, 2 testes
Semana
4

Semana 4

4 horas para concluir

Dynamic Programming

4 horas para concluir
10 vídeos (Total 72 mín.), 3 leituras, 2 testes

Avaliações

Principais avaliações do FUNDAMENTALS OF REINFORCEMENT LEARNING

Visualizar todas as avaliações

Sobre Programa de cursos integrados Reforço de aprendizagem

Reforço de aprendizagem

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao estudante.