Informações sobre o curso

138,438 visualizações recentes

Resultados de carreira do aprendiz

14%

comecei uma nova carreira após concluir estes cursos
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglês

O que você vai aprender

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Habilidades que você terá

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

Resultados de carreira do aprendiz

14%

comecei uma nova carreira após concluir estes cursos
Certificados compartilháveis
Tenha o certificado após a conclusão
100% on-line
Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Nível intermediário

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglês

oferecido por

Placeholder

Universidade de AlbertaUniversidade de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - O que você aprenderá com este curso

Classificação do conteúdoThumbs Up93%(13,182 classificações)Info
Semana
1

Semana 1

1 hora para concluir

Welcome to the Course!

1 hora para concluir
4 vídeos (Total 20 mín.), 2 leituras
4 horas para concluir

An Introduction to Sequential Decision-Making

4 horas para concluir
8 vídeos (Total 46 mín.), 3 leituras, 2 testes
Semana
2

Semana 2

3 horas para concluir

Markov Decision Processes

3 horas para concluir
7 vídeos (Total 36 mín.), 2 leituras, 2 testes
Semana
3

Semana 3

3 horas para concluir

Value Functions & Bellman Equations

3 horas para concluir
9 vídeos (Total 56 mín.), 3 leituras, 2 testes
Semana
4

Semana 4

4 horas para concluir

Dynamic Programming

4 horas para concluir
10 vídeos (Total 72 mín.), 3 leituras, 2 testes

Avaliações

Principais avaliações do FUNDAMENTALS OF REINFORCEMENT LEARNING

Visualizar todas as avaliações

Sobre Programa de cursos integrados Reforço de aprendizagem

Reforço de aprendizagem

Perguntas Frequentes – FAQ

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.