Informações sobre o curso
4.3
117 classificações
33 avaliações
Programa de cursos integrados
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível avançado

Nível avançado

Horas para completar

Aprox. 39 horas para completar

Sugerido: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...
Idiomas disponíveis

Inglês

Legendas: Inglês
Programa de cursos integrados
100% online

100% online

Comece imediatamente e aprenda em seu próprio cronograma.
Prazos flexíveis

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.
Nível avançado

Nível avançado

Horas para completar

Aprox. 39 horas para completar

Sugerido: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...
Idiomas disponíveis

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1
Horas para completar
5 horas para concluir

Intro: why should i care?

In this module we gonna define and "taste" what reinforcement learning is about. We'll also learn one simple algorithm that can solve reinforcement learning problems with embarrassing efficiency....
Reading
13 vídeos (total de (Total 84 mín.) min), 7 leituras, 3 testes
Video13 videos
Reinforcement learning vs all3min
Multi-armed bandit4min
Decision process & applications6min
Markov Decision Process5min
Crossentropy method9min
Approximate crossentropy method5min
More on approximate crossentropy method6min
Evolution strategies: core idea6min
Evolution strategies: math problems5min
Evolution strategies: log-derivative trick8min
Evolution strategies: duct tape6min
Blackbox optimization: drawbacks4min
Reading7 leituras
What you're getting into1min
Setting up course environment10min
Note: this course vs github course1min
Course teaser placeholder10min
Primers1min
About honors track1min
Extras10min
Semana
2
Horas para completar
3 horas para concluir

At the heart of RL: Dynamic Programming

This week we'll consider the reinforcement learning formalisms in a more rigorous, mathematical way. You'll learn how to effectively compute the return your agent gets for a particular action - and how to pick best actions based on that return....
Reading
5 vídeos (total de (Total 54 mín.) min), 2 leituras, 4 testes
Video5 videos
State and Action Value Functions13min
Measuring Policy Optimality6min
Policy: evaluation & improvement10min
Policy and value iteration8min
Reading2 leituras
Advanced Reward Design10min
Discrete Stochastic Dynamic Programming10min
Quiz3 exercícios práticos
Reward design8min
Optimality in RL10min
Policy Iteration14min
Semana
3
Horas para completar
5 horas para concluir

Model-free methods

This week we'll find out how to apply last week's ideas to the real world problems: ones where you don't have a perfect model of your environment....
Reading
6 vídeos (total de (Total 47 mín.) min), 1 leitura, 4 testes
Video6 videos
Monte-Carlo & Temporal Difference; Q-learning8min
Exploration vs Exploitation8min
Footnote: Monte-Carlo vs Temporal Difference2min
Accounting for exploration. Expected Value SARSA.11min
On-policy vs off-policy; Experience replay7min
Reading1 leituras
Extras10min
Quiz1 exercício prático
Model-free reinforcement learning10min
Semana
4
Horas para completar
5 horas para concluir

Approximate Value Based Methods

This week we'll learn to scale things even farther up by training agents based on neural networks....
Reading
9 vídeos (total de (Total 104 mín.) min), 3 leituras, 5 testes
Video9 videos
Loss functions in value based RL11min
Difficulties with Approximate Methods15min
DQN – bird's eye view9min
DQN – the internals9min
DQN: statistical issues6min
Double Q-learning6min
More DQN tricks10min
Partial observability17min
Reading3 leituras
TD vs MC10min
Extras10min
DQN follow-ups10min
Quiz3 exercícios práticos
MC & TD8min
SARSA and QLeaning8min
DQN12min
4.3
33 avaliaçõesChevron Right

Melhores avaliações

por TCMay 17th 2018

Great course. Best course so far on reinforcement learning.

Instrutores

Avatar

Pavel Shvechikov

Researcher at HSE and Sberbank AI Lab
HSE Faculty of Computer Science
Avatar

Alexander Panin

Lecturer
HSE Faculty of Computer Science

Sobre National Research University Higher School of Economics

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communications, IT, mathematics, engineering, and more. Learn more on www.hse.ru...

Sobre o Programa de cursos integrados Advanced Machine Learning

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Advanced Machine Learning

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.