Informações sobre o curso
4.2
161 classificações
47 avaliações

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível avançado

Aprox. 39 horas para completar

Sugerido: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Inglês

Legendas: Inglês

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível avançado

Aprox. 39 horas para completar

Sugerido: 6 weeks of study, 3-6 hours/week for base track, 6-9 with all the horrors of honors section...

Inglês

Legendas: Inglês

Programa - O que você aprenderá com este curso

Semana
1
5 horas para concluir

Intro: why should i care?

In this module we gonna define and "taste" what reinforcement learning is about. We'll also learn one simple algorithm that can solve reinforcement learning problems with embarrassing efficiency....
13 vídeos (total de (Total 84 mín.) min), 7 leituras, 3 testes
13 videos
Reinforcement learning vs all3min
Multi-armed bandit4min
Decision process & applications6min
Markov Decision Process5min
Crossentropy method9min
Approximate crossentropy method5min
More on approximate crossentropy method6min
Evolution strategies: core idea6min
Evolution strategies: math problems5min
Evolution strategies: log-derivative trick8min
Evolution strategies: duct tape6min
Blackbox optimization: drawbacks4min
7 leituras
What you're getting into1min
Setting up course environment10min
Note: this course vs github course1min
Course teaser placeholder10min
Primers1min
About honors track1min
Extras10min
Semana
2
3 horas para concluir

At the heart of RL: Dynamic Programming

This week we'll consider the reinforcement learning formalisms in a more rigorous, mathematical way. You'll learn how to effectively compute the return your agent gets for a particular action - and how to pick best actions based on that return....
5 vídeos (total de (Total 54 mín.) min), 2 leituras, 4 testes
5 videos
State and Action Value Functions13min
Measuring Policy Optimality6min
Policy: evaluation & improvement10min
Policy and value iteration8min
2 leituras
Advanced Reward Design10min
Discrete Stochastic Dynamic Programming10min
3 exercícios práticos
Reward design8min
Optimality in RL10min
Policy Iteration14min
Semana
3
5 horas para concluir

Model-free methods

This week we'll find out how to apply last week's ideas to the real world problems: ones where you don't have a perfect model of your environment....
6 vídeos (total de (Total 47 mín.) min), 1 leitura, 4 testes
6 videos
Monte-Carlo & Temporal Difference; Q-learning8min
Exploration vs Exploitation8min
Footnote: Monte-Carlo vs Temporal Difference2min
Accounting for exploration. Expected Value SARSA.11min
On-policy vs off-policy; Experience replay7min
1 leituras
Extras10min
1 exercício prático
Model-free reinforcement learning10min
Semana
4
5 horas para concluir

Approximate Value Based Methods

This week we'll learn to scale things even farther up by training agents based on neural networks....
9 vídeos (total de (Total 104 mín.) min), 3 leituras, 5 testes
9 videos
Loss functions in value based RL11min
Difficulties with Approximate Methods15min
DQN – bird's eye view9min
DQN – the internals9min
DQN: statistical issues6min
Double Q-learning6min
More DQN tricks10min
Partial observability17min
3 leituras
TD vs MC10min
Extras10min
DQN follow-ups10min
3 exercícios práticos
MC & TD8min
SARSA and QLeaning8min
DQN12min
4.2
47 avaliaçõesChevron Right

33%

comecei uma nova carreira após concluir estes cursos

60%

consegui um benefício significativo de carreira com este curso

25%

recebi um aumento ou promoção

Melhores avaliações

por FZFeb 14th 2019

A great course with very practical assignments to help you learn how to implement RL algorithms. But it also has some stupid quiz questions which makes you feel confusing.

por AHAug 17th 2018

Learned a lot. The pace is quick and the assignment is challenging sometimes

Instrutores

Avatar

Pavel Shvechikov

Researcher at HSE and Sberbank AI Lab
HSE Faculty of Computer Science
Avatar

Alexander Panin

Lecturer
HSE Faculty of Computer Science

Sobre National Research University Higher School of Economics

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more. Learn more on www.hse.ru...

Sobre o Programa de cursos integrados Advanced Machine Learning

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Advanced Machine Learning

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você se inscreve no curso, tem acesso a todos os cursos na Especialização e pode obter um certificado quando concluir o trabalho. Seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.