Previous slide
Next slide
Toggle fullscreen
Open presenter view
Fundamentos de Métodos de Diferença Temporal - parte 2
Aprendizado por reforço para aplicações em redes neurais
Prof. Hallison Paz
12 de março de 2024
Dúvidas e Dívidas
Ponderada sobre gridworld: entrega 12/03/2024 (hoje)!
Ponderada "Fundamentos ... TD 1": entrega ??/03/2024.
Correção das ponderadas de função de Markov e Bellman.
1ª Prova.
O custo do erro
Autoestudos na Adalove
Ponderada da semana 5
Dúvidas?
Bibliografia complementar
Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller.
Playing Atari with Deep Reinforcement Learning
. ArXiv preprint arXiv:1312.5602 (2013)