Visão Geral de Deep Reinforcement Learning

Aprendizado por reforço para aplicações em redes neurais

Prof. Hallison Paz

14 de março de 2024

Dúvidas e Dívidas


  • Ponderadas: até domingo (17/03/2024)!
  • Correção das provas: até segunda-feira (18/03/2024)
  • Ponderada de Deep Racer: ?????

Recapitulando

Q-learning


Deep Q-Network (DQN)

Policy Gradients

Policy Network


Policy Gradients




Policy Gradients


Intro to Policy Optimization (OpenAI)

Bibliografia complementar