Introdução aos Métodos de Monte Carlo

Aprendizado por reforço para aplicações em redes neurais

Prof. Hallison Paz

29 de fevereiro de 2024

Dúvidas e Dívidas

  • Ponderada sobre equação de Bellman: 03/03/2024
  • Ponderada sobre deep racer: a definir
  • Correção da ponderada de Backpropagation

Autoestudos na AdaLove

Métodos de Monte Carlo

Métodos de Monte Carlo

  • Qual a ideia por trás desta estratégia?
  • Por que ela funciona?
  • Como ela irá nos ajudar?

Prática no Google Colab

Open In Colab

Bibliografia complementar

--- <!-- _paginate: false

--- <style scoped> h1 { /* text-align: center; */ color: #ffffff } h3 { /* text-align: center; */ color: #dddddd } </style> ![bg](styles/bg_inteli_01.png) ### Reflexão # Os juros do conhecimento

Repeated Random Sampling estimate values directly from experience estimate value function without prior knowledge of environment dynamics