Se as variáveis aleatórias e tiverem distribuições de probabilidade discretas bem definidas e que dependem apenas do estado e ação anteriores, então tem-se um Processo de Decisão de Markov.
para todo
--- <!-- _paginate: false