Na aula sobre MDP: melhorar a explicação sobre policies, state-value function, action-value function and bellman equation
Na aula sobre MDP:
melhorar a explicação sobre policies, state-value function, action-value function and bellman equation