Name		Name	Last commit message	Last commit date
parent directory ..
A2C		A2C
README.md		README.md

README.md

Actor Critic

Os Actor Critics são algoritmos de estado da arte que combinam estimadores de função de valor, como a DQN, com estimadores de política ótima, como o Policy Gradient. Dessa forma, esses algoritmos tendem a ser bem mais robustos do que modelos individuais.

Advantage Actor Critic (A2C)

Uma das versões mais simples do modelo de Actor Critic. Combina um modelo que estima a Vantagem (A(s, a)) de uma ação com um modelo de Policy Gradient.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Actor-Critic

Actor-Critic

README.md

Actor Critic

Advantage Actor Critic (A2C)

Files

Actor-Critic

Directory actions

More options

Directory actions

More options

Latest commit

History

Actor-Critic

Folders and files

parent directory

README.md

Actor Critic

Advantage Actor Critic (A2C)