Houjun Liu

Actor-Critic

Create an approximation of the value function \(U_{\phi}\) using Approximate Value Function, and use Policy Gradient to optimize an monte-carlo tree search policy

© 2019-2025 Houjun Liu. Licensed CC BY-NC-SA 4.0.