Gradient-Based Meta Reinforcement Learning

A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning

Bo Liu, Xidong Feng, Jie Ren, Luo MAI, Rui Zhu, Haifeng ZHANG, Jun Wang, Yaodong Yang