RL——GAE

GAE,Generalized advantage estimation,平衡了强化学习中的方差与偏差,常用于AC中

强化学习中的方差与偏差

GAE、\(\lambda\)-return、TD(\(\lambda\))的区别是什么?