这篇论文主要提出了DPPO——Distributed PPO。
简介
论文地址:http://arxiv.org/abs/1707.02286
文中精要
作者提到PG算法通常具有高方差,而且策略对于超参数的选择十分敏感。很多种方法
这篇论文主要提出了DPPO——Distributed PPO。
论文地址:http://arxiv.org/abs/1707.02286
作者提到PG算法通常具有高方差,而且策略对于超参数的选择十分敏感。很多种方法
本文标题:Emergence of Locomotion Behaviours in Rich Environments
文章作者:Keavnn
发布时间:2020年04月11日 - 12:04
最后更新:2020年04月11日 - 14:04
原始链接:http://StepNeverStop.github.io/dppo.html
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。
微信
支付宝