Emergence of Locomotion Behaviours in Rich Environments

这篇论文主要提出了DPPO——Distributed PPO。

简介

论文地址:http://arxiv.org/abs/1707.02286

文中精要

作者提到PG算法通常具有高方差,而且策略对于超参数的选择十分敏感。很多种方法

-------------本文结束感谢您的阅读-------------

本文标题:Emergence of Locomotion Behaviours in Rich Environments

文章作者:Keavnn

发布时间:2020年04月11日 - 12:04

最后更新:2020年04月11日 - 14:04

原始链接:http://StepNeverStop.github.io/dppo.html

许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。

如果您获得了帮助,也可以资助一下小的啦~
0%