Monte Carlo and Temporal-Difference

本位介绍了强化学习中解决Model-Free问题的两个基本解决思路:蒙特卡洛Monte Carlo与时间差分Temporal-Difference。

蒙特卡洛方法 Monte Carlo Methods

时间差分学习 Temporal-Difference Learning

-------------本文结束感谢您的阅读-------------

本文标题:Monte Carlo and Temporal-Difference

文章作者:Keavnn

发布时间:2019年05月13日 - 19:05

最后更新:2019年05月13日 - 22:05

原始链接:http://StepNeverStop.github.io/mc-td.html

许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。

如果您获得了帮助,也可以资助一下小的啦~
0%