本位介绍了强化学习中解决Model-Free问题的两个基本解决思路:蒙特卡洛Monte Carlo与时间差分Temporal-Difference。
Monte Carlo and Temporal-Difference
-------------本文结束感谢您的阅读-------------
本文标题:Monte Carlo and Temporal-Difference
文章作者:Keavnn
发布时间:2019年05月13日 - 19:05
最后更新:2019年05月13日 - 22:05
原始链接:http://StepNeverStop.github.io/mc-td.html
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。
如果您获得了帮助,也可以资助一下小的啦~