本位介绍了强化学习中解决Model-Free问题的两个基本解决思路:蒙特卡洛Monte Carlo与时间差分Temporal-Difference。



本位介绍了强化学习中解决Model-Free问题的两个基本解决思路:蒙特卡洛Monte Carlo与时间差分Temporal-Difference。



本文标题:Monte Carlo and Temporal-Difference
文章作者:Keavnn
发布时间:2019年05月13日 - 19:05
最后更新:2019年05月13日 - 22:05
原始链接:http://StepNeverStop.github.io/mc-td.html
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。
微信
支付宝