If it is to be, it is up to me.

Monte Carlo and Temporal-Difference

发表于 2019-05-13 | 更新于: 2019-05-13 | 分类于 ReinforcementLearning

字数统计: 55 | 阅读时长 ≈ 1

本位介绍了强化学习中解决Model-Free问题的两个基本解决思路：蒙特卡洛Monte Carlo与时间差分Temporal-Difference。

-------------本文结束感谢您的阅读-------------

文章作者:Keavnn

发布时间:2019年05月13日 - 19:05

最后更新:2019年05月13日 - 22:05

如果您获得了帮助，也可以资助一下小的啦~