If it is to be, it is up to me.

SARSA and Q-Learning

发表于 2019-05-13 | 更新于: 2019-05-13 | 分类于 ReinforcementLearning

字数统计: 42 | 阅读时长 ≈ 1

本文介绍了两个强化学习中解决Model-Free问题的最经典算法：SARSA和Q-Learning，这两个算法也是On-Policy与Off-Policy的分水岭。

-------------本文结束感谢您的阅读-------------

文章作者:Keavnn

发布时间:2019年05月13日 - 20:05

最后更新:2019年05月13日 - 22:05

如果您获得了帮助，也可以资助一下小的啦~

Keavnn

If it is to be, it is up to me.

GitHub E-Mail