SARSA and Q-Learning

本文介绍了两个强化学习中解决Model-Free问题的最经典算法:SARSA和Q-Learning,这两个算法也是On-Policy与Off-Policy的分水岭。

-------------本文结束感谢您的阅读-------------

本文标题:SARSA and Q-Learning

文章作者:Keavnn

发布时间:2019年05月13日 - 20:05

最后更新:2019年05月13日 - 22:05

原始链接:http://StepNeverStop.github.io/sarsa-and-q-learning.html

许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。

如果您获得了帮助,也可以资助一下小的啦~
0%