本文介绍了两个强化学习中解决Model-Free问题的最经典算法:SARSA和Q-Learning,这两个算法也是On-Policy与Off-Policy的分水岭。
SARSA and Q-Learning
-------------本文结束感谢您的阅读-------------
本文标题:SARSA and Q-Learning
文章作者:Keavnn
发布时间:2019年05月13日 - 20:05
最后更新:2019年05月13日 - 22:05
原始链接:http://StepNeverStop.github.io/sarsa-and-q-learning.html
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 转载请保留原文链接及作者。
如果您获得了帮助,也可以资助一下小的啦~