![]() |
增强学习用于二进制分类
我正在尝试将数据集分为2类1和0。我使用了监督学习算法,现在我想尝试使用强化学习来达到相同的目的。我已经开始阅读它,并提出以下问题:1. Q学习和K武装匪徒有什么区别? 2.哪种RL算法最适合此问题? 3.我可以使用我的监督学习代码作为培训代理的环境吗?
[url=https://stackoverflow.com/q/59150220]更多&回答...[/url] |
所有时间均为北京时间。现在的时间是 23:17。 |
Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.