吉他价格品牌,吉他教学教程,吉他曲谱视频
关注520吉他网
文章页顶部广告位
当前位置:首页 > 头条 > 用强化学习来玩微信小游戏跳一跳的可实现性?
时间:2019-12-05     来源:网络资源     标签:

我暂时没空实现,写下思路,谁实现出来了跟我说一下。

用强化学习来做要比现有的几个开源项目更简洁,不需要人工标定物体,不需要计算控制模型(按压时间和距离的关系)。

直接输入图像,输出按压时间就可以了。

Observation Space: Box(width, height, 3)Action Space:(0, ∞) (我猜可能服从泊松分布)Reward: 每成功跳一次reward为1就可以了,挂了reward为0。

根据评论区指出的,跳到格子中央会获得更多得分,那么直接用得分作为reward应该更好。

网络结构和玩其它Atari游戏类似,先来几层CNN,后面用dense connection应该就可以了(万一不行咱们再讨论)。

算法用DDPG应该就够了(万一不行咱们再讨论)。

就酱。

文章页顶部广告位
文章页顶部广告位
文章页顶部广告位

报歉!评论已关闭。