最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:
作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
1
nl101531 2020-12-01 09:15:08 +08:00 via iPhone
很有意思
|
2
saul0913 2020-12-01 10:11:12 +08:00
这种东西用按键精灵不是更简单
|
3
tsening 2020-12-01 18:03:38 +08:00
真厉害
|
4
lanking520 OP @saul0913 按键精灵没法应对随机管道呀
|
5
SkyLine7 2020-12-03 10:46:53 +08:00
很强
|
6
choichun 2020-12-05 01:46:19 +08:00 via Android
|