Choix du labyrinthe



Équation de Bellman

$\alpha :$ 0,9
$\gamma :$ 0,8

$ Q(s,a) = $ 0.1 $\times ~ Q(s,a) ~ +$ 0.9 $\times ~ R ~ + $ 0.72 $ \times \max_{a'} Q(s',a') $

Éditeur de labyrinthe

Lignes : Colonnes :
Départ : Bâton :
Trous :

aa

État du jeu

Score : 0

Récompense : 0

Q(, ) =

Victoire !

Tombé dans un trou !

Sortie de la grille !

Score minimal atteint !