Kontynuacja tematu multi-armed bandit. Tym razem o tym jak sobie radzić z niestacjonarnymi wersjami tego problemu.
Kategorie:
Sutton & Barto
Tagi:
DSP2017, python, multi-armed-bandit, reinforcement-learning
Ogarnąłem instalację TorchCrafta. Wziąłem się za pisanie kodu w Lua, a ten post jest dumpem moich notatek utworzonych w trakcie nauki tego języka.
Kategorie:
Projekty
Tagi:
DSP2017, lua, starcraft
Post o pewnym sposobie optymalizacji pozwalającym na mniejsze zużycie pamięci i mocy procesora dla algorytmu zaprezentowanego w poprzednim poście o multi-armed bandit problem.
Kategorie:
Sutton & Barto
Tagi:
DSP2017, python, multi-armed-bandit, reinforcement-learning