NEAT 算法解決 Lunar Lander 問題:從理論到實踐
- 0. 前言
- 1. 定義環境
- 2. 配置 NEAT
- 3. 解決 Lunar lander 問題
- 小結
- 系列鏈接
0. 前言
在使用 NEAT 解決強化學習問題一節所用的方法只適用于較簡單的強化學習 (reinforcement learning
, RL
) 環境。在更復雜的環境中使用同樣的進化解決方案,比如 Lunar lander
問題,幾乎沒有任何進展。這是因為僅通過獎勵來進化 NEAT
智能體是不夠的。為了解決 Lunar lander
問題,在本節中,介紹改進的 NEAT
求解器。
1. 定義環境
首先,導入所需庫,并定義 Gym
環境:
import gym.wrappers
import matplotlib.pyplot as plt