2  Q-Learning

Algoritmo de aprendizaje por refuerzo…

Definición 2.1 (Fitted Q-Iteration) Algoritmo Offline (aprende analizando el historial de experiencias)…