next up previous
Next: About this document ... Up: 11. Aprendizaje por Refuerzo Previous: 11.6 Aplicaciones a Juegos

11.7 Algunos desarrollos recientes

Uno de los problemas principales de las técnicas usadas en aprendizaje por refuerzo, y para resolver MDP en general, es la aplicación a espacios grandes (muchos estados y acciones).

Aunque el algoritmo converge en teoría, en la práctica puede tomar un tiempo inaceptable.

Dentro de los enfoques que atacan, en parte, esta problemática, podemos mencionar:


next up previous
Next: About this document ... Up: 11. Aprendizaje por Refuerzo Previous: 11.6 Aplicaciones a Juegos
Eduardo Morales Manzanares 2004-11-02