Next:
11.1 Introducción
Up:
Búsqueda, Optimización y Aprendizaje
Previous:
10.3 Extensiones
11. Aprendizaje por Refuerzo
Subsections
11.1 Introducción
11.1.1 Modelos de Comportamiento Óptimo
11.1.2 Recompensa diferida y modelo Markoviano
11.2 Métodos de Solución de MDPs
11.2.1 Programación Dinámica
11.2.2 Monte Carlo
11.2.3 Diferencias Temporales (
Temporal Difference
)
11.3 Trazas de Elegibilidad (
eligibility traces
)
11.4 Planeación y Aprendizaje
11.5 Generalización en Aprendizaje por Refuerzo
11.6 Aplicaciones a Juegos y Control
11.7 Algunos desarrollos recientes
Eduardo Morales Manzanares 2004-11-02