Next: 11.1 Introducción Up: Búsqueda, Optimización y Aprendizaje Previous: 10.3 Extensiones

11. Aprendizaje por Refuerzo

Subsections

11.1 Introducción
- 11.1.1 Modelos de Comportamiento Óptimo
- 11.1.2 Recompensa diferida y modelo Markoviano
11.2 Métodos de Solución de MDPs
11.3 Trazas de Elegibilidad (eligibility traces)
11.4 Planeación y Aprendizaje
11.5 Generalización en Aprendizaje por Refuerzo
11.6 Aplicaciones a Juegos y Control
11.7 Algunos desarrollos recientes

Eduardo Morales Manzanares 2004-11-02