next up previous
Next: 11. Aprendizaje por Refuerzo Up: 10. Optimización basada en Previous: 10.2 TSP y el

10.3 Extensiones

Una primera extensión fué la de premiar de más a la mejor solución global obtenida hasta el momento, algo parecido a una estrategia elitista.

Otra variante fue ordenar las hormigas de mejor a peor y solo permitir a las $N$ mejores poner feromonas (además de la mejor ruta global).

Otra variante fué el mover a las hormigas usando una política $\epsilon-$greedy.

Algunas variantes solo actualizan la cantidad de feromona del camino de la mejor hormiga.

El uso de feromonas sirve para balancera entre exploración y explotación.

Un sistema utiliza un límite inferior y superior de cantidad de feromona. El inferior garantiza un nivel mínimo de exploración.

También se pueden variar los parámetros $\alpha$ y $\beta$ para balancear de forma diferente la exploración y explotación durante la búsqueda.

Se puede combinar con búsqueda local (parecido a GRASP). Se construye con ACO y se sigue con búsqueda local.

Si existen muchos posibles candidates en la parte de construcción de soluciones de puede tener también una lista de candidatos.


next up previous
Next: 11. Aprendizaje por Refuerzo Up: 10. Optimización basada en Previous: 10.2 TSP y el
Eduardo Morales Manzanares 2004-11-02