También llamados sistemas clasificadores. Cada regla (clasificador) manipula un mensaje.
El sistema interactua con el ambiente el cual manda mensajes (en este sentido es parecido a un sistema experto).
Las reglas son del tipo:
If condici'on (mensajes que satisface)
Then acci'on (manda un mensaje)
En general, todos los mensajes son del mismo tamaño sobre un alfabeto predefinido.
Componentes:
Ciclo de ejecución:
La especificación de las condiciones de las reglas normalmente es por medio de {0,1,#} y permiten tener .
El ambiente proporciona el refuerzo (premio/castigo) y se tiene que pensar en un método para asignar crédito a las reglas que intervinieron en la solución.
Se han propuesto varios modelos: (i) profit-sharing plan (ii) bucket brigade model (iii) rudi.
Uno de los métodos (por lo menos inicialmente) más usados es el bucket brigade el cual distribuye la ganancia entre las reglas que sirvieron para la solución.
A cada regla se le asigna una cantidad (fuerza) que se ajusta y se usa para competir.
La competencia se basa en oferta: las reglas más fuertes son las que ganan.
En el proceso de oferta se toman en cuenta dos factores:
En el ciclo general se calcula la oferta (bid) de los clasificadores
El tamaño de la oferta determina la probabilidad de que el clasificador ponga su mensaje (e.g., la probabilidad puede decrecer exponencialmente con la oferta).
Al usar probabilidad quiere decir que a veces la regla más probable no dispara.
Bucket brigade trata a cada regla como un intermediario el cual se entiende con sus proveedores (reglas que hacen que se satisfagan sus condiciones) y sus consumidores (reglas que satisfacen sus condiciones con sus acciones).
Cuando una regla gana una oferta, paga parte a sus proveedores (si no gana no paga nada) y puede recibir pago de sus consumidores.
Su fuerza aumenta cuando recibe más de lo que dá.
Un clasificador () al depositar un mensaje paga:
Los clasificadores (C') que mandaron mensajes para que ganara el
clasificador (proveedores) aumentan su fuerza:
Las reglas finales obtienen el pago del ambiente.
Las reglas malas son eliminadas por competencia.
Con el tiempo, las mejores reglas tienen más peso y son favorecidas a disparar por el mecanismo de resolución de conflictos.
Puntos en general de los GA para reglas de producción:
En general hay que establecer un balance entre simplicidad y poder expresivo.
También se ha sugerido que los patrones del LHS nos regresen un valor de apareo.
No todos lo esquemas de premio/castigo son adecuados (e.g., muy poco premio a menos que sea casi la solución no nos sirve).
El bucket brigade distribuye la retroalimentación. Pero también se tiene que considerar el número de reglas y el tiempo.
Se puede pensar en dar retroalimentación tanto a cada regla como al conjunto de reglas.