Dentro de la representación, los clasificadores tienen una representación binaria que no es útil en problemas continuos. Aquí se ha experimentado con la definición de rangos de variables.
También se ha buscado quitar la restricción en la sintáxis de tener una cojunción y se ha experimentado con expresiones en Lisp (muy conectado con programación genética).
Esto crea clasificadores de longitrud variable (e.g., messy genetic algorithms).
XCS se puede utilizar para hacer planificación, fijandose en el siguiente estado que nos de la máxima recompensa.
Para la generalización de los clasificadores se usa un esquema de nichos (niche GA), en donde, si dos clasificadores son igualmente precisos, se conserva el más general.
El otro proceso es el de eliminación por subsumsión, que verifica si un nuevo clasificador generado por GA es subsumido por otro que tiene un alto desempeño, en cuyo caso se desecha.
Esto provoca poblaciones pequeñas, con conjuntos que no se traslapan, sin embargo, puede crear clasificadores sobre-generalizados.
Esto es un problema en poblaciones de clasificadores pequeñas o cuando es difícil distinguir entre la aptitud de dos clasificadores.
Aunque se tengan poblaciones mayores y mejores funciones de desempeño, se puede sobre-generalizar.
Para esto se compara si su error relativo comparado con el del promedio de la población es mayor a un cierto umbral, en cuyo caso se crea un nuevo clasificador para cubrir el caso actual con una cierta probabilidad fija de generar don't cares.