Usa un vector de probabilidad que al muestrearse produce con alta probabilidad vectores con evaluaciones altas.
Inicialmente todos los lugares toman el valor de 0.5 (prob. de producir un 1).
Se genera un conjunto de individuos tomando en cuenta las probabilidades del vector.
Se cambia el vector de probabilidades hacia valores que produjeron mejores resultados (la magnitud del cambio depende de un parámetro).
Se continua con el proceso hasta llegar a un criterio de paro (todos los lugares cercanos a 1 o 0).
Parámetros: (i) número de muestras a generar (e.g., 200), (ii) razón de aprendizaje (LR, e.g., 0.005), y (iii) número de vectores a condiderar para actualizar el vector de probabilidad (e.g., 2). El algoritmo se muestra en la tabla 9.5.
Funciona bien si no hay interacciones significativas entre variables y se aproxima (por lo menos UMDA, una variante de PBIL) al comportamiento de un GA con cruza uniforme.
Variantes: