Vision Computacional
Profesor:
Luis
Enrique Sucar
esucar (AT)
inaoep.mx
Descripcion
general
Objetivos
Programa
Bibliografia
Revistas
y Congresos
Politicas
Calendario
Actividades
- Ecualizacion por histograma:
Implementar la tecnica de
ecualizacion por histograma en MatLab. El procedimiento debe tener como
parametro de entrada la imagen (en formato jpg al menos), y debe
desplegar la imagen de entrada, la ecualizada y los histogramas. Buscar
imagenes de bajo contraste para probarlo y enviar al menos una imagen
de prueba con su programa. Fecha
de entrega: Lunes 22 de agosto de 2005
- Filtrado: Implementar filtrado en el dominio
espacial mediante un mascara cuadrada general. El programa (funcion en
MatLab) debe tener dos argumentos: imagen y mascara. Se debe desplegara
la imagen de entrada y la imagen filtrada normalizada. Probar con
diferentes imagenes y filtros. Fecha
de entrega: Lunes 29 de agosto de 2005
- Deteccion de orillas: Implementar detectores de orillas - (a)
Detector de orillas Sobel de 3x3, teniendo como parametro de entrada la
imagen y desplegando la orillas en X, Y y magnitud. (b) Detector Canny
- utilizando las salidas de Sobel (magnitud y direccion), implementar
la etapa de post-procesamiento de Canny, desplegando la imagen de
orillas de antes y despues del post-procesamiento. En todos los casos
normalizar las imagenes para el despliegue. Fecha
de entrega: Lunes 5 de septiembre de 2005 (enviar dos programas
separados)
- Color y textura: Hacer un programa que obtenga
parametros de color y textura de imagenes para utilizarlos
posteriormente para reconocimiento: (a) Obtener el histograma de la
imagen y a partir de este los primeros cuatro momentos; (b) Obtener el
promedio en cada componente de color de la imagen usando al menos 2
modelos (RGB, HSI); (c) Obtener estos parametros para cada imagen de
frutas (bajar de aqui mismo -
imagenes) y guardar en un archivo por clase de
fruta, un renglon por imagen y una columna por atributo. Enviar el
programa y archivos de atributos. Fecha
de entrega: Lunes 12 de septiembre de 2005
- Vision
estereoscopica: Implementar vision estero en Matlab utilizando
el algoritmo basado en correlacion. Asumir que las imagenes ya estan
alineadas, de forma que solo hay que buscar sobre la linea epipolar,
considerando un rango de disparidades limitado (en funcion de las
imagenes, por ejemplo +20, -20 pixels). Probar con diferentes tamanos
de mascaras y medidas de similitud, indicando cual se uso al final (o
dejarlo como parametros de la funcion). Probar con diferentes pares
estereos (bajar de la pagina) y desplegar el par estereo y la "imagen
de disparidad". Fecha
de entrega: Lunes 19 de septiembre de 2005
- Transformada
de Hough: Implementar en Matlab la transformada de Hough. Para
ello, primero aplicar un detector de orillas y eliminar orillas en base
a un umbral. Con las orillas restantes, obtener el acumulador para
rectas y desplegar todas la rectas significativas sobre la imagen
original. Usar la representacion polar de la recta, indicando cuanto
intervalos se utilizaron en el acumulador. Opcional: desplegar el
acumulador como una imagen. Fecha
de entrega: Lunes 10 de octubre de 2005
- Segmentacion: Implementar
en Matlab segmentacion por histograma. Para ello encontrar los "N"
picos significativos en el histograma, encontrar los minimos y separar
la imagen en "N" regiones, etiquetando las regiones sobre la imagen.
Para ello investigar sobre tecnicas de deteccion de picos/minimos en el
histograma, seleccionar una y comentarla en la documentacion del
programa (dar la referencia). Probar sobre diferentes imagenes. Fecha
de entrega: Lunes 17 de octubre de 2005
- Reconocimiento: Implementar en Matlab un clasificador
bayesiano simple para 3 tipos de frutas en base a los atributos
obtenidos en la actividad 4. Para ello hacer 2 programas. Programa 1 -
entrenamiento: usar el 70% de las imagenes para obtener las
probabilidades requieridas para el clasificador (por fruta), y
guardarlas en un archivo. Programa 2: reconocimiento: usar los modelos
entrenados para reconocer el resto de las imagenes, dando como salida
la probabilidad de cada clase. Reportar el error de clasificacion para
las pruebas. Extra: usar en lugar de imagenes completas, "ventanas" en
las imagenes para tener mas datos. Fecha
de entrega: Lunes 24 de octubre de 2005
COMO ENVIAR LOS PROGRAMAS:
- Hacerlo como una funcion de Matlab con el
nombre: <suapellido#.m> (por ejemplo, sucar1.m)
- Incluir un prologo en el programa (el que
se despiega con Help) que incluya una breve descripcion de la funcion,
entradas, salidas y como se invoca.
- Comentar su programa de acuerdo a las
convecniones de MatLab.
- Enviar al correo (NO comprimir):
esucar.mor@servicios.itesm.mx
- Entregar un listado impreso en la clase.
- Integrar de preferencia todo el programa en
un solo archivo.
PROYECTO FINAL:
Presentacion previa: presentar un primer borrador del
proyecto final. El borrador debe
contener al menos:
- el problema al que se enfoca
el proyecto
- los objetivos (que)
- el trabajo relacionado (en lo
que se basa su proyecto)
- la metodologia (como)
- las herramientas/lenguajes a utilizar en la implementacion
- los experimentos que se
piensan
realizar
El reporte debe presentarse como
si fuera un articulo en el formato
de Lecture Notes de Sringer-Verlag. Ademas, cada equipo debera realizar
una presentacion de 20 a 30
minutos, con la participacion de cada
integrante.
Fecha
de entrega: Martes 1ero de noviembre de 2005
Presentacion
preliminar: Martes 22 de noviembre de 2005
- Formato de Evaluacion [txt] -> Enviar 24 de
noviembre de 2005 (esucar@itesm.mx)
Articulo Final: entregar impreso el
Martes 29 de noviembre de 2005
- Anexar CD con
articulo, programas e imagenes
Notas
S1: Introduccion [PP]
S2: Operaciones puntuales [PP]
S3: Filtrado [PP]
S4: Orillas [PP]
S5: Color [PP]
S6: Textura [PP]
S7: Tridimensional [PP]
S8: Movimiento [PP]
S9: Agrupamiento de Orillas [PP]
S10: Segmentacion [PP]
S11: Vision basada en Modelos [PP]
S12: Vision basada en Conocimiento [PP]
S13: Aruitecturas para Vision [PP]
S14: Compresion de Imagenes [PP]
Examen Parcial: Solucion en PDF
Libro (en PDF)
Capitulo 1
Introduccion
Capitulo 2 Filtrado
Capitulo 3 Orillas
Capitulo 4 Color
Capitulo 5 Textura
Capitulo 6 Vision tridimensional
Capitulo 7 Movimiento
Capitulo 8 Agrupamiento de Orillas
Capitulo 9 Segmentacion
Capitulo 10 Modelos
Capitulo 11: Conocimiento
Imagenes
Frutas: naranjas manzanas peras
Pares estereo: publicos laboratorio
Ligas de Interes
Introduccion a MatLab: Cambridge
Tutorial
An
Introductory Guide to MATLAB (UBC)
Basic Image Processing in
MatLab
Detector de Orillas Canny: Articulo
The Computer Vision Homepage
Vision estereo:
A
parallel stereo algorithm that produces dense depth maps and preserves
image features [page]
A
Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence
Algorithms [paper]
Distinctive
Image Features from Scale-Invariant Keypoints [paper]
Depth
Discontinuities by Pixel-to-Pixel Stereo [paper]
[new
version] [algorithm]
[results]
Procesamiento
Digital de Senales [Tutorial]
Compresion de Imagenes [JPEG] [MPEG]