Vision Computacional

Profesor:
Luis Enrique Sucar
esucar (AT) inaoep.mx



Descripcion general

Objetivos
Programa
Bibliografia
Revistas y Congresos
Politicas
Calendario



Actividades
  1. Ecualizacion por histograma: Implementar la tecnica de ecualizacion por histograma en MatLab. El procedimiento debe tener como parametro de entrada la imagen (en formato jpg al menos), y debe desplegar la imagen de entrada, la ecualizada y los histogramas. Buscar imagenes de bajo contraste para probarlo y enviar al menos una imagen de prueba con su programa. Fecha de entrega: Lunes 22 de agosto de 2005
  2. Filtrado: Implementar filtrado en el dominio espacial mediante un mascara cuadrada general. El programa (funcion en MatLab) debe tener dos argumentos: imagen y mascara. Se debe desplegara la imagen de entrada y la imagen filtrada normalizada. Probar con diferentes imagenes y filtros. Fecha de entrega: Lunes 29 de agosto de 2005
  3. Deteccion de orillas: Implementar detectores de orillas - (a) Detector de orillas Sobel de 3x3, teniendo como parametro de entrada la imagen y desplegando la orillas en X, Y y magnitud. (b) Detector Canny - utilizando las salidas de Sobel (magnitud y direccion), implementar la etapa de post-procesamiento de Canny, desplegando la imagen de orillas de antes y despues del post-procesamiento. En todos los casos normalizar las imagenes para el despliegue. Fecha de entrega: Lunes 5 de septiembre de 2005 (enviar dos programas separados)
  4. Color y textura: Hacer un programa que obtenga parametros de color y textura de imagenes para utilizarlos posteriormente para reconocimiento: (a) Obtener el histograma de la imagen y a partir de este los primeros cuatro momentos; (b) Obtener el promedio en cada componente de color de la imagen usando al menos 2 modelos (RGB, HSI); (c) Obtener estos parametros para cada imagen de frutas (bajar de aqui mismo - imagenes) y guardar en un archivo por clase de fruta, un renglon por imagen y una columna por atributo. Enviar el programa y archivos de atributos. Fecha de entrega: Lunes 12 de septiembre de 2005
  5. Vision estereoscopica: Implementar vision estero en Matlab utilizando el algoritmo basado en correlacion. Asumir que las imagenes ya estan alineadas, de forma que solo hay que buscar sobre la linea epipolar, considerando un rango de disparidades limitado (en funcion de las imagenes, por ejemplo +20, -20 pixels). Probar con diferentes tamanos de mascaras y medidas de similitud, indicando cual se uso al final (o dejarlo como parametros de la funcion). Probar con diferentes pares estereos (bajar de la pagina) y desplegar el par estereo y la "imagen de disparidad". Fecha de entrega: Lunes 19 de septiembre de 2005
  6. Transformada de Hough: Implementar en Matlab la transformada de Hough. Para ello, primero aplicar un detector de orillas y eliminar orillas en base a un umbral. Con las orillas restantes, obtener el acumulador para rectas y desplegar todas la rectas significativas sobre la imagen original. Usar la representacion polar de la recta, indicando cuanto intervalos se utilizaron en el acumulador. Opcional: desplegar el acumulador como una imagen. Fecha de entrega: Lunes 10 de octubre de 2005
  7. Segmentacion: Implementar en Matlab segmentacion por histograma. Para ello encontrar los "N" picos significativos en el histograma, encontrar los minimos y separar la imagen en "N" regiones, etiquetando las regiones sobre la imagen. Para ello investigar sobre tecnicas de deteccion de picos/minimos en el histograma, seleccionar una y comentarla en la documentacion del programa (dar la referencia). Probar sobre diferentes imagenes. Fecha de entrega: Lunes 17 de octubre de 2005
  8. Reconocimiento: Implementar en Matlab un clasificador bayesiano simple para 3 tipos de frutas en base a los atributos obtenidos en la actividad 4. Para ello hacer 2 programas. Programa 1 - entrenamiento: usar el 70% de las imagenes para obtener las probabilidades requieridas para el clasificador (por fruta), y guardarlas en un archivo. Programa 2: reconocimiento: usar los modelos entrenados para reconocer el resto de las imagenes, dando como salida la probabilidad de cada clase. Reportar el error de clasificacion para las pruebas. Extra: usar en lugar de imagenes completas, "ventanas" en las imagenes para tener mas datos. Fecha de entrega: Lunes 24 de octubre de 2005

COMO ENVIAR LOS PROGRAMAS:
PROYECTO FINAL:
    Presentacion previa: presentar un primer borrador del proyecto final. El borrador debe contener al menos:
    - el problema al que se enfoca el proyecto
    - los objetivos (que)
    - el trabajo relacionado (en lo que se basa su proyecto)
    - la metodologia (como)
    - las herramientas/lenguajes a utilizar en la implementacion
    - los experimentos que se piensan realizar
    El reporte debe presentarse como si fuera un articulo en el formato de Lecture Notes de Sringer-Verlag. Ademas, cada equipo debera realizar una presentacion de 20 a 30 minutos, con la participacion de cada integrante
            Fecha de entrega: Martes 1ero de noviembre de 2005

            Presentacion preliminar: Martes 22 de noviembre de 2005
            - Formato de Evaluacion [txt] -> Enviar 24 de noviembre de 2005 (esucar@itesm.mx)

            Articulo Final: entregar impreso el Martes 29 de noviembre de 2005
            - Anexar CD con articulo, programas e imagenes



Notas

S1: Introduccion [PP]
S2: Operaciones puntuales [PP]
S3: Filtrado [PP]
S4: Orillas [PP]
S5: Color [PP]
S6: Textura [PP]
S7: Tridimensional [PP]
S8: Movimiento [PP]
S9: Agrupamiento de Orillas [PP]
S10: Segmentacion [PP]
S11: Vision basada en Modelos [PP]
S12: Vision basada en Conocimiento [PP]
S13: Aruitecturas para Vision [PP]
S14: Compresion de Imagenes [PP]


Examen Parcial: Solucion en PDF



Libro (en PDF)

Capitulo 1 Introduccion

Capitulo 2 Filtrado

Capitulo 3 Orillas

Capitulo 4 Color

Capitulo 5 Textura

Capitulo 6 Vision tridimensional

Capitulo 7 Movimiento

Capitulo 8 Agrupamiento de Orillas

Capitulo 9 Segmentacion

Capitulo 10 Modelos

Capitulo 11: Conocimiento



Imagenes

Frutas: naranjas  manzanas  peras

Pares estereo: publicos laboratorio



Ligas de Interes

Introduccion a MatLab: Cambridge Tutorial

An Introductory Guide to MATLAB (UBC)

Basic Image Processing in MatLab

Detector de Orillas Canny: Articulo

The Computer Vision Homepage

Vision estereo:
A parallel stereo algorithm that produces dense depth maps and preserves image features [page]
A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms [paper]
Distinctive Image Features from Scale-Invariant Keypoints [paper]
Depth Discontinuities by Pixel-to-Pixel Stereo [paper] [new version] [algorithm] [results]

Procesamiento Digital de Senales [Tutorial]

Compresion de Imagenes [JPEG] [MPEG]