Visión de Alto Nivel
Dr. L. Enrique Sucar S.
INAOE
Página Curso:
ccc.inaoep.mx/~esucar/Clases-van/van.html
1.
Objetivo
Este curso se enfoca al problema
de reconocimiento visual de objetos y a los aspectos asociados como la
segmentación, extracción de características,
modelado y clasificación. Se estudiará el proceso
de reconocimiento de objetos a partir de una o más
imágenes, analizando los diversos enfoques y trabajos recientes.
Se verán algunas aplicaciones como el etiquetado de
imágenes, el reconocimiento de personas y la localización
visual de robots.
2.
Programa
- Parte I Fundamentos
- 1. Introducción
- Formación, captura y digitalización de
imágenes
- Arquitectura y niveles de visión
- Reconocimiento de objetos
- 2. Repaso de Visión de
Bajo Nivel
- Parte II Segmentación y Extracción de
Características
- 3. Segmentación
- Técnicas básicas: división,
agrupamiento, S&M
- Incorporación de semántica del dominio
- Técnicas recientes
- 4. Características
globales
- Descriptores de forma
- Textura
- Color
- Firmas, términos visuales, ...
- 5. Características locales
- Esquinas (Harris)
- Características invariantes (SIFT)
- Otros descriptores
- Parte III Modelado y
Reconocimiento
- 6. Reconocimiento basado en
modelos
- Modelos en 2 y 3 dimensiones
- Técnicas de reconocimiento
- 7. Reconocimiento basado en
conocimiento
- Sistemas basados en
conocimiento
- Técnicas
estadísticas básicas
- Clasificadores, aprendizaje
- 8. Visión bayesiana
- Esquema bayesiano
- Modelos gráficos probabilistas en visión
- 9. Relaciones y gramáticas
- Relaciones espaciales
- Relaciones semánticas
- Gramáticas visuales
Parte IV Aplicaciones
- 10. Recuperación de
imágenes por contenido
- Etiquetado automático
- Recuperación
- 11. Visión robótica
- Reconocimiento de marcas, localización visual
- Reconocimiento de personas
3. Bibliografía
3.1 Textos:
- Notas y Artículos varios (página del curso).
- S. Ullman, High-Level Vision, MIT Press, 2000.
3.2 Libros de Apoyo:
- R.C. Gonzalez, R.E. Woods, Digital Image Processing,
Addison-Wesley, 1992.
- D.H. Ballard, C.M. Brown, Computer Vision,
Prentice-Hall, 1982.
- D. Marr, Vision, W.H. Freeman, 1982.
- D. Forsyth, J. Ponce, Computer Vision: A Modern Approach,
Prentice Hall, 2003.
- R. Duda, P. Hart, D. Storck, Pattern Classification, 2nd Edition,
Wiley, 2001.
- L. E. Sucar, G. Gómez, Procesamiento de Imágenes y
Visión Computacional (por publicarse)
4. Principales Revistas y Congresos
- International Journal of Computer Vision
- CVGIP: Image Understanding
- Image and Vision Computing
- IEEE - Trans. on Pattern Analysis and Machine Intelligence
- IEEE - Trans. on Systems, Man and Cybernetics
- International Conference on Pattern Recognition
- International Conference on Computer Vision
- Computer Vision and Pattern Recognition
- Congreso Iberoamericano de Reconocimiento de Patrones
5. Políticas del Curso
5.1 Prerrequisitos
Curso básico en
visión o procesamiento de imágenes
5.2 Notas del Curso
Las notas del todo el curso
estarán disponibles en la
página
WWW del curso. Las notas incluyen todo el material
a presentarse en clase, ligas a los artículos y las actividades
y proyectos.
5.3 Presentaciones, Proyecto y
Participación
Se analizarán
artículos recientes que serán presentados y discutidos en
clase. Se realizará un proyecto final que aplique algunas de las
técnicas vistas en el curso a un problema práctico. La
participación en clase es muy importante por lo que es necesaria
la asistencia (puntual!) a todas las sesiones.
5.4 Evaluación
- Presentación de
artículos - 40 %
- Proyecto final - 40 %
- Participacion en clase -
20 %
5.5 Profesor
Dr. L. Enrique Sucar
Coordinación de Ciencias
Computacionales,
INAOE
ext. 8208
esucar (AT) inaoep.mx
http://ccc.inaoep.mx/~esucar