Visión de Alto Nivel

  
Profesor:
Luis Enrique Sucar
esucar (AT) inaoep.mx



Descripción general:

Curso



Calendario:

Sesiones de Clase



Notas


Clase 1: Introducción [PDF]
Clase 2: Repaso de Visión de Bajo Nivel [PDF]
Clase 3: Segmentación [PDF]
Clase 4: Descripción [PDF]
Clase 5: Representación y Reconocimiento [PDF]
Clase 6: Visión bayesiana [PDF]
Clase 7: Relaciones, gramáticas, aplicaciones [PDF]



Artículos

Segmentación

Normalized cuts [reporte] (J Shi, J Malik - IEEE Transactions on pattern analysis and machine, 2000) [presentación]
Mean shift [reporte] (D Comaniciu, P Meer - IEEE Transactions on pattern analysis and machine, 2002) [presentación]

Descripción

SIFT [artículo] (D Lowe, Distinctive image features from scale-invariant keypoints) [presentación]
Comparación de descriptores [artículo] (K Mikolajczyk, C Schmid - IEEE Transactions on Pattern Analysis and Machine, 2005) [presentación]
Combinando caract. locales y globales [artículo] (K Murphy, A Torralba, D Eaton, W Freeman - Lecture Notes in Computer Science, 2006) [presentación]

Reconocimiento

AdaBoost: Ensambles de clasificadores [artículo] (Viola & Jones) [presentación]
Reconocimiento en base a múltiples segmentaciones [artículo] (Pantofaru, Schmid & Herbert)[presentación]
Reconocimiento basado en modelos [artículo] (RT Chin, CR Dyer - ACM Computing Surveys (CSUR), 1986)[presentación]

Visión Bayesiana

Object Recognition as Machine Translation [artículo] (P. Duygulu et. al.,  ECCV 2002)[presentación]
Temporal Bayesian Networks for Scenario Recognition [artículo] (Ziani & Montamed, LNCS 4522, 2007)[presentación]
Discriminative Random Fields [artículo] (S. Kumar and M. Hebert)[presentación]
 
Relaciones espaciales y gramáticas

Learning from ambigously labeled images [artículo] (T. Cour et al.)
Exploting spatial context ... [artículo] (Yuan, Li & Zhang)
Learning Spatial Context [artículo] (Heitz & Koller)



Actividades

Semana 1:
Repasar conceptos básicos de visión de bajo nivel (referencias)

Semana 2:
Segmentación: repasar (referencias) y análisis de artículos

Semana 3:
Descripción: leer referencias y análisis de artículos

Semana 4:
Representación: leer referencias y análisis de artículos
Propuesta proyecto final

Semana 5:
Propuesta proyecto - entregar un documento (max. 2 páginas) con lo siguiente:
Semana 6:
Visión bayesiana: leer referencias y análisis de artículos

Semana 7:
Relaciones, gramáticas, aplicaciones: leer referencias y análisis de artículos

Semana 8/9 - Proyecto Final:
Presentación de avance (29 de junio): enviar una presentación (en PDF), 15 láminas máximo, que contenga al menos lo siguiente:
Reporte final (6 de julio): enviar el reporte en forma artículo científico (usar formato LN de Springer) de máximo 10 páginas que contenga lo siguiente:
Presentación final (8 de julio, horario por confirmar): máximo 20 láminas que resuma los principales puntos del reporte enfatizando el problema, objetivos, metodología y resultados. Enviar la presentación por e-mail a más tardar el miercoles 8 de julio, 8:00 am.



Ligas de interés

Software:

OpenCV
Software para Redes Bayesianas
Tutorial MatLab

Congresos y Revistas:

ICCV: 2007 2008 2009

Recursos:

The Computer Vision Homepage
The Computer Vision Industry
Vision Books: CVonline
Computer Vision Research Groups
Computer Vision: Algorithms and Applications (Draft)

Libro: Procesamiento de Imágenes y Visión Computacional

Capitulo 1 Introduccion
Capitulo 2 Filtrado
Capitulo 3 Orillas
Capitulo 4 Color
Capitulo 5 Textura
Capitulo 6 Vision tridimensional
Capitulo 7 Movimiento
Capitulo 8 Agrupamiento de Orillas
Capitulo 9 Segmentacion
Capitulo 10 Modelos
Capitulo 11: Conocimiento