principal › investigación


investigación

De manera general mi trabajo se ha centrado en el área de la Inteligencia Artificial específicamente en el Tratamiento Automático del Lenguaje (o Procesamiento del Lenguaje Natural). En los últimos años mis actividades de investigación se pueden resumir en dos grandes rubros:

  1. La búsqueda de nuevos métodos y representaciones en minería de textos que permitan tratar la información no estructurada propia de un documento escrito ya sea con un enfoque monolingüe o translingüe.
  2. La búsqueda de nuevas formas de interacción a través del lenguaje. Bajo este rubro he trabajado: en la recuperación de información en documentos orales o multimodales (texto/audio/imágenes); el aprovechamiento de información paralingüística para el reconocimiento de emociones; y el procesamiento de la señal electroencefalográfica para el reconocimiento de habla no pronunciada.

De esta forma mi investigación aborda los siguientes temas:

  • Clasificación automática de de textos, tanto temática como no- temática
  • Sistemas de búsqueda de respuestas
  • Extracción de información en texto no estructurado
  • Minería de textos para el descubrimiento de relaciones léxico-semánticas
  • Tratamiento de textos trans-lingüe y multi-lingüe
  • Tratamiento de lenguas con escasos recursos lingüísticos, tanto en el oral como en el escrito
  • Recuperación de información en documentos multimodales (imagen y/o texto y/o audio)
  • Clasificación de habla imaginada a partir de señales EEG para BCIs.

redes/grupos de investigación

En 2002 en conjunto con otros investigadores del INAOE fundamos el Laboratorio de Tecnologías de Lenguaje (LabTL). A partir de 2004 hemos organizado el Taller Nacional de Tecnologías del Lenguaje Humano lo que ha dado a la comunidad nacional un foro para compartir ideas y propiciar la colaboración. Un primer logro de este acercamiento fue la creación de la Asociación Mexicana de Procesamiento de Lenguaje Natural (AMPLN) en 2009.

Además, he coordinado diferentes proyectos de grupo, incluyendo la iniciativa de redes temáticas del CONACYT. Bajo este contexto, la comunidad se organizó como parte de la Red de Tecnologías de la Información y Comunicación (RedTIC) bajo la línea de investigación en Tecnologías del Lenguaje y del Conocimiento (TecLyC, la cual coordiné en 2012 y en 2013). Finalmente este trabajo desembocó en la creación en 2014 de la red temática en Tecnologías del Lenguaje (RedTTL). He sido responsable técnico de la RedTTL desde su creación hasta la fecha.

Actualmente, la red está compuesta por 193 miembros: 66 miembros investigadores, 97 miembros estudiantes y 30 miembros externos. Los miembros investigadores de la red pertenecen a 32 instituciones nacionales y extranjeras. Los miembros externos de la red están asociados a 27 instituciones de 10 países.




proyectos:

como responsable:


como colaborador:

  • Técnicas de análisis y clasificación de voz y expresiones faciales: aplicación a las enfermedades neurológicas en recién nacidos y adultos. Programa ejecutivo de cooperación científica y tecnológica México-Italia. AMEXCID. Universidad de Florencia – INAOE. Responsable en México: Dr. Carlos Alberto Reyes. 2014-2016.
  • Humanités numériques : Modélisation du figement à travers des méthodes automatiques. Centre de Recherche GRAMMATICA, France & LabTL, Méxique. Financée par l’Université d’Artois, France, BQR 2016. Participants : Jan Goes , Luis Meneses-Lerín & Brigitte Buffart-Moret (GRAMMATICA, Francia) ; Luis Villaseñor & Miguel Álvarez (LabTL, México). 2016.
  • Analyses d’opinions des tweets moyennant l’étiquetage sémantique configurable. Centre de Recherche GRAMMATICA, BQR 2016. Financée par l’Université d’Artois, France. Participants : Jan Goes , Luis Meneses-Lerín & Brigitte Buffart-Moret (GRAMMATICA, Francia) ; Xavier Blanco Escoda, Yauheniya Yakubovich & Angels Catena (Laboratorio fLexSem, España); Luis Villaseñor (LabTL, México). 2016.
  • Multimodal image retrieval to support medical case--based scientific literature search. Submitted by professor Fabio González at Universidad Nacional de Colombia – Colombia. Microsoft Research LACCIR; Project ID: R1212LAC006, March 2013-February 2015.
  • Un nuevo enfoque de clasificación de textos basado en el consenso de documentos similares. CONACYT, No. 134186 (2011-2013). Responsable: Dr. Manuel Montes y Gómez
  • WIQ-EI—Web Information Quality Evaluation Initiative. EUROPEAN COMMISION FP7 - International Research Staff Exchange Scheme. Project No. 269180, 2011-2014. Project Coordinator: Dr. Michael Granitzer.
  • Métodos y Técnicas de Inteligencia Computacional y Minería de Datos para la Toma de Decisiones en Explotación de Campos Maduros. No. Ref. 146515. Convocatoria SENER CONACYT Fondo Hidrocarburos 2010. D6/CH2010-02. Responsable: Dr. Leonid Sheremetov(IMP).
  • Desarrollo de materiales educativos para niños y jóvenes en contextos de diversidad lingüística y cultural. Inter-institutional Project CIESAS-CGEIB-INAOE, Responsable: Dra. Frida Villavicencio (CIESAS)
  • Extracción de relaciones léxicas para dominios restringidos a partir de contextos definitorios en español. Responsable: Gerardo Sierra. Proyecto de red, CONACYT, No. 82050, 2008-2011.
  • Planteamiento y Evaluación de Representaciones y Estrategias para la Organización Automática de Información Multilingüe. Responsable: Manuel Montes. Proyecto CONACyT, 2009-2010.
  • Integración de Información Visual y Textual para la Recuperación de Imágenes. Investigador Responsable: Aurelio López López. SEP-CONACYT (Ref. 61335). 2007-2010.