Main

Proyecto 83459

Planteamiento y Evaluación de Representaciones y Estrategias para
la Organización Automática de Información Multilingüe.

Responsable: Dr. Manuel Montes y Gómez
Financiado por: CONACYT-México
Vigencia: 1/03/2009 a 31/05/2010
Num. Referencia: CB-2007-1-83459
Participantes de:

Objetivo General

Mejorar la organización de información multilingüe mediante la formulación de representaciones y estrategias que permitan combinar atributos tanto dependientes como independientes de la traducción automática.

Objetivos Particulares

  • Estudiar el desempeño de diferentes traductores automáticos para conducir su combinación en la representación de documentos para la organización de información multilingüe.
  • Proponer nuevas representaciones de documentos a través de rasgos léxicos translingües para las tareas de agrupamiento y clasificación de colecciones multilingües.
  • Diseñar una representación de documentos robusta integrando subconjuntos de características relevantes provenientes de las distintas representaciones propuestas.
  • Proponer estrategias para la organización de información multilingüe combinando los resultados de los diferentes clasificadores bajo distintas representaciones (ensambles supervisados y no supervisados).

Participantes:

Estudiantes asociados:

  • María Claudia Denicia Carral. Estudiante de doctorado.
  • Adelina Escobar Acevedo. Estudiante de maestría.
  • Adriana Gabriela Ramírez de la Rosa. Estudiante de maestría.

Productos principales:

Artículos

  • Bilingual Document Clustering: Evaluating Cognates as Features. Claudia Denicia-Carral, Manuel Montes-y-Gómez, Luis Villaseñor-Pineda and David Pinto-Avendaño. Canadian Journal of Information and Library Science. (in press)
  • Using Information from the Target Language to Improve Crosslingual Text Classification. Gabriela Ramírez, Manuel Montes, Luis Villaseñor, David Pinto, Thamar Solorio. 7th International Conference on Natural Language Processing IceTAL-2010, Reykjavik, Iceland, August 2010. Lecture Notes in Computer Science, volume 6233, 2010.
  • Bilingual Document Clustering using Translation-Independent Features. Claudia Denicia-Carral, Manuel Montes-y-Gómez, Luis Villaseñor-Pineda and Rita M. Aceves-Pérez. 11th International Conference on Intelligent Text Processing and Computational Linguistics, CICLing-2010. Romania, March, 2010. International Journal of Computational Linguistics and Applications, Vol. 1, No. 1-2, Jan-Dec 2010.
  • Using Nearest Neighbor Information to Improve Cross-Language Text Classification. Adelina Escobar-Acevedo, Manuel Montes-y-Gómez and Luis Villaseñor-Pineda. Mexican International Conference on Artificial Intelligence (MICAI 2009). Guanajuato, Mexico, November 2009. Lecture Notes in Artificial Intelligence 5845, Springer, 2009.

Tesis

  • María Claudia Denicia Carral. Una representación de documentos basada en parejas bilingües para agrupamiento multilingüe. PhD. Thesis. Instituto Nacional de Astrofísica, Óptica y Electrónica. In progress.
  • Adelina Escobar Escobedo. Métodos de Refinamiento de la clasificación Translingüe de Documentos. Master Degree Thesis. Instituto Nacional de Astrofísica, Óptica y Electrónica. September 29, 2009.