Main
Proyecto 83459
Planteamiento y Evaluación de Representaciones y Estrategias para
la Organización Automática de Información Multilingüe.
Responsable: Dr. Manuel Montes y Gómez
Financiado por: CONACYT-México
Vigencia: 1/03/2009 a 31/05/2010
Num. Referencia: CB-2007-1-83459
Participantes de:
Objetivo General
Mejorar la organización de información multilingüe mediante la formulación de representaciones y estrategias que permitan combinar atributos tanto dependientes como independientes de la traducción automática.
Objetivos Particulares
- Estudiar el desempeño de diferentes traductores automáticos para conducir su combinación en la representación de documentos para la organización de información multilingüe.
- Proponer nuevas representaciones de documentos a través de rasgos léxicos translingües para las tareas de agrupamiento y clasificación de colecciones multilingües.
- Diseñar una representación de documentos robusta integrando subconjuntos de características relevantes provenientes de las distintas representaciones propuestas.
- Proponer estrategias para la organización de información multilingüe combinando los resultados de los diferentes clasificadores bajo distintas representaciones (ensambles supervisados y no supervisados).
Participantes:
- Dr. Manuel Montes y Gómez (INAOE).
- Dr. Luis Villaseñor Pineda (INAOE).
- Dr. Aurelio López López (INAOE).
- Dr. L. Alfonso Ureña (Universidad de Jaén, España).
- Dr. Paolo Rosso (Universidad Politécnica de Valencia, España).
Estudiantes asociados:
- María Claudia Denicia Carral. Estudiante de doctorado.
- Adelina Escobar Acevedo. Estudiante de maestría.
- Adriana Gabriela Ramírez de la Rosa. Estudiante de maestría.
Productos principales:
Artículos
- Bilingual Document Clustering: Evaluating Cognates as Features. Claudia Denicia-Carral, Manuel Montes-y-Gómez, Luis Villaseñor-Pineda and David Pinto-Avendaño. Canadian Journal of Information and Library Science. (in press)
- Using Information from the Target Language to Improve Crosslingual Text Classification. Gabriela Ramírez, Manuel Montes, Luis Villaseñor, David Pinto, Thamar Solorio. 7th International Conference on Natural Language Processing IceTAL-2010, Reykjavik, Iceland, August 2010. Lecture Notes in Computer Science, volume 6233, 2010.
- Bilingual Document Clustering using Translation-Independent Features. Claudia Denicia-Carral, Manuel Montes-y-Gómez, Luis Villaseñor-Pineda and Rita M. Aceves-Pérez. 11th International Conference on Intelligent Text Processing and Computational Linguistics, CICLing-2010. Romania, March, 2010. International Journal of Computational Linguistics and Applications, Vol. 1, No. 1-2, Jan-Dec 2010.
- Using Nearest Neighbor Information to Improve Cross-Language Text Classification. Adelina Escobar-Acevedo, Manuel Montes-y-Gómez and Luis Villaseñor-Pineda. Mexican International Conference on Artificial Intelligence (MICAI 2009). Guanajuato, Mexico, November 2009. Lecture Notes in Artificial Intelligence 5845, Springer, 2009.
Tesis
- María Claudia Denicia Carral. Una representación de documentos basada en parejas bilingües para agrupamiento multilingüe. PhD. Thesis. Instituto Nacional de Astrofísica, Óptica y Electrónica. In progress.
- Adelina Escobar Escobedo. Métodos de Refinamiento de la clasificación Translingüe de Documentos. Master Degree Thesis. Instituto Nacional de Astrofísica, Óptica y Electrónica. September 29, 2009.