Miner A De Textos 2018
INSTITUTO NACIONAL DE ASTROFÍSICA, ÓPTICA Y ELECTRÓNICA
Maestría en Ciencias Computacionales
Minería de Textos I
Primavera 2018
Dr. Luis Villaseñor Pineda; villasen(at)inaoep.mx
Dr. Hugo Jair Escalante; hugojair(at)inaoep.mx
Horario: Martes y jueves 9:00 a 10:30 hrs. Salón 8301a
Avisos:
- Página en línea aquí (Marzo 6)
Introducción.
Objetivo.
Temario del curso (con material)
A continuación se listan los temas principales que serán abordados durante el curso. (No necesariamente se verán en el orden siguiente.)
1. Introduction [Diapositivas]
2. The problem of text classification
3. Preprocessing - term weighting
4. Dimensionality reduction
5. Classification methods
6. Co-occurrences / Collocations / ngramas / language models
7. Python NLTK session
8. WEKA session
9. Dictionaries - POS tagging
10. Information extraction / Lexical- Syntactical patterns
11. Distributional representations - bags of concepts
12. Distributed representations
13. Semi supervised classification
14. Corpus complexity measures
15. Cross-lingual classification
16. Authorship attribution
17. Plagiarism detection
Metodología de evaluación.
La evaluación se realizará de acuerdo al proyecto asignado para el curso.
Proyectos
Material de lectura
Bibliografía
Estudiantes:
Inscritos
- Coello Guilarte Denys Laritza
- Fis Fernández Carlos Alberto
- Hernández Noguera Alejandro
- López Rosas Dante
- Pérez Costa Ernesto
- Serrano Pérez Jonathan