Main

Miner A De Textos 2018

INSTITUTO NACIONAL DE ASTROFÍSICA, ÓPTICA Y ELECTRÓNICA

Maestría en Ciencias Computacionales


Minería de Textos I
Primavera 2018
Dr. Luis Villaseñor Pineda; villasen(at)inaoep.mx
Dr. Hugo Jair Escalante; hugojair(at)inaoep.mx
Horario: Martes y jueves 9:00 a 10:30 hrs. Salón 8301a


Avisos:

  • Página en línea aquí (Marzo 6)

Introducción.


Objetivo.


Temario del curso (con material)

A continuación se listan los temas principales que serán abordados durante el curso. (No necesariamente se verán en el orden siguiente.)

1. Introduction [Diapositivas]

2. The problem of text classification

3. Preprocessing - term weighting

4. Dimensionality reduction

5. Classification methods

6. Co-occurrences / Collocations / ngramas / language models

7. Python NLTK session

8. WEKA session

9. Dictionaries - POS tagging

10. Information extraction / Lexical- Syntactical patterns

11. Distributional representations - bags of concepts

12. Distributed representations

13. Semi supervised classification

14. Corpus complexity measures

15. Cross-lingual classification

16. Authorship attribution

17. Plagiarism detection


Metodología de evaluación.

La evaluación se realizará de acuerdo al proyecto asignado para el curso.


Proyectos


Material de lectura

Bibliografía


Estudiantes:

Inscritos

  • Coello Guilarte Denys Laritza
  • Fis Fernández Carlos Alberto
  • Hernández Noguera Alejandro
  • López Rosas Dante
  • Pérez Costa Ernesto
  • Serrano Pérez Jonathan

Proyectos