Nombre del Curso
|
Hrs
|
INTRODUCCIÓN A LA MINERIA DE TEXTOS - TEXT MINING ¿Qué es la minería de textos?. Colecciones de documentos corpus. Datos semi-estructurados y datos no estructurados. Técnicas de minería de textos. El proceso de la minería de textos. Herramientas.
|
2h
|
PREPARACION DE DATOS Lingüística, Morfología, Sintaxis, Semántica. Conceptos básicos, Gramática, Léxico, Sintaxis. Tokenización. Stop words. Stemming.
|
4h
|
MODELOS PREDICTIVOS PARA TEXTOS - CLASIFICACIÓN Clasificación de documento. Similaridad de documentos y el vecino más cercano. Reglas de decisión. Red Bayesiana, Máquina de Vector Soporte. Evaluación del desempeño. Aplicaciones.
|
4h
|
MODELOS DE AGRUPAMIENTO DE TEXTOS - CLUSTERING Medida de similaridad para la recuperación. Búsqueda de documentos basados en la Web y análisis de links. Matching de Documentos. Agrupamiento por similaridad. Agrupamiento K-means. Agrupamiento jerárquico. Evaluación del agrupamiento. Aplicaciones.
|
4h
|
RECUPERACIÓN DE INFORMACIÓN (BINARIO Y VECTORIAL) Modelos de recuperación de información, Relevancia. Modelos clásicos, indice de términos, importancia, medidas de similaridad. Modelo Booleano. Modelo Vectorial, pesos, similaridad.
|
4h
|
EXTRACCION DE INFORMACION DESDE TEXTOS Objetivos de extracción de información. Búsqueda de patrones y entidades. Expresiones regulares. Extracción de entidades y el método de máxima entropía. Plantillas de llenado. Aplicaciones. Tagging.
|
4h
|
SELECCIÓN DE CARACTERÍSTICAS EN TEXTOS (REDUCCIÓN DE DIMENSIONALIDAD) Métodos de muestreo, métodos de selección de características, búsqueda.
|
2h
|
Total Horas
|
24h
|