2011 KASPERU www.kasperu.com
Lima - Perú
Powered by Yahoo! Web Hosting
Knowledge and Systems Peru
DM042. Curso Avanzado de Análisis Predictivo - Minería de Textos
El Poder del Conocimiento
El Curso Avanzado de Análisis Predictivo - Minería de Textos tiene el siguiente contenido temático y se desarrolla en 24 horas:
Precios
Formas de Pago
Facilidades de Pago
Procedimiento Pago
DM042
DM041
SI011
Nombre del Curso
Hrs
INTRODUCCIÓN A LA MINERIA DE TEXTOS - TEXT MINING
¿Qué es la minería de textos?. Colecciones de documentos corpus. Datos semi-estructurados y datos no
estructurados. Técnicas de minería de textos. El proceso de la minería de textos. Herramientas.
2h
PREPARACION DE DATOS
Lingüística, Morfología, Sintaxis, Semántica. Conceptos básicos, Gramática, Léxico, Sintaxis. Tokenización. Stop words.
Stemming.
4h
MODELOS PREDICTIVOS PARA TEXTOS - CLASIFICACIÓN
Clasificación de documento. Similaridad de documentos y el vecino más cercano. Reglas de decisión. Red Bayesiana,
Máquina de Vector Soporte. Evaluación del desempeño. Aplicaciones.
4h
MODELOS DE AGRUPAMIENTO DE TEXTOS - CLUSTERING
Medida de similaridad para la recuperación. Búsqueda de documentos basados en la Web y análisis de links. Matching
de Documentos. Agrupamiento por similaridad. Agrupamiento K-means. Agrupamiento jerárquico. Evaluación del
agrupamiento. Aplicaciones.
4h
RECUPERACIÓN DE INFORMACIÓN (BINARIO Y VECTORIAL)
Modelos de recuperación de información, Relevancia. Modelos clásicos, indice de términos, importancia, medidas de
similaridad. Modelo Booleano. Modelo Vectorial, pesos, similaridad.
4h
EXTRACCION DE INFORMACION DESDE TEXTOS
Objetivos de extracción de información. Búsqueda de patrones y entidades. Expresiones regulares. Extracción de
entidades y el método de máxima entropía. Plantillas de llenado. Aplicaciones. Tagging.
4h
SELECCIÓN DE CARACTERÍSTICAS EN TEXTOS (REDUCCIÓN DE DIMENSIONALIDAD)
Métodos de muestreo, métodos de selección de características, búsqueda.
2h
Total Horas    
24h
(51-1) 697-8227
(51-1) 725-7209