|
Cursos, Investigación y Recursos en Inteligencia Artificial |
![]() |
MINERÍA DE DATOS - FUNDAMENTOS
Con SQL Server 2005 DM y Add-ins para Excel 2007 |
|
La minería de datos es el proceso de descubrir conocimiento desde bases de datos, mediante un proceso de extracción no trivial de información implícita, previamente desconocida y potencialmente útil. Descubrir conocimiento implica buscar patrones de comportamiento aún no conocidos en los datos. El conocimiento se puede manifestar como: patrones, reglas de conocimiento, asociaciones, grupos, restricciones, tendencias, etc. Los dominios de aplicación pueden estar en empresas comercializadoras, de producción, finanzas, energía, gobierno, etc.
Mostrar a los participantes la aplicación práctica de las herramientas de Data Mining para extraer conocimiento de bases de datos y tomar decisiones empresariales.
Samuel Oporto Díaz (soporto@wiphala.net) Magíster en Inteligencia Artificial - ITESM. Ingeniero de Sistema - UNI. Docente del curso de Inteligencia Artificial en la UNI, USMP y UPC. Docente del Curso de Minería de Datos en el IIFIIS. Investigador Principal del Instituto de Investigación de la FIIS-UNI. Investigador en Ciencias de Computación con publicaciones en: IJCNN-2007 of August 2007 Orlando, FL, USA. ICAIPR of July 2007 Orlando, FL, USA. ICIAR2005, Toronto – Canada. LNCS-2005, Springer Journal – Canada. CLEI2004 Lima-Perú y CLEI2006 Santiago de Chile. Consultor en Sistemas Inteligentes y Sistemas Autónomos. Gerente General KASPeru.
¿Qué es la minería de datos? Necesidad de la minería de datos. Procesos de la minería de datos. Ejemplos de problemas.
Comprensión de negocio. Comprensión de datos. Preparación de datos. Modelado. Evaluación. Despliegue de resultados.
Creación de proyectos. Creación de un fuente de datos. Ejemplo de aplicación. Usando el add-ins para MS-EXCEL.
Tipos de datos. Recolección de los datos.
Exploración de datos. Estadística uni-variada. Estadística multi-variada. Análisis de asociación.
Muestreo de datos. Particionamiento de los datos. Datos de entrenamiento. Datos de validación. Datos de prueba.
Datos Perdidos. Datos Anómalos. Datos con Ruido. Datos inconsistentes.
Estandarización de datos. Normalización de datos. Cuantificación de valores categóricos. Discretización. Diferencia de pares ni = ni - ni-1
Variables Correlacionadas. Búsqueda óptima. Búsqueda sub-óptima.
Entropía. Ganancia de información. Reglas de división. Reglas de parada. Poda del árbol.
Tipos de redes neuronales. Arquitectura de red neuronales. Mapeo de datos. Función de transferencia. Función de aprendizaje. Epoca. Transformación de los datos.
Arquitectura de la red neuronal. Preparación de datos. Función de aprendizaje. Ejemplos.
Series de tiempo Frecuencia de muestreo. Horizonte de pronóstico Suavizado de datos Modelos comunes de pronóstico.
Funciones lineales. Ejemplos
Funciones no lineales Regresión múltiple Ejemplos
Arquitectura de la red Funciones de transferencia. Función de aprendizaje Transformación de los datos Ejemplos
Las clases son teóricas y prácticas, la teoría tiene por finalidad que el alumno conozca los conceptos a ser usados, es práctica tiene por finalidad que el alumno haga uso de las herramientas de software y los conceptos aprendidos para resolver problemas tipo.
|
|
|
|