Cursos, Investigación y Recursos en Inteligencia Artificial

INICIO    CURRÍCULO    CONTÁCTANOS    MAPA DEL SITIO


MINERÍA DE DATOS - FUNDAMENTOS

 

Con SQL Server 2005 DM y Add-ins para Excel 2007

 

      

SUMILLA

La minería de datos es el proceso de descubrir conocimiento desde bases de datos, mediante un proceso de extracción no trivial de información implícita, previamente desconocida y potencialmente útil. Descubrir conocimiento implica buscar patrones de comportamiento  aún no conocidos en los datos. El conocimiento se puede manifestar como: patrones, reglas de conocimiento, asociaciones, grupos, restricciones, tendencias, etc. Los dominios de aplicación pueden estar en empresas comercializadoras, de producción, finanzas, energía, gobierno, etc.

 

 

OBJETIVOS DEL CURSO

Mostrar a los participantes la aplicación práctica de las herramientas de Data Mining para extraer conocimiento de bases de datos y tomar decisiones empresariales.

 

 

PROFESORES

Samuel Oporto Díaz (soporto@wiphala.net)

Magíster en Inteligencia Artificial - ITESM. Ingeniero de Sistema - UNI. Docente del curso de Inteligencia Artificial en la UNI, USMP y UPC. Docente del Curso de Minería de Datos en el IIFIIS. Investigador Principal del Instituto de Investigación de la FIIS-UNI. Investigador en Ciencias de Computación con publicaciones en: IJCNN-2007 of August 2007 Orlando, FL, USA. ICAIPR of July 2007 Orlando, FL, USA. ICIAR2005, Toronto – Canada. LNCS-2005, Springer Journal – Canada. CLEI2004 Lima-Perú y CLEI2006 Santiago de Chile. Consultor en Sistemas Inteligentes y Sistemas Autónomos. Gerente General KASPeru.

 

 

DIRIGIDO A

  • Personal involucrado en proyectos de Business Intelligence.

  • Administradores de Bases de Datos.

  • Analistas de Sistemas.

  • Analistas de marketing y mercadeo.

  • Personal involucrado en proyectos de pronóstico y predicción.

  • Analistas de riesgos.

 

 

PRE-REQUISITOS

  • Conocimientos de bases de datos y SQL.

  • Conocimiento de estadística descriptiva

 

 

MAPA CONCEPTUAL

 

 

CONTENIDO DEL CURSO

 

Introducción a la minería de datos.

Introducción a la minería de datos (0.5 h)

  ¿Qué es la minería de datos?

  Necesidad de la minería de datos.

  Procesos de la minería de datos.

  Ejemplos de problemas.

 

Metodología CRIPS (0.5 h)

  Comprensión de negocio.

  Comprensión de datos.

  Preparación de datos.

  Modelado.

  Evaluación.

  Despliegue de resultados.

 

SQL Server Data Mining (2 h)

  Creación de proyectos.

  Creación de un fuente de datos.

  Ejemplo de aplicación.

  Usando el add-ins para MS-EXCEL.

 

Entendimiento de los datos.

Fuentes de datos (1 h)

  Tipos de datos.

  Recolección de los datos.

 

Estadística descriptiva (1 h)

  Exploración de datos.

  Estadística uni-variada.

  Estadística multi-variada.

  Análisis de asociación.

 

Selección de los datos (0.5 h)

  Muestreo de datos.

  Particionamiento de los datos.

  Datos de entrenamiento.

  Datos de validación.

  Datos de prueba.

 

Preparación de los datos.

Limpieza de datos (1 h)

  Datos Perdidos.

  Datos Anómalos.

  Datos con Ruido.

  Datos inconsistentes.

 

Transformación de datos (0.5 h)

  Estandarización de datos.

  Normalización de datos.

  Cuantificación de valores categóricos.

  Discretización.

  Diferencia de pares ni = ni - ni-1

 

Selección de características (1 h)

  Variables Correlacionadas.

  Búsqueda óptima.

  Búsqueda sub-óptima.

 

Clasificación.

  Árboles de decisión (1.5 h)

   Entropía.

   Ganancia de información.

   Reglas de división.

   Reglas de parada.

   Poda del árbol.

 

  Introducción a las Redes Neuronales (0.5 h)

   Tipos de redes neuronales.

   Arquitectura de red neuronales.

   Mapeo de datos.

   Función de transferencia.

   Función de aprendizaje.

   Epoca.

   Transformación de los datos.

 

  Red Perceptrón (2h)

   Arquitectura de la red neuronal.

   Preparación de datos.

   Función de aprendizaje.

   Ejemplos.

 

Regresión.

  Introducción a modelos de regresión (0.5 h)

   Series de tiempo

   Frecuencia de muestreo.

   Horizonte de pronóstico

   Suavizado de datos

   Modelos comunes de pronóstico.

  

  Regresión Lineal (0.5 h)

   Funciones lineales.

   Ejemplos

 

  Regresión Logística (0.5 h)

   Funciones no lineales

   Regresión múltiple

   Ejemplos

 

  Red de retro-propagación (2.5 h)

   Arquitectura de la red

   Funciones de transferencia.

   Función de aprendizaje

   Transformación de los datos

   Ejemplos

 

 

ESTRATEGIA DE APRENDIZAJE

Las clases son teóricas y prácticas, la teoría tiene por finalidad que el alumno conozca los conceptos a ser usados, es práctica tiene por finalidad que el alumno haga uso de las herramientas de software y los conceptos aprendidos para resolver problemas tipo.

 

 

MÉTODO DE EVALUACIÓN

  • Durante el desarrollo del curso se toman evaluaciones del proceso y un trabajo integrador que trata de medir el grado de aprendizaje del alumno.

  • Para que los alumnos obtengan un certificado del curso deben cumplir los siguientes requisitos: asistir al menos al 80% de las sesiones de clase y obtener al menos una nota de 14 en las evaluaciones del curso.

 

 

FECHAS IMPORTANTES

  • Por definir.

  • Duración: 16 horas.

 

 

EQUIPOS Y MATERIALES

  • Todos los alumnos al iniciar las clases reciben el material del curso.

  • Todos los alumnos tienen asignados una PC

 

 

SOFTWARE

  • SQL Server 2005

  • DM EXCEL add-ins

 

 

BIBLIOGRAFÍA

  • Data Mining with SQL Server 2005, ZhaoHui Tang, Jamie MacLennan. Wiley Publishing Inc. (2004). ISBN-13: 978.0-47146261-3

  • Data Mining: Practical Machine Learning Tools and Techniques, Second Edition, Ian H. Witten, Eibe Frank. Morgan Kaufmann; 2 edition (June 8, 2005). 560 pp. ISBN: 0120884070

  • Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber. Morgan Kaufmann; 1st edition (August, 2000), 500 pp. ISBN: 1558604898

 

 

INFORMES E INSCRIPCIONES

 

 

LUGAR DE CLASES

  • Por definir