Cursos, Investigación y Recursos en Inteligencia Artificial

INICIO CURRÍCULO CONTÁCTANOS MAPA DEL SITIO


INTRODUCCIÓN AL ANÁLISIS DE DATOS CON WEKA

 

Usando el WEKA Explorer

 

. .

.

.

.

.

.

.

. .

.

.

.

.

.

.

SUMILLA

El Weka es una herramienta de software libre frecuentemente usada en proyectos de minería de datos de código abierto. Este curso tiene como propósito exponer los aspectos prácticos de la minería de datos usando el Weka. Se expone brevemente las principales técnicas para la minería de datos y se implementa la solución de casos prácticos mediante la aplicación de los algoritmos implementados en el Weka.

 

 

OBJETIVOS DEL CURSO

Los objetivos del curso son los siguientes:

  • Conocer la funcionalidad y operación del Weka Explorer.

  • Conocer las opciones del Weka para la importación, transformación y exportación de datos.

  • Aplicar el Weka para resolver problemas de clasificación, agrupamiento, asociación y selección de atributos.

  • Aplicar el Weka para la visualización de datos mediante las técnicas de histograma de variables y diagrama de dispersión.

 

 

PROFESOR

Samuel Oporto Díaz (soporto@wiphala.net)

Magíster en Inteligencia Artificial - ITESM. Ingeniero de Sistema - UNI. Docente del curso de Inteligencia Artificial en la UNI, USMP y UPC. Docente del Curso de Minería de Datos en el IIFIIS. Investigador Principal del Instituto de Investigación de la FIIS-UNI. Investigador en Ciencias de Computación con publicaciones en: IJCNN-2007 of August 2007 Orlando, FL, USA. ICAIPR of July 2007 Orlando, FL, USA. ICIAR2005, Toronto – Canada. LNCS-2005, Springer Journal – Canada. CLEI2004 Lima-Perú y CLEI2006 Santiago de Chile. Consultor en Sistemas Inteligentes y Sistemas Autónomos. Gerente General KASCorp.

 

DIRIGIDO A

  • Personal involucrado en proyectos de Business Intelligence.

  • Administradores de Bases de Datos.

  • Analistas de Sistemas.

  • Analistas de marketing y mercadeo.

  • Personal involucrado en proyectos de pronóstico y predicción.

  • Analistas de riesgos.

 

 

PRE-REQUISITOS

Para participar en el curso es recomendable que los alumnos tengan experiencia práctica en:

  • SQL y Manejador de base de datos (mySQL, Oracle, etc.).

  • Estadística y Probabilidades.

  • Algoritmia.

  • Modelos de clasificación, pronóstico, agrupamiento y reglas de asociación.

  • Técnicas de selección de atributos.

 

 

MAPA CONCEPTUAL

 

CONTENIDO DEL CURSO

 

El Weka Explorer (1 h)

Procesamiento de datos (3 h)

  • Formato de datos

  • Abriendo archivos

  • Trabajando con atributos – transformación de datos

  • Trabajando con filtros

 

Clasificación (4h )

  • Seleccionando un clasificador.

  • Opciones de prueba - configuración.

  • El atributo clase.

  • Entrenamiento de un clasificador.

  • Los resultados del proceso de clasificación.

Agrupamiento (2h)

  • Seleccionar un algoritmo de clasificación.

  • Configuración del agrupamiento.

  • Atributos no considerados.

  • La lista del resultado.

Reglas de Asociación (2h)

  • Configuración del algoritmo.

  • Asociaciones que aprenden.

  • Resultados del algoritmo de asociación.

 

Selección de atributos (3h)

  • Búsqueda y evaluación.

  • Opciones.

  • Ejecución de la selección.

Visualización de datos (1h)

  • Diagrama de la dispersión.

 

 

ESTRATEGIA DE APRENDIZAJE

Las clases son teóricas y prácticas, la teoría tiene por finalidad que el alumno conozca los conceptos a ser usados, es práctica tiene por finalidad que el alumno haga uso de las herramientas de software y los conceptos aprendidos para resolver problemas tipo. En todos los casos se hace uso de los algoritmos disponibles en el WEKA.

 

 

MÉTODO DE EVALUACIÓN

Para que los alumnos obtengan un certificado del curso deben cumplir los siguientes requisitos:

  • Asistir al menos al 80% de las sesiones de clase.

  • Obtener al menos una nota de 14 en las evaluaciones del curso.

 

 

FECHAS IMPORTANTES

  • Por definir.

  • 4 sesiones de 4 horas

  • Duración: 16 horas.

 

 

EQUIPOS Y MATERIALES

  • Todos los alumnos al iniciar las clases reciben el material del curso.

  • Todos los alumnos tienen asignados una PC.

 

 

SOFTWARE

  • WEKA

 

 

BIBLIOGRAFÍA

  • Data Mining: Practical Machine Learning Tools and Techniques (Second Edition) Ian H. Witten, Eibe Frank Morgan Kaufmann June 2005 525 pages Paper ISBN 0-12-088407-0.

 

 

INFORMES E INSCRIPCIONES

 

 

LUGAR DE CLASES

  • Por definir