Este curso de dos días de duración está dirigido a cualquiera que quiera iniciarse con esta aplicación de SPSS. Ofrece una metodología para acometer proyectos de minería de datos, y la descripción introductoria y eminentemente práctica de las principales funcionalidades de la aplicación: desde la captura de los datos hasta la construcción de modelos y su evaluación.
Este curso permite comprobar la facilidad con la que mediante Clementine se analizan los datos, pues la mayor parte de las opciones por defecto que ofrece son suficientes para extraer conclusiones valiosas.
Los contenidos están estructurados en los siguientes temas:
Encuadre del concepto de Minería de Datos, y detalle de los pasos generales en un proyecto típico de esta naturaleza
Se introduce el entorno de programación visual de Clementine, la construcción de rutas, el concepto de nodos, y el acceso a las utilidades de ayuda incorporadas en la aplicación.
La conectividad ficheros de datos en una gama variada de formatos es una característica esencial de cualquier herramienta de análisis. En este tema se explican en detalle las posibilidades de Clementine para la carga e instanciación de los datos almacenados en ficheros de texto, bases de datos, ficheros de datos de SPSS, etc.
No se puede gestionar lo que no se puede medir y muchas veces no se puede medir todo lo que se desea. En todo proceso de minería de datos es esencial cuantificar el impacto de la información faltante o perdida.
La fase de análisis de un proyecto de minería de datos, conlleva un gran trabajo de manipulación: disponer la información en la forma más adecuada a cada algoritmo de análisis y propósito de negocio. Este capítulo aborda las principales funcionalidades con campos y registros.
Las relaciones entre las variables son la evidencia de la existencia de información a partir de la cuál desencadenar las acciones pertinentes al objetivo de negocio/investigación. El presente capítulo aborda las técnicas para cuantificar estas relaciones.
Se ofrece una visión global de las técnicas de modelización principales incluidas en Clementine: Redes Neuronales para predecir y agrupar, búsqueda de Reglas Inductivas de Clasificación, Regresión Lineal y Logística, Componentes Principales, Conglomerados de K Medias y en dos Fases, Reglas Inductivas de Asociación entre Eventos, y Detección de Secuencias temporales de eventos.
Se muestra cómo operar con el nodo de Redes Neuronales, cómo generar predicciones, comprender los resultados y evaluar el modelo.
Para segmentar o clasificar individuos o entidades respecto a un criterio predeterminado (por ejemplo el tipo de producto que demandan), es de utilidad determinar bajo qué conjunto de condiciones -en función de la información disponible- se produce o no un evento (por ejemplo, se demanda tal o cual producto) y con qué propensión. Este es el objetivo de los Nodos C.5 y CRT de Clementine. En este capítulo se aborda el funcionamiento del nodo C.5
Ante un mismo problema de negocio o investigación pueden ser de aplicación diversas estrategias de modelización. Tal situación requiere la posibilidad de comparar los resultados alcanzados y su eventual combinación.
Una de las aplicaciones de las redes neuronales es buscar pautas de similaridad sistemáticas en una masa de individuos o entidades para clasificarlos en subgrupos. El contenido de este capítulo es cómo acometer esta tarea en Clementine.
Los sucesos o eventos tienden a acaecer asociados: quien compra leche suele comprar edulcorantes o café, el servicio A suele acompañar al B, etc. Este tema aborda cómo determinar este tipo de asociaciones a partir de los datos registrados, cómo cuantificar su importancia, y cómo generar selecciones a partir de tales resultados.
Cuando los eventos acontecen ordenados en el tiempo, hablamos de secuencias y las reglas de asociación particularizadas a este tipo de eventos permiten determinar cuáles son las secuencias más relevantes.
Los capítulos anteriores se dedican a la descripción de las características básicas de Clementine. Pero no se agotan ahí. Los análisis de Clementine se pueden integrar en aplicaciones operativas de su empresa o institución o volcarse a plataformas web, los procedimientos pueden escribirse en lenguaje de programación, y las capacidades de la aplicación pueden completarse con nuevos módulos o nodos.
Con el Análisis Predictivo
su organización tendrá
más éxito