Contact
Le data mining :
Modélisation et prédiction
Objectifs :
Appréhender les principaux contextes d’utilisation des
algorithmes de Clementine.
Connaître les options experts de chacun d’entre eux.
Module nécessaire
Clementine
Durée :
2 jours
Pré-requis :
Le data mining avec Clementine : Préparation d'un fichier et exploration
Contenu :
- Préparation des données pour la Modélisation
Nettoyage des données
Équilibrage des données
Transformation des données numériques
Transformation des Booléens en nombres
- Réseaux de neurones pour la Segmentation
Méthodes d'apprentissage
Perceptron multicouches
Fonction radiale de base
Algorithmes disponibles
Quelle méthode choisir ?
Analyse de sensibilité
- Induction de règles avancée
Réalisation de modèles de sorties symboliques avec le noeud
C&RT
Réalisation de modèles de sorties symboliques avec le noeud
C5.0
Critère de sélection du taux d'accroissement
Utilisation du noeud C&RT pour prédire des champs numériques
- Techniques de Régression
Régression linaire ; Régression logistique
- Techniques de Classification
Quels éléments observer lors de la classification ?
Le noeud Kmeans
Le noeud Kohonen
Le noeud TwoSteps
Utilisation conjointe avec l’analyse factorielle.
- Règles d'association avancées
Règles d'association
Découverte de règles avec Apriori
Induction de règles généralisée (GRI)
Options expert d'Apriori
Options expert de GRI
Choix d'une méthode et d'options expert - CAPRI.
- Tirer le maximum des modèles
Modification des valeurs de confiance pour le scoring
Modélisation meta niveaux
Modélisation des erreurs
Évaluation des modèles