Q: Data Mining bezieht sich ja meistens auf sehr große Datenmengen.
Wie effizient bzw. performant ist Clementine an der Stelle? Bzw. welche Erfahrungen
haben Sie mit 'großen' Datenmengen gemacht?
A: Bei großen Datenmengen verfügt Clementine über eine Server-Komponente,
die extrem performant mit den verfügbaren Daten umgehen kann und auch
die spezielle Möglichkeiten der Zusammenarbeit mit der Datenbank verfügt.
Clementine kann dynamisch SQL für Analysen und erstellte Modelle generieren
und dies von der Datenbank verarbeiten lassen. Ferner kann Clementine auch
als Frontend für DataMining-Komponenten von Datenbankanbietern wie Oracle,
Microsoft oder IBM genutzt werden.
Q: Wir setzen ein Marketing Datawarehouse auf Oracle
Basis ein. Welche Komponenten benötige ich zum Einsatz von Clementine.
A: Der Zugriff auf das Orcale Datawarehouse erfolgt bei SPSS Clementine durch
einem optimierten ODBC-Treiber, der im Lieferungfang von SPSS Clementine
enthalten ist. Die Anforderungen an die Hardware finden Sie auf unserer Homepage
unter: www.spss.com/clementine/system_req.htm
Q: Kann ich mit Clementine 12.0 direkt auf unsere Windows Server 2003 zugreifen?
A: Selbstverständlich können Sie mit SPSS Clementine 12.0 sowohl
auf Filesysteme als auch auf Datenbanken zugreifen, die auf einem Windows
Server 2003 liegen.
Q: Gibt es automatische Anfragen um Datendubletten (die ÄHNLICH
nicht etwa GLEICH sind) zu finden ?
A: Hierfür wären eventuell Clusterverfahren geeigent, man muß jedoch
mit vielen Clustern arbeiten, um eine vernünftige Filterung zu bekommen.
Q: Wie viele Kundendatensätze brauche ich mindestens, um Kündigerwahrscheinlichkeiten
zu berechnen? Gibt es Variablen (über Kunden, Produkte...), die zwingend
vorliegen sollten? Haben Sie die Möglichkeit, Beispieldaten zur Verfügung
zu stellen, die die Anforderungen erfüllen?
A: Dies hängt von der Komplexität der Zusammenhänge und der
Eindeutigkeit der "Strukturen in den Daten" ab. In Normalfall sind
entsprechende Analysen ab einigen hundert Kundendatensätzen möglich.
Die zu verwendenden Attribute sind von der jeweiligen Fragestellung
abhängig.
Bei der Auswahl der Informationen sollten alle relevanten Bereiche für
die Fragestellung abgedeckt sein. Dies bedeutet im Normalfall, dass neben
Kundenstammdaten auch Bewegungs- oder Transaktionsdaten für die Analyse
herangezogen werden. Gerade an diesen Informationen lassen sich häufig
schon Trends für ein gewisses Verhalten in Vorfeld erkennen.
Grundsätzlich gilt auch hier: Je mehr Informationen verfügbar sind,
desto besser sind die Aussichten ein gutes und valides Vorhersagemodell entwickeln
zu können.
Für verschiedene Fragestellungen gibt es auch Demo-Datensätze. Diese decken jedoch bei weitem nicht die Anforderungen aus der Praxis ab.
In einem Projekt wird von Fall zu Fall entschieden welche Informationen für
die Analyse relevant sind. Auch innerhalb der gleichen Branche schwanken
diese Anforderungen oft ganz erheblich, da jede Organisation andere Rahmenbedingungen
aufweist.
Bei der Durchführung von Projekten orientieren wir uns an dem weltweiten
Prozeßstandard CRISP-DM. Mehr dazu finden Sie unter www.crisp-dm.org
Wünschen Sie weitere Informationen zu Clementine oder interessieren Sie sich dafür, welche Fragestellungen konkret in Ihrer Organisation mit Data Mining gelöst werden können? Wenden Sie sich einfach an unsere Mitarbeiter, erreichbar unter Telefon 089 - 48 90 74 - 0 oder eMail sales@spss.de
Predictive Analytics
kann Ihre Organisation noch
erfolgreicher machen
Ressourcen