[Skip Global Navigation]

Events

Events Startseite

Die Q&As unseres Webinars „Clementine - Muster und Trends mit Data Mining entdecken“ vom 18.03.2008

Q: Data Mining bezieht sich ja meistens auf sehr große Datenmengen. Wie effizient bzw. performant ist Clementine an der Stelle? Bzw. welche Erfahrungen haben Sie mit 'großen' Datenmengen gemacht?
A: Bei großen Datenmengen verfügt Clementine über eine Server-Komponente, die extrem performant mit den verfügbaren Daten umgehen kann und auch die spezielle Möglichkeiten der Zusammenarbeit mit der Datenbank verfügt. Clementine kann dynamisch SQL für Analysen und erstellte Modelle generieren und dies von der Datenbank verarbeiten lassen. Ferner kann Clementine auch als Frontend für DataMining-Komponenten von Datenbankanbietern wie Oracle, Microsoft oder IBM genutzt werden.

Q: Wir setzen ein Marketing Datawarehouse auf Oracle Basis ein. Welche Komponenten benötige ich zum Einsatz von Clementine.
A: Der Zugriff auf das Orcale Datawarehouse erfolgt bei SPSS Clementine durch einem optimierten ODBC-Treiber, der im Lieferungfang von SPSS Clementine enthalten ist. Die Anforderungen an die Hardware finden Sie auf unserer Homepage unter: www.spss.com/clementine/system_req.htm

Q: Kann ich mit Clementine 12.0 direkt auf unsere Windows Server 2003 zugreifen?
A: Selbstverständlich können Sie mit SPSS Clementine 12.0 sowohl auf Filesysteme als auch auf Datenbanken zugreifen, die auf einem Windows Server 2003 liegen.

Q: Gibt es automatische Anfragen um Datendubletten (die ÄHNLICH nicht etwa GLEICH sind) zu finden ?
A: Hierfür wären eventuell Clusterverfahren geeigent, man muß jedoch mit vielen Clustern arbeiten, um eine vernünftige Filterung zu bekommen.

Q: Wie viele Kundendatensätze brauche ich mindestens, um Kündigerwahrscheinlichkeiten zu berechnen? Gibt es Variablen (über Kunden, Produkte...), die zwingend vorliegen sollten? Haben Sie die Möglichkeit, Beispieldaten zur Verfügung zu stellen, die die Anforderungen erfüllen?
A: Dies hängt von der Komplexität der Zusammenhänge und der Eindeutigkeit der "Strukturen in den Daten" ab. In Normalfall sind entsprechende Analysen ab einigen hundert Kundendatensätzen möglich.

Die zu verwendenden Attribute sind von der jeweiligen Fragestellung abhängig. Bei der Auswahl der Informationen sollten alle relevanten Bereiche für die Fragestellung abgedeckt sein. Dies bedeutet im Normalfall, dass neben Kundenstammdaten auch Bewegungs- oder Transaktionsdaten für die Analyse herangezogen werden. Gerade an diesen Informationen lassen sich häufig schon Trends für ein gewisses Verhalten in Vorfeld erkennen.
Grundsätzlich gilt auch hier: Je mehr Informationen verfügbar sind, desto besser sind die Aussichten ein gutes und valides Vorhersagemodell entwickeln zu können.

Für verschiedene Fragestellungen gibt es auch Demo-Datensätze. Diese decken jedoch bei weitem nicht die Anforderungen aus der Praxis ab.

In einem Projekt wird von Fall zu Fall entschieden welche Informationen für die Analyse relevant sind. Auch innerhalb der gleichen Branche schwanken diese Anforderungen oft ganz erheblich, da jede Organisation andere Rahmenbedingungen aufweist.
Bei der Durchführung von Projekten orientieren wir uns an dem weltweiten Prozeßstandard CRISP-DM. Mehr dazu finden Sie unter www.crisp-dm.org

Wünschen Sie weitere Informationen zu Clementine oder interessieren Sie sich dafür, welche Fragestellungen konkret in Ihrer Organisation mit Data Mining gelöst werden können? Wenden Sie sich einfach an unsere Mitarbeiter, erreichbar unter Telefon 089 - 48 90 74 - 0  oder eMail  sales@spss.de