[Skip Global Navigation]

SPSS Data Preparation™

SPSS Data Preparation Startseite

Contact SPSS SalesKontakt Demo

Effiziente Datenaufbereitung, -bereinigung und -validierung

Das Auffinden von Fehlern und Anomalien (wie z.B. Eingabefehlern oder Ausreißern) wird mit zunehmenden Datenmengen immer aufwendiger und zeitraubender. Das Zusatzmodul SPSS Data Preparation* bietet Ihnen die Möglichkeit, über Algorithmen und Regeln derartige Fehler und Anomalien schnell und automatisiert aufzufinden und zu bereinigen. SPSS Data Preparation macht den früher oft sehr aufwendigen Prozess der Konsistenzprüfung neuer (oder bestehender) Datensätze leichter standardisierbar und übertragbar.

Datenvalidierungsregeln

SPSS Data Preparation verfügt über eine Reihe an vordefinierten Gültigkeitsregeln, welche jeder Variable individuell zugewiesen werden können. Diese Regeln und Gültigkeitsbereiche (z.B. Wert für das Alter muss zwischen 18 und 65 liegen) können Sie ganz nach Ihren Bedürfnissen erweitern. Natürlich können Sie darüber hinaus auch eigene Ausschlussregeln (z.B Schwangerschaft = ’ja’ und Geschlecht = ’männlich’) formulieren. Gewinnen Sie einen besseren Überblick durch die gleichzeitige Sicht auf Verteilung, Mininum und Maximum Ihrer Analysevariablen. Alle Fälle, welche die zugewiesenen Regeln verletzen, werden automatisch markiert und können augeschlossen oder korrigiert werden. Zusammenfassende Statistiken weisen zudem detailliert aus, welcher Fall warum den Validierungstest nicht bestanden hat. Nach dem Speichern der benutzerdefinierten Regeln werden diese Bestandteil des Datenlexikons der Datei und stehen Ihnen je nach Analysebedarf auch zu einem späteren Zeitpunkt zur Verfügung.

Optimal Binning

Das seit SPSS Version 15.0 neue Optimal Binning–Verfahren unterstützt Sie darin, optimale Kategorien aus metrischen Variablen zu bilden.

Identifikation von ungewöhnlichen Fällen

Des Weiteren enthält das  Modul SPSS Data Preparation einen Algorithmus, der automatisch Anomalien, also ungewöhnliche Fälle, entdeckt. Dies geschieht nicht nur auf der Basis einzelner Variablen, sondern mit einem multivariaten Ansatz. So ist es möglich, Ausreißer zu identifizieren und diese dann aus der weiteren Analyse auszuschliessen.

* hieß bisher SPSS Data Validation