Analysetools für Business Analytics im Test

Peter Neckel

Der Data-Mining-Softwaremarkt hat in den letzten Jahren spürbare Entwicklungssprünge gezeigt: Durch die steigende Funktionalität liegt der aktuelle Engpass in der Konzeption benutzerfreundlicher Oberflächen und der Automatisierung von Standardaufgaben. Die Stärken und Schwächen der aktuellen Tools zeigt die im Folgenden vorgestellte Studie vom BI-Analysten- und Beraterhaus mayato.

Die Anforderungen an Data-Mining-Werkzeuge haben sich in den letzten Jahren deutlich erhöht: Einerseits sollen sie eine möglichst umfassende Funktionalität bereitstellen, andererseits wird von ihnen erwartet, dass sie von stark unterschiedlichen Anwendergruppen gleichermaßen gut bedienbar sind. Immer mehr Anwender fordern zusätzlich eine hohe Automatisierung analytischer Standardaufgaben sowie eine hohe Benutzerfreundlichkeit ohne lange Einarbeitungszeiten.
Bei den Einsatzszenarien spielt in vielen Unternehmen das Customer Relationship Management (CRM) heute eine Schlüsselrolle: Hier wird entschieden, welche bestehenden Kunden in welcher Form betreut werden, welche potenziellen Kunden wie angesprochen und welche ehemaligen Kunden zurückgewonnen werden sollen. Die Beantwortung dieser Fragen ist von strategischer Bedeutung (Bild 1).
Für die Umsetzung der Basisstrategien Kundenneugewinnung, -bindung sowie -rückgewinnung sind jedoch umfangreiche Informationen über das Kundenverhalten erforderlich, die zunächst mithilfe von Datenanalysen gewonnen werden müssen.


Bild 1: Basisstrategien im Customer Relationship Management (CRM).

Testszenarioprognosemodelle im Kundenbindungsmanagement
Für die diesjährige Data Mining Studie wurde ein praxisnahes Analyseszenario aus dem Bereich Kundenreaktivierung erarbeitet: Ein großer Online-Versandhändler möchte Erstbesteller, die nach einer definierten Zeitspanne keine Folgebestellung tätigen, durch gezielte Aktionen zu einem Wiederkauf anregen. Dabei sollen nur die Kunden einen Einkaufsgutschein erhalten, bei denen mit hoher Wahrscheinlichkeit davon auszugehen ist, dass sie ohne diesen Anreiz keine Bestellung getätigt hätten.
Diese Kunden sollen auf der Basis der vorliegenden Kundenhistorie mithilfe eines Prognosemodells vorhergesagt werden.

Tools im Test & Bewertungskriterien
Die Bewertung der Tools stützt sich auf eine breite Anzahl an Einzelkriterien: Sie decken sowohl Funktionalitätsaspekte (Funktionsumfang in den Kategorien Datenvorverarbeitung, Analyseverfahren und Parametrisierung, Ergebnisvisualisierung, Gesamteffizienz) als auch die Benutzerfreundlichkeit (Stabilität, Ausführungsgeschwindigkeit, Dokumentation, Bedienung) ab.
Das Testfeld setzt sich wie folgt zusammen:

  • SAS Enterprise Miner 7.1,
  • StatSoft STATISTICA Data Miner 10,
  • IBM SPSS Modeler 14.2,
  • SAP BW 7 Data Mining Workbench.

Wie Bild 2 zeigt, stehen Data-Mining-Funktionen in stark unterschiedlichen Softwaretypen zur Verfügung: Die Palette reicht von Data-Mining-Werkzeugen für spezielle Einsatzzwecke bis hin zu Business-Intelligence (BI)-Werkzeugen.
In der Studie treten die drei marktführenden Suiten von SAS, StatSoft und IBM SPSS gegeneinander an. Da die zu analysierenden Daten in vielen Fällen in bestehenden BI-Systemen vorgehalten werden, liegt es nahe, in dieser Umgebung auch die eigentlichen Data-Mining-Analysen durchzuführen. Um zu beurteilen, wie sich ein klassisches BI-Werkzeug im Vergleich zu den etablierten Data-Mining-Suiten schlägt, wurde die SAP BW Data Mining Workbench ins Testfeld aufgenommen.

Ergebnisse des Praxistests
Im Praxistest zeigt sich, dass die drei etablierten Data-Mining-Suiten einen gleichermaßen hohen Reifegrad erreicht haben. Allerdings führen die durchweg hohe Funktionsmächtigkeit und die vielfältigen Parametrisierungsmöglichkeiten der Suiten zu vergleichsweise langen Einarbeitungszeiten. Es wird zudem immer schwieriger, ein Bedienkonzept für alle Anwendergruppen bereit zu stellen.
Diesbezüglich gibt es signifikante Unterschiede zwischen den Tools: Die Stärke von SAS liegt hier in der Einbettung des Enterprise Miner in eine leistungsfähige BI-Gesamtarchitektur, die neben der Analyse flexible Möglichkeiten der Datenhaltung oder weitreichende ETL-Funktionen bietet. Für Nutzer, die weitere Werkzeuge der SAS Plattform verwenden (z.B. den Enterprise Guide oder das Data Integration Studio), ergibt sich jedoch kein Vorteil, da jedes Tool ein unterschiedliches Bedienkonzept aufweist.
IBM SPSS ist es gelungen, hohe Funktionalität in eine moderne, intuitiv bedienbare Oberfläche zu verpacken: Der Modeler bietet insgesamt die beste Ergonomie und eine sehr gute –als Einzige im Testfeld in Deutsch verfügbare –Dokumentation, die den Einstieg erleichtert.
StatSof’s besondere Stärke liegt darin, dass der Data Miner –zusätzlich zu den umfangreichen Data-Mining-Funktionen –stets die volle Funktionalität des Statistikpakets enthält, was z.B. mächtige Datenvorverarbeitungsfunktionen, statistische Testverfahren sowie eine große Anzahl an frei konfigurierbaren Grafiken einschließt. Dadurch bietet STATISTICA das beste Preis-Leistungs-Verhältnis im Testfeld.

Vor allem an der wenig ergonomischen Oberfläche merkt man der SAP Data Mining Workbench an, dass sie seit mehreren Jahren keine substanziellen Aktualisierungen erfahren hat: Der in der Praxis oft notwendige Wechsel zwischen dem Analyseprozessdesigner und der Data Mining Workbench kostet Zeit und ist aus Nutzersicht nicht nachvollziehbar. Zudem sind die Data-Mining-Funktionen in ihrem Umfang stark begrenzt. Insgesamt reiht sich SAP daher am Ende des Testfeldes ein.

Fazit: Zunehmende Automatisierung des Data Mining Prozesses
Mit der Steigerung der Einsatzhäufigkeit von Data Mining stellt sich zunehmend die Frage nach der Effizienz des gesamten Analyseprozesses: In welchem Verhältnis steht der Zeitaufwand zum betriebswirtschaftlichen Nutzen der Analyseergebnisse? Dies geben letztlich die verwendeten Data-Mining-Werkzeuge durch Funktionsumfang, Bedienkomfort und vor allem durch ihren Automatisierungsgrad vor.
Die Toolhersteller haben dies erkannt: SAS bietet mit dem Rapid Predictive Modeler eine (in der aktuellen Version nochmals überarbeitete) Data-Mining-Umgebung mit sinnvoll begrenzten Parametrisierungsoptionen an. Hier konnten im Test bereits mit den Standardparametern akzeptable Ergebnisse erzielt werden, die auf Wunsch manuell weiter verfeinert werden können. StatSoft liefert alternativ vorgefertigte Data-Mining-Rezepte für Standardaufgaben, IBM SPSS stellt u.a. einen automatischen Klassifizierer zur Verfügung, der mehrere Prognosemodelle automatisch berechnen und vergleichen kann.
Zusammenfassend lässt sich festhalten: Die Toolhersteller sind merklich bemüht, den Anwendern den Einstieg in Data-Mining-Analysen so weit wie möglich zu erleichtern. Die Weiterentwicklungen und Differenzierungen der Bedienkonzepte, ausführliche Dokumentationen inklusive Online-Hilfen und Tutorials sowie neue Ansätze zur Automatisierung des Data-Mining-Prozesses tragen maßgeblich zu dieser Entwicklung bei.    

Das könnte Sie interessieren

Buchtipp:Wettbewerbsfaktor Analytics - Status, Potenziale, Herausforderung
Gronau, Norbert; Weber, Nadja; Jähnchen, Marie; 2012 

Schlüsselwörter:

Data Mining, Datenanalyse, Business Intelligence