Grundlagen des Data Mining

Methoden und Verfahren im Überblick


Grundlagen des Data Mining
Beim Data Mining geht es darum in vorhandenen Datenmengen für das Unternehmen selbst oder durchzuführende Marketingmaßnahmen relevante Daten zu entdecken, zu verifizieren und für die weitere Verwendung zu exportieren. Die zu verarbeitende Datenmenge in Unternehmen wächst durch die verschiedenen unterschiedlichen Kommunikationskanäle und Systeme stetig an. Mit Hilfe von Data Mining können so zum Beispiel die Daten aus stationärem Kassensystem, Website, Online Shop und Kundenbetreuung durchsucht und analysiert werden.  Die wichtigsten Methoden und Verfahren werden nun kurz dargestellt.

Ausreißererkennung

In Datenbeständen sind immer wieder Datensätze vorhanden, die inkonsistent zum Rest der Daten sind und ungewöhnlich hohe oder niedrige Werte (Extreme) aufweisen oder vom allgemeinen Trend abweichen. Diese Datensätze werden markiert und müssen anschließend manuell verifiziert und gegebenenfalls ausgeblendet werden, da sie die Ergebnisse anderer Analysen und Verfahren deutlich verschlechtern würden. Bei bestimmten Identifizierungsverfahren, z.B. Betrugserkennung, sind gerade die Ausreißer die interessanten Datensätze.

Clusteranalyse

Bei der Clusteranalyse wird der Datenbestand nach möglichen zusammengehörigen Gruppen auf Grund von Ähnlichkeitsstrukturen untersucht. Hierbei wird in den Datensätzen nach Attributgruppen gesucht, die sich ähnlicher sind als andere Gruppen. Die identifizierten Gruppen stellen oft Häufungen (Cluster) im Datenraum dar, die für das Verfahren namensgebend sind.

Klassifizierung

Das Verfahren zur Klassifizierung ist weitgehend identisch mit dem der Clusteranalyse, auch hier werden Datensätze Gruppen zugeordnet. Der entscheidende Unterschied: Der Datenbestand wird nach vorgegeben Attributen (Klassen) durchsucht (z.B. weiblich, männlich, Auto, Fahrrad) und daraus Gruppen gebildet. Durch Ähnlichkeitsalgorithmen und Abgleich mit vordefinierten Klassen können auch bisher nicht zugeordnete Datensätze zu Klassen hinzugefügt werden (z.B. Mountainbike > Fahrrad).

Assoziationsanalyse

Die Suche nach häufigen Zusammenhängen und meist die Aufstellung einer Schlussfolgerung ist die Aufgabe der Assoziationsanalyse. Vor allem im Handel bei der Warenkorbanalyse, im Bankwesen bei der Anlageverfahrensanalyse und im Versicherungswesen bei der Erkennung von Zusammenhängen zwischen dem Abschluß von Verträgen und dem Eintritt eines Schadensfalls kommt dieses Verfahren zum Einsatz. Der Assoziationsanalyse liegt in der Regel eine WENN-DANN-Struktur zu Grunde.

Ein Beispiel: Wenn ein Mann im Supermarkt Chips in den Einkaufswagen legt, dann nimmt er in 30% der Fälle auch noch Bier mit.  Daraus lässt sich dann beispielhaft folgende Handlungsanweisung erstellen: Für die Dauer von großen Fussballturnieren soll neben den Chips eine Palette Bier aufgestellt werden.

Regressionsanalyse

Die Aufgabe der Regressionsanalyse ist es im Datenbestand die Zusammenhänge zwischen unterschiedlichen Attributen zu finden. Sie eignet sich einerseits sehr gut dafür Zusammenhänge zu beschreiben und zu erklären, andererseits besitzt sie auch für die Durchführung von Prognosen eine große Bedeutung. Sie kommt in der Regel dann zur Anwendung, wenn Wirkungsbeziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen untersucht werden sollen.

Ein Beispiel: Ein Autohändler möchte herausfinden welche Maßnahmen ergriffen werden müssen, damit das neue Mittelklassenmodell im nächsten Jahr gut verkauft wird. Dazu betrachtet der den Umsatz (abhängige Variable) des aktuellen Modells im aktuellen Jahr von den Faktoren durchschnittlicher Verkaufspreis und durchschnittlicher Finanzierungszins (unabhängige Variablen).  Es stellt sich heraus, dass der Verkaufspreis den Absatz viel deutlicher beinflusst als der Finanzierungszins. Bei einer Senkung des Verkaufspreises für einen bestimmten Zeitraum stieg der Umsatz signifikant an, während bei einer Senkung des Finanzierungszins bei gleichbleibendem Verkaufspreis keine Umsatzsteigerung festgestellt werden konnte. 

Zusammenfassung der Daten

Die wichtigste Aufgabe des Data Mining ist es durch die Anwendung einzelner oder mehrerer vorher genannter Verfahren auf Ihre Datenbestände handhabbare und verwendbare Datenmengen für den jeweiligen Einsatz zu bilden. Neben strategischen Einsätzen wie zum Beispiel Kundenbeziehungsmanagement (CRM), Marketingstrategie und Sortimentsentwicklung können dies auch ganz konkrete Maßnahmen wie Mailings oder stationäre Verkaufsaktionen sein.

Wir sind Teilnehmer bei:
Wir sind Partner von:
Wir sind Berater bei:
Wir hosten bei:
Wir hosten bei:

Haben wir Ihr Interesse geweckt? Kontaktieren Sie uns jetzt.

info@direktmarketingtool.de
+49 (0) 941 8 90 50 40