/ Blog

Segmentierung von Kunden eines Online-Shops

FĂŒr jeden Betreiber eines Online Shops ist die Personalisierung der Inhalte und der Kampagnen von entscheidender Bedeutung, um einerseits die Anzahl der VerkĂ€ufe zu erhöhen, und andererseits das Werbebudget effektiv ein zu setzen. Aber wie definiert man, welche Inhalte und welche Werbung, fĂŒr einzelne Menschen und Gruppen von Menschen, verwendet wird?

Ein erster Ansatz ist auf Grund von gewissen Merkmalen Kundengruppen einfach fest zu legen, beispielsweise nach Region oder bisheriger Höhe der EinkĂ€ufe. Ein besserer und zukunftstrĂ€chtiger Ansatz ist, die Kundengruppen aus den Daten zu “lernen”. Dazu benötigt man eine möglichst umfassende Sammlung aller Daten, die von den Kunden vorliegen. Zur Umsetzung verwendet man eine “Customer Data Plattform”, wie zum Beispiel unser Produkt.

Sammeln der richtigen Daten

Basis fĂŒr Personalisierung ist, dass die Kunden und Besucher des Onlineshops in zusammengehörige Gruppen unterteilt werden. Die Daten fĂŒr die Bestimmungen dieser Gruppen werden mit Softwarelösungen “gesammelt”, die fĂŒr jeden Besucher aufzeichnen: welche Seiten er betrachtet hat, welche Buttons er geklickt hat, und was er gekauft hat. Diese Daten werden dann um demographische Merkmale ergĂ€nzt, und weitere Inhalte aus CRM und ERP Systemen hinzugefĂŒgt.

In einem Artikel im Magazin “Towards Data Science” habe ich unlĂ€ngst beschrieben, wie so ein Verfahren implementiert wird, und an einem Beispiel gezeigt, welche Ergebnisse eine Analyse bei einem Online-Shop mit Millionen Kunden pro Monat erreicht.

Start mit einer "Explorativen Datenanalyse"

Machine Learning, Webanalytics, Artificial Intelligence, Andreas Stöckl
Prof. (FH) Andreas Stöckl - Head of Customer Data Management

In einem ersten Schritt habe ich die Daten unter Verwendung von Visualisierungen nĂ€her erforscht, um einen Überblick und erste Erkenntnisse zu erlangen:

  • Wie viele Daten liegen in welchen ZeitrĂ€umen vor? 
  • Wie verteilen sich die Daten bezĂŒglich einzelner Merkmale?
  • Welche ZusammenhĂ€nge liegen vor?
  • etc.

So konnte nicht nur festgestellt werden, dass in der betrachteten “Case Study” ĂŒberwiegend Elektronikprodukte betrachtet und gekauft wurden, sondern zum Beispiel auch welche Marken beliebt sind.

 

Berechnung der Segmente mit einem mathematischen Verfahren

Mit den Erkenntnissen aus der Erforschungsphase, wurden anschließend, nach einer geeigneten Vorverarbeitung der Daten, mit Hilfe des Vefahrens:  “k-means Clustering”, die Segmentierung berechnet. Ein wesentlicher Schritt war dabei, die richtige Anzahl der Segmente zu bestimmen, die sich gut fĂŒr die Beschreibung der Daten eignet.

Visualisierung der Ergebnisse

Um einen Eindruck von der QualitĂ€t des Clusterings zu bekommen, wurde eine Visualisierung mit dem Verfahren Distributed Stochastic Neighbor Embedding ("tSNE") erstellt. Dies ist eine Technik zur Dimensionsreduktion von Daten und eignet sich besonders gut fĂŒr die Visualisierung hochdimensionaler DatensĂ€tze. Ein Beispiel dieser Visualisierungen findet sich am Beginn des Artikels.

Charakterisierung der Segmente

Um eine Interpretation der Segmente zu ermöglichen, wurden grafische Darstellungen erstellt, die zum Beispiel fĂŒr jedes Segment die Merkmale zum Kaufverhalten in den Produktkategorien als "Radar Chart" zeigen. Dies kann dabei helfen die Bedeutung der Segmente zu interpretieren. Zum Beispiel gibt es ein Segment das hohe Kaufanteile im Bereich "Kinder" und "Sport" hat, andere Segmente charakterisieren sich hingegen eher durch die Anzahl der Seitenansichten und Kaufsummen.

Wer sich nĂ€her mit der Umsetzung, oder den möglichen Ergebnissen anhand eines Beispiels, beschĂ€ftigen möchte, findet die Informationen dazu im Artikel im Online-Magazin “Towards Data Science”.

Jetzt fĂŒr unseren Newsletter anmelden!