Segmentierung von Kunden eines
Online-Shops

Für jeden Betreiber eines Online Shops ist die Personalisierung der Inhalte und der Kampagnen von entscheidender Bedeutung, um einerseits die Anzahl der Verkäufe zu erhöhen, und andererseits das Werbebudget effektiv ein zu setzen. Aber wie definiert man, welche Inhalte und welche Werbung, für einzelne Menschen und Gruppen von Menschen, verwendet wird?

Ein erster Ansatz ist auf Grund von gewissen Merkmalen Kundengruppen einfach fest zu legen, beispielsweise nach Region oder bisheriger Höhe der Einkäufe. Ein besserer und zukunftsträchtiger Ansatz ist, die Kundengruppen aus den Daten zu “lernen”. Dazu benötigt man eine möglichst umfassende Sammlung aller Daten, die von den Kunden vorliegen. Zur Umsetzung verwendet man eine “Customer Data Platform”, wie zum Beispiel unser Produkt.

Sammeln der richtigen Daten

Basis für Personalisierung ist, dass die Kunden und Besucher des Onlineshops in zusammengehörige Gruppen unterteilt werden. Die Daten für die Bestimmungen dieser Gruppen werden mit Softwarelösungen “gesammelt”, die für jeden Besucher aufzeichnen: welche Seiten er betrachtet hat, welche Buttons er geklickt hat, und was er gekauft hat. Diese Daten werden dann um demographische Merkmale ergänzt, und weitere Inhalte aus CRM und ERP Systemen hinzugefügt.

In einem Artikel im Magazin “Towards Data Science” habe ich unlängst beschrieben, wie so ein Verfahren implementiert wird, und an einem Beispiel gezeigt, welche Ergebnisse eine Analyse bei einem Online-Shop mit Millionen Kunden pro Monat erreicht.

Start mit einer "Explorativen Datenanalyse"

In einem ersten Schritt habe ich die Daten unter Verwendung von Visualisierungen näher erforscht, um einen Überblick und erste Erkenntnisse zu erlangen:

  • Wie viele Daten liegen in welchen Zeiträumen vor?
  • Wie verteilen sich die Daten bezüglich einzelner Merkmale?
  • Welche Zusammenhänge liegen vor?
  • etc.

So konnte nicht nur festgestellt werden, dass in der betrachteten “Case Study” überwiegend Elektronikprodukte betrachtet und gekauft wurden, sondern zum Beispiel auch welche Marken beliebt sind.

Berechnung der Segmente mit einem mathematischen Verfahren

Mit den Erkenntnissen aus der Erforschungsphase, wurden anschließend, nach einer geeigneten Vorverarbeitung der Daten, mit Hilfe des Vefahrens: “k-means Clustering”, die Segmentierung berechnet. Ein wesentlicher Schritt war dabei, die richtige Anzahl der Segmente zu bestimmen, die sich gut für die Beschreibung der Daten eignet.

Visualisierung der Ergebnisse

Um einen Eindruck von der Qualität des Clusterings zu bekommen, wurde eine Visualisierung mit dem Verfahren Distributed Stochastic Neighbor Embedding (“tSNE") erstellt. Dies ist eine Technik zur Dimensionsreduktion von Daten und eignet sich besonders gut für die Visualisierung hochdimensionaler Datensätze. Ein Beispiel dieser Visualisierungen findet sich am Beginn des Artikels.

Charakterisierung der Segmente

Um eine Interpretation der Segmente zu ermöglichen, wurden grafische Darstellungen erstellt, die zum Beispiel für jedes Segment die Merkmale zum Kaufverhalten in den Produktkategorien als “Radar Chart" zeigen. Dies kann dabei helfen die Bedeutung der Segmente zu interpretieren. Zum Beispiel gibt es ein Segment das hohe Kaufanteile im Bereich “Kinder" und “Sport" hat, andere Segmente charakterisieren sich hingegen eher durch die Anzahl der Seitenansichten und Kaufsummen.

Wer sich näher mit der Umsetzung, oder den möglichen Ergebnissen anhand eines Beispiels, beschäftigen möchte, findet die Informationen dazu im Artikel im Online-Magazin “Towards Data Science”.