PROJECT: RECOMMENDATION SYSTEM FOR E-COMMERCE STORE

# Python# Spark# Flask# MySQL# AWS
# SQL# Hadoop# Django# PostgreSQL# Azure
# VBA# Kafka# SQLite# GCP
# Flink# MongoDB# cloud on-premises
time: March 2022 – July 2023
role: Senior Data Scientist
company: UNIVIO

INTRODUCTION
The GIP online store operates in the construction industry and is one of the largest online wholesalers in this sector. The platform had several hundred thousand registered customers, primarily companies. The store sold a full range of construction products in typical categories such as plumbing, electrical, roofing, plastering, masonry, and finishing.
The goal of the project was to increase customer spending and prevent them from switching to competitors.

PROJECT IMPLEMENTATION
Based on five years of sales records, we obtained information on how often customers purchase, how much they spend, and what types of products they buy. We also had access to passive customer data such as age, gender, location, and company size. I created multidimensional clusters, grouping customers into about 400 clusters. Then, we generated further clusters based on additional active and passive characteristics. Customers assigned to a specific cluster exhibited similar behaviors.

This clustering provided two key benefits:

– Niche benefit: Customers within the cluster behaved similarly, for instance, most bought red bags. However, 15% of the customers, despite similar behavior, did not buy red bags. This insight allowed us to easily target these customers and encourage them to buy, thereby increasing revenue.
– Pair recommendation benefit: I noticed that customers within a cluster often purchased products in pairs. Based on this, we could remind customers on the website to buy the second product if they had already purchased the first one. Additionally, we identified niche customers who always bought the first product but never the second, even though other customers in the cluster purchased both products.


PROJEKT: SYSTEM REKOMENDACJI DLA SKLEPU E-COMMERCE

WPROWADZENIE
Sklep internetowy GIP działa w branży budowlanej i jest jedną z największych hurtowni internetowych w tej branży. Na platformie zarejestrowanych było kilkaset tysięcy klientów, głównie firm. Sklep oferował pełen asortyment budowlany w typowych kategoriach, takich jak hydraulika, elektryka, dekarstwo, tynkarstwo, murarstwo i wykończenia.
Celem projektu było zwiększenie wartości zakupów klientów oraz zapobieganie ich odejściu do konkurencji.

REALIZACJA PROJEKTU
Na podstawie pięcioletnich danych sprzedażowych uzyskaliśmy informacje o tym, jak często klienci kupują, ile wydają oraz jakie produkty wybierają. Mieliśmy również dostęp do danych pasywnych o klientach, takich jak wiek, płeć, miejsce zamieszkania i wielkość firmy. Stworzyłem wielowymiarowe klastry, do których zaklasyfikowaliśmy klientów, tworząc około 400 grup. Następnie tworzyliśmy kolejne klastry, bazując na dodatkowych cechach aktywnych i pasywnych. Klienci przypisani do danego klastra wykazywali podobne zachowania.

Dzięki temu przyporządkowaniu uzyskaliśmy dwie korzyści:

– Korzyść niszowa: Klienci w klastrze zachowywali się podobnie, na przykład większość kupowała czerwone worki. Jednak 15% klientów, mimo podobnych zachowań, nie kupowało czerwonych worków. Ta informacja pozwalała łatwo skierować do tych klientów oferty i zachęcić ich do zakupu, zwiększając tym samym przychody.
– Korzyść par rekomendacji: Zauważyłem, że klienci w jednym klastrze często kupują produkty w parach. Na tej podstawie mogliśmy przypominać klientom na stronie internetowej o dokupieniu drugiego produktu, jeśli kupili pierwszy. Dodatkowo identyfikowaliśmy klientów, którzy zawsze kupowali pierwszy produkt z pary, ale nigdy nie kupowali drugiego, mimo że pozostali klienci w klastrze nabywali oba produkty.