PROJECT: RECOMMENDATION SYSTEM FOR E-COMMERCE STORE

# Python# Spark# Flask# MySQL# AWS
# SQL# Hadoop# Django# PostgreSQL# Azure
# VBA# Kafka# SQLite# GCP
# Flink# MongoDB# cloud on-premises
time: March 2022 – July 2023
role: Senior Data Scientist
company: UNIVIO

INTRODUCTION
The GIP online store operates in the construction industry and is one of the largest online wholesalers in this sector. The platform had several hundred thousand registered customers, primarily companies. The store sold a full range of construction products in typical categories such as plumbing, electrical, roofing, plastering, masonry, and finishing.
The goal of the project was to increase customer spending and prevent them from switching to competitors.

PROJECT IMPLEMENTATION
Based on five years of sales records, we obtained information on how often customers purchase, how much they spend, and what types of products they buy. We also had access to passive customer data such as age, gender, location, and company size. I created multidimensional clusters, grouping customers into about 400 clusters. Then, we generated further clusters based on additional active and passive characteristics. Customers assigned to a specific cluster exhibited similar behaviors.

This clustering provided two key benefits:

– Niche benefit: Customers within the cluster behaved similarly, for instance, most bought red bags. However, 15


PROJEKT: SYSTEM REKOMENDACJI DLA SKLEPU E-COMMERCE

WPROWADZENIE
Sklep internetowy GIP działa w branży budowlanej i jest jedną z największych hurtowni internetowych w tej branży. Na platformie zarejestrowanych było kilkaset tysięcy klientów, głównie firm. Sklep oferował pełen asortyment budowlany w typowych kategoriach, takich jak hydraulika, elektryka, dekarstwo, tynkarstwo, murarstwo i wykończenia.
Celem projektu było zwiększenie wartości zakupów klientów oraz zapobieganie ich odejściu do konkurencji.

REALIZACJA PROJEKTU
Na podstawie pięcioletnich danych sprzedażowych uzyskaliśmy informacje o tym, jak często klienci kupują, ile wydają oraz jakie produkty wybierają. Mieliśmy również dostęp do danych pasywnych o klientach, takich jak wiek, płeć, miejsce zamieszkania i wielkość firmy. Stworzyłem wielowymiarowe klastry, do których zaklasyfikowaliśmy klientów, tworząc około 400 grup. Następnie tworzyliśmy kolejne klastry, bazując na dodatkowych cechach aktywnych i pasywnych. Klienci przypisani do danego klastra wykazywali podobne zachowania.

Dzięki temu przyporządkowaniu uzyskaliśmy dwie korzyści:

– Korzyść niszowa: Klienci w klastrze zachowywali się podobnie, na przykład większość kupowała czerwone worki. Jednak 15