PROJECT: ANALYSIS OF MARKETING STIMULI EFFECTIVENESS AT BANK PEKAO

# Python# Spark# Flask# MySQL# AWS
# SQL# Hadoop# Django# PostgreSQL# Azure
# VBA# Kafka# SQLite# GCP
# Flink# MongoDB# cloud on-premises
time: January 2011- April 2018
role: Data Scientist 
company: LAB148

Bank PeKaO was in the process of building a team of data scientists but struggled to develop a framework that would define the direction of the team’s work. I was asked to help establish a set of goals and an initial methodology that would guide the newly formed data science team. One of the main goals was to improve the efficiency of selling banking products, such as loans, credits, and deposits.

I was also tasked with developing an algorithm to improve the effectiveness of selling these products. The bank provided me with data on about 1,000 clients, which were anonymized. The data included a wide range of static information about the clients, as well as details regarding the various marketing stimuli used to attract clients to specific banking services. These stimuli included offers sent to clients, phone calls, and visits to bank branches.

PROJECT IMPLEMENTATION

Initially, I gathered all available data and combined the clients’ features with information on the marketing stimuli they had received. I also had data on the effectiveness of these actions, allowing me to assess which stimuli had the greatest impact on customer decisions.

Due to the large number of features, I was concerned about the risk of the so-called curse of dimensionality. To mitigate this, I applied the PCA (Principal Component Analysis) algorithm, which allowed me to reduce the number of variables without losing significant information. Based on the PCA results, I grouped the clients into relevant clusters. The method I applied is described in detail in one of my publications, which can be found here: Segmentation of a population containing very many features.

Despite the small sample size, clustering the clients proved to be effective. I was able to identify groups of clients who were likely to take up an offer, although they had not done so yet. I applied classification models to predict whether a client would accept an offer based on specific stimuli.

The result of my work was the creation of three customer lists:

The first list contained clients who were highly likely to accept an offer when exposed to the right stimuli.
The second list included clients who might respond positively to the offer.
The third list featured clients who were unlikely to accept the offer, regardless of the stimuli.
Working with banking data was very comfortable, as the data contained no missing values or errors, which made the analysis much easier. Despite the limited sample size, the project was successful.



PROJEKT: ANALIZA EFEKTYWNOŚCI BODŹCÓW MARKETINGOWYCH W BANKU PEKAO

Bank PeKaO był w trakcie tworzenia zespołu data scientistów, jednak miał trudności z opracowaniem koncepcji, która wyznaczałaby kierunek pracy tego zespołu. Poproszono mnie o pomoc w stworzeniu zbioru celów i wstępnej metodologii, która określałaby, jak zespół data scientistów miałby działać. Kluczowym celem było zwiększenie efektywności sprzedaży produktów bankowych takich jak kredyty, pożyczki i lokaty.

Zostałem także poproszony o stworzenie algorytmu, który poprawiłby efektywność sprzedaży tych produktów. Bank przekazał mi dane dotyczące około 1000 klientów, które były zanonimizowane. Dane zawierały szeroki zakres informacji statycznych na temat klientów oraz szczegóły dotyczące różnych bodźców marketingowych stosowanych w celu przyciągnięcia klientów do konkretnych usług banku. Bodźce obejmowały oferty wysyłane do klientów, rozmowy telefoniczne oraz wizyty w placówkach banku.

REALIZACJA PROJEKTU

Na początku zebrałem wszystkie dostępne dane i połączyłem cechy klientów z informacjami o bodźcach marketingowych, które otrzymali. Dysponowałem również danymi na temat efektywności tych działań, co pozwoliło mi ocenić, które bodźce miały największy wpływ na decyzje klientów.

Ze względu na dużą liczbę cech obawiałem się ryzyka tzw. klątwy wymiarowości, dlatego zastosowałem algorytm PCA (Analiza Składowych Głównych), który umożliwił mi zredukowanie liczby zmiennych bez utraty istotnych informacji. Na podstawie wyników PCA, przyporządkowałem klientów do odpowiednich klastrów. Metoda, którą zastosowałem, została opisana szczegółowo w jednej z moich publikacji, którą można znaleźć tutaj: Segmentation of a population containing very many features.

Pomimo małej próbki danych, podział klientów na klastry okazał się skuteczny. Udało mi się wyodrębnić grupy klientów, którzy potencjalnie mogli skorzystać z oferty, choć jeszcze tego nie zrobili. Zastosowałem modele klasyfikacyjne, które przewidywały, czy dany klient zaakceptuje ofertę pod wpływem określonego bodźca.

Wynikiem mojej pracy były trzy listy klientów:

Pierwsza lista zawierała klientów, którzy z dużym prawdopodobieństwem skorzystają z oferty pod wpływem odpowiednich bodźców.
Druga lista obejmowała klientów, którzy mogą potencjalnie zareagować pozytywnie na ofertę.
Trzecia lista zawierała klientów, którzy najprawdopodobniej nie skorzystają z oferty, bez względu na bodźce.
Praca z danymi bankowymi była wyjątkowo komfortowa, ponieważ dane te nie zawierały braków ani błędów, co znacznie ułatwiło analizę. Mimo niewielkiej liczby danych projekt zakończył się sukcesem.

1 Komentarz

  1. G᧐od day! This is kind of off topic but I need some guidance from an established blog.
    Is it very difficult to set up your ߋwn blog?
    I’m not very techincal bսt I can figure things out pretty fast.

    I’m thinking about making my own but I’m not sure where to begin. Do you have any іdeas or
    suggestions? Thanks

Komentowanie jest wyłączone.